Power Query 抓取股票资金流向数据

Power Query网络抓取都有三个步骤：

网站分析
定义抓取函数
抓取

网站分析

网站分析过程，就是找出网址变化规律，数据结构的过程，通常情况下，我们抓取多页的数据时，有两种情况：

页码结构：规律的页码变化，数字页码
目录结构：源码中是url列表的形式

当然也有两种结构混合的情况，既有页码，也有目录。

数据的情况基本上有三种：

文本：从网页源码中找到我们需要的文本数据
Table：从网页结构中直接找到需要的数据表格
JSON：返回的是查询结果，一个JSON数据集

无论哪种情况都需要从谷歌浏览器的检查中找到答案。

这个网站的数据，是每页50条，一共72页：这是一个标准的页码结构

我们截图的是第二页的内容：

通过谷歌浏览器来检查真正的网址：

中间有页码2，应该是可以抓取的类型，多观察几页，如果几页的内容只有这个页码变化，那么这个数据抓取就没什么问题了：这是第3页

我们还要观察一下，返回的数据：这是一个标准的JSON数据结构

应该是JSON格式的数据，对于Power Query来说，数据的开头有多出来的字符：

Power Query的JSON解析只认{}包裹的数据，所以我们在抓取的时候就要清理好。

定义抓取函数

定义抓取函数的过程通常两步：

实际抓取：实现一次单个页面抓取过程，尽可能的通用化操作，避免后期出错
定义函数：通过实际抓取创建函数，通常要修改参数，参数一般是页码或者是URL

一、实际抓取：

1、复制URL：从检查结果中复制URL

2、从web获取数据：

粘贴我们复制的URL，开始操作

这时候就可以开始数据整理，用等号分割，就直接把JSON数据独立出来，后面的数据类型检测选整个数据集。

3、JSON解析：

如我们预期，直接得到解析的结果：

4、展开数据并整理：

这个过程都很简单，要注意的是替换数据中的短划线，如果不替换在数据类型转换时就会出错，还有就是列的重命名，这个是有点麻烦，不过相对与几千行的数据来说，几列的名称手工输入也就不算啥了。

5、定义函数：

在这个查询的基础上右键创建函数：

输入一个名称继续，高级编辑器中添加页码作为参数：

添加后的结果：

抓取

1、准备页码列表：

创建一个页码列表，并转换成文本格式

2、引用函数抓取数据：

3、展开数据并整理：

4、加载数据：

这样整个数据抓取的过程就结束了：

我们简单的做个图表看看：

展开阅读全文

页面更新：2024-05-22

标签：数据数据结构流向页码数据类型函数源码规律文本定义资金参数过程结构情况股票列表科技网站

1 2 3 4 5

Power Query 中公式运算函数Expression.Evaluate的用法

我们在Excel中遇到存储在单元格中的公式，想要知道公式的运算结果，我们讲过两种方法：分列法：加等号分列自动运算EVALUATE：宏表函数进行计算https://www.toutiao.com/i6671881263843901955/对于Expression.Evaluate函数也做

Excel使用“e年m月”来整理小数点分割的日期

有的人录入日期时喜欢用小数点做分割，类似这样的“19.03.01”，这是一个不好的习惯，因为这种方法输入的日期不会被Excel识别为日期，只能当作是文本，如果涉及日期相关的计算时，就需要把这个日期给转换成Excel承认的日期格式：20

Power Query表内数据的直接引用

在Power Query中表中的数据可以直接引用，我们通常的操作习惯是通过筛选找出我们需要的数据，需要使用Table.SelectRows这样的函数来查找内容，今天我们来学习直接引用数据的方法：好像在Excel表格中一样，单元格地址引用在Powe

Power Query抓取农历数据，我们来统计一下七夕情人节的次数

今天是七夕，牛郎会织女，从1900年到2100年一共有208个七夕，其中有8个是闰七月的，像今天这样在8月7日过七夕的一共有6次，下一次8月7日七夕在2038年。日期的公立与农历之间的转换很麻烦，农历数据可以从网络抓取：香港天文台提供

Power Query关于自定义函数的相关

Power Query中自定义函数大致分成三类：过程中函数：数据处理过程中定义的函数，非独立函数，没有let in过程独立函数：单独定义的函数，有let in过程由过程创建的函数：有处理的过程创建函数，通常有两套的let In过程过程中函数：在循

阿里云有多牛？跻身世界前三IBM错失云计算窗口

SpaseX为啥这么厉害？你知道吗？

当然了，如果没有马斯克组建的团队体现出的技术潜力，NASA也不可能给Spase投资。这个团队不可能是马斯克从零开始培训出来的，基本上都是从NASA离开的技术人员。如今龙飞船终于载人上天了，这个飞船也是NASA投资的项目。人才

25岁家乐福迎大考，电商助农显企业担当

疫情期间，农产品滞销问题一直都牵动着很多人的心。今年是国家全面建成小康社会的决胜期，农业发展农村经济是重中之重，为响应国家的脱贫攻坚战略和乡村振兴战略，越来越多的企业都站出来承担起了自己的社会责任，家乐福也不例

把音乐收割，用听觉找快乐？原来AI也能做到

月初的时候，和Dr.chris一起喝茶，中间聊到AI在语音识别领域的发展。基于机器学习技术的人工智能，现在已经可以准确“听懂”世界上每一种主流语言，甚至包括中国流行的方言，什么温州话、广东话、闽南话balabala……更为强大的

明星天团亮相苏宁617超级买手直播间，化身“明星同款”打造师

随着618终极狂欢的进一步临近，苏宁易购官微于6月15日再次发布重磅消息，宣布将打造7小时超长待机“超级买手直播间”，邀请众多明星组成直播天团，良心荐物，带来超低价商品和优质服务！在这场与东方卫视共同打造的国内首档电商

TWS耳机新锐品牌GOIN，天声出位

目前国内的耳机市场两极分化，上层被高售价的进口大牌“统治”，下层被廉价劣质山寨霸凌，高品质中等价位的品牌的出现对消费者来说是一件好事，GOIN耳机新锐品牌凭借出色的音质和稳定强劲的续航，值得入手！GOIN系列无线蓝牙立体

Lamphone：隔窗看吊灯，我就知道你在干嘛

这是什么黑科技？一台望远镜，对准窗子里的吊灯，你在屋里发出的声音，就被听光了？！这不是耸人听闻，而是来自以色列内盖夫本古里安大学和魏兹曼科学研究所的最新研究。这一新的远程窃听技术，名为Lamphone。任何人，只要拥有一台笔

电商平台：万达，百度，腾讯三家

2012年，王健林与马云立下了亿元赌局，王健林称，“到2022年，如果电商在中国零售市场份额占到50%，我给马云一个亿。如果没到，他还我一个亿”。8年后的今天，王健林再次谈起这个赌局称已是笑话，单纯的互联网公司都会死亡，需要线上与

微信新增的功能，和支付宝相比究竟谁好？

提起来现在人们生活中最离不开的两个软件，大概就是微信和支付宝，大到奢侈品专营店小到街边小贩，几乎人人都在使用支付宝或者微信收款，当然，这两者也是在暗暗的较劲。尤其在今年，疫情期间阿里巴巴先腾讯一步推出了疫情防控机

让孩子爱上刷牙罗曼K6X&熊出没联名款儿童电动牙刷体验

近年来儿童口腔疾病患病率越来越高，有些小朋友不喜欢刷牙,出现蛀牙、黄牙等口腔问题，为了让更多小朋友喜欢刷牙、享受刷牙的乐趣，拥有一口健康的牙齿，一个开心的童年，罗曼电动牙刷携手熊出没推出联名款儿童电动牙刷，让小朋

上滑加载更多 ↓

Power Query 抓取股票资金流向数据

网站分析

定义抓取函数

抓取

Power Query 中公式运算函数Expression.Evaluate的用法

Excel使用“e年m月”来整理小数点分割的日期

Power Query表内数据的直接引用

Power Query抓取农历数据，我们来统计一下七夕情人节的次数

Power Query关于自定义函数的相关

阿里云有多牛？跻身世界前三IBM错失云计算窗口

SpaseX为啥这么厉害？你知道吗？

25岁家乐福迎大考，电商助农显企业担当

把音乐收割，用听觉找快乐？原来AI也能做到

明星天团亮相苏宁617超级买手直播间，化身“明星同款”打造师

TWS耳机新锐品牌GOIN，天声出位

Lamphone：隔窗看吊灯，我就知道你在干嘛

电商平台：万达，百度，腾讯三家

微信新增的功能，和支付宝相比究竟谁好？

让孩子爱上刷牙罗曼K6X&熊出没联名款儿童电动牙刷体验

Power Query 中公式运算函数Expression.Evaluate的用

Power Query表内数据的直接引用

Power Query抓取农历数据，我们来统计一下七夕情人节的

Power Query关于自定义函数的相关

真无线降噪黑科技，GoinPods三代真无线蓝牙耳机评测

Power Query 函数List.Generate简介

Power Query 如何从列表中随机抽取数据？

Power Query 网页数据解码

Power Query 通过参数来管理数据源

Power BI 视觉对象Sand Dance：沙舞，数据沙盘