Power Query 抓取股票资金流向数据

Power Query网络抓取都有三个步骤:

网站分析

网站分析过程,就是找出网址变化规律,数据结构的过程,通常情况下,我们抓取多页的数据时,有两种情况:

当然也有两种结构混合的情况,既有页码,也有目录。

数据的情况基本上有三种:

无论哪种情况都需要从谷歌浏览器的检查中找到答案。

这个网站的数据,是每页50条,一共72页:这是一个标准的页码结构

Power Query 抓取股票资金流向数据

我们截图的是第二页的内容:

Power Query 抓取股票资金流向数据

通过谷歌浏览器来检查真正的网址:

Power Query 抓取股票资金流向数据

中间有页码2,应该是可以抓取的类型,多观察几页,如果几页的内容只有这个页码变化,那么这个数据抓取就没什么问题了:这是第3页

Power Query 抓取股票资金流向数据

我们还要观察一下,返回的数据:这是一个标准的JSON数据结构

Power Query 抓取股票资金流向数据

应该是JSON格式的数据,对于Power Query来说,数据的开头有多出来的字符:

Power Query 抓取股票资金流向数据

Power Query的JSON解析只认{}包裹的数据,所以我们在抓取的时候就要清理好。

定义抓取函数

定义抓取函数的过程通常两步:

一、实际抓取:

1、复制URL:从检查结果中复制URL

Power Query 抓取股票资金流向数据

2、从web获取数据:

Power Query 抓取股票资金流向数据

粘贴我们复制的URL,开始操作

Power Query 抓取股票资金流向数据

这时候就可以开始数据整理,用等号分割,就直接把JSON数据独立出来,后面的数据类型检测选整个数据集。

3、JSON解析:

Power Query 抓取股票资金流向数据

如我们预期,直接得到解析的结果:

Power Query 抓取股票资金流向数据

4、展开数据并整理:

Power Query 抓取股票资金流向数据

这个过程都很简单,要注意的是替换数据中的短划线,如果不替换在数据类型转换时就会出错,还有就是列的重命名,这个是有点麻烦,不过相对与几千行的数据来说,几列的名称手工输入也就不算啥了。

5、定义函数:

在这个查询的基础上右键创建函数:

Power Query 抓取股票资金流向数据

输入一个名称继续,高级编辑器中添加页码作为参数:

Power Query 抓取股票资金流向数据

添加后的结果:

Power Query 抓取股票资金流向数据

抓取

1、准备页码列表:

创建一个页码列表,并转换成文本格式

Power Query 抓取股票资金流向数据

2、引用函数抓取数据:

Power Query 抓取股票资金流向数据

3、展开数据并整理:

Power Query 抓取股票资金流向数据

4、加载数据:

Power Query 抓取股票资金流向数据

这样整个数据抓取的过程就结束了:

我们简单的做个图表看看:

Power Query 抓取股票资金流向数据

展开阅读全文

页面更新:2024-05-22

标签:数据   数据结构   流向   页码   数据类型   函数   源码   规律   文本   定义   资金   参数   过程   结构   情况   股票   列表   科技   网站

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top