链家收录了多少恒大的楼盘?

链家收录了多少恒大的楼盘?

网站分析

我们打开链家地图找房:

链家收录了多少恒大的楼盘?

检查network标签,我们选一个城市:

链家收录了多少恒大的楼盘?

好详细的数据,我们在选一个试试:

链家收录了多少恒大的楼盘?

没问题,这样就能找到对应城市的json数据,非常详尽。

接下来看头文件:

链家收录了多少恒大的楼盘?

看起来我们要找到每个城市对应的子域名才行。

通常情况在网页代码中能找到对应的元素:

链家收录了多少恒大的楼盘?

下面就是对应的城市链接列表,我们可以直接复制这个元素,到Power Query中做xml解析:

链家收录了多少恒大的楼盘?

在Power Query中建立空白查询,粘贴复制的内容:

链家收录了多少恒大的楼盘?

我第一行选择的是长春,那么下面的列表中就少长春一行,需要复制其他城市修改成长春的,就补齐城市列表了:

链家收录了多少恒大的楼盘?

分析中选xml:

链家收录了多少恒大的楼盘?

我们需要的内容在dd列,展开后得到城市列表数据:

链家收录了多少恒大的楼盘?

这个网址要做调整,变成这样的:

链家收录了多少恒大的楼盘?

试抓

我们在分析过程看到是GET方式,可以直接抓取:我们复制真实网址:

链家收录了多少恒大的楼盘?

Power BI 中的Power Query有的时候自作聪明地帮你展开数据,结果不是我们想要的:

链家收录了多少恒大的楼盘?

我们删除下面的步骤,自己展开:

链家收录了多少恒大的楼盘?

我们展开的结果是这样的:

链家收录了多少恒大的楼盘?

还有很多具体的内容,我们不需要,我们只是想了解全国范围内,链家网站上有多少个恒大的楼盘,所以选几个有用的列,其他都删除就可以了。

我们试抓取到这就结束了。

定义函数

用上面的试抓过程定义一个抓取函数:

链家收录了多少恒大的楼盘?

参数就是我们前面找到的每个城市的url,我们输入一个城市的url试一下这个函数:

链家收录了多少恒大的楼盘?

调用函数的结果:

链家收录了多少恒大的楼盘?

我们可以开始抓取了:

数据抓取

在之前准备好的表中添加自定义列:

链家收录了多少恒大的楼盘?

然后我们展开修改数据类型,因为我们要在地图上显示,坐标就要是小数才行:

链家收录了多少恒大的楼盘?

加载数据到Power BI Desk Desktop中:

链家收录了多少恒大的楼盘?

我们通过页面筛选器,筛选楼盘名称中含有恒大的数据出来。

链家收录了188个恒大楼盘,贵阳最多11个。

展开阅读全文

页面更新:2024-03-07

标签:楼盘   贵阳   范围内   长春   自作聪明   函数   元素   定义   过程   网址   内容   数据   城市   列表   科技   网站

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top