Power Query 抓取历史上的918

历史上的今天网站提供这样的数据,今天是9月18日,直接抓取就是9月8日的对应内容。

Power Query 抓取历史上的918

第一步:用TXT格式抓取网页内容:

Power Query 抓取历史上的918

= Table.FromColumns(

{Lines.FromBinary(Web.Contents("http://www.todayonhistory.com/"))})

第二步:整理要转取的内容:

Power Query 抓取历史上的918

上图中我框起来的行应该就是我们想要的内容,我们就用筛选来把这些行找到:

pica是图片标注是重复数据,要筛选掉。

Power Query 抓取历史上的918

这样筛选之后还是有点问题:

Power Query 抓取历史上的918

还多出来这几行包含

的重复行,也要筛选掉:

Power Query 抓取历史上的918

这下就清净了,不过还有首尾两行需要删除,这个操作就简单了,

Power Query 抓取历史上的918

接下来是提取关键内容,日期与事件,提取两个尖括号之间的文本就可以了:

Power Query 抓取历史上的918

这样的结果还是不方便使用,需要变成两列,日期对应事件的格式:

Power Query 抓取历史上的918

我们写了一个长长的公式来生成最终结果的表:

= Table.FromColumns({

List.RemoveNulls(List.Transform(T[A],(x)=>if Text.PositionOf(x,"9月18日")>=0 then x else null)),List.RemoveNulls(List.Transform(T[A],(x)=>if Text.PositionOf(x,"9月18日")>=0 then null else x))

})

其实也不复杂,就是我们把含有9月18日的行提出来变成一个列表,把剩余的事件做一个列表,然后用这两个列表组成一个表格,上面的公式就是实现了这个功能。

最后,我们把数据加载到Power BI中,做个多行的卡片:

Power Query 抓取历史上的918

1931年9月18日,九一八事变,勿忘国耻!

展开阅读全文

页面更新:2024-04-23

标签:尖括号   首尾   事变   不方便   清净   卡片   公式   表格   剩余   日期   事件   格式   内容   数据   列表   科技

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top