问财查询A股公司董事长更替数据
不完全统计,近两年各大公司创始人卸任董事长职务的有:
这些大佬们集中在这今年内卸任,真的是有点奇怪。
接下来我们来看A股的数据:
历年来A股各公司董事长或代理董事长离任的人数:
今年才到9月份就已经507人,到年底会不会超过2020年呢?
看一下去年最后一个季度的数字:三个月171人。
看来这两年流行更换董事长啊,数据逐渐走高。
这个数据是我从问财网站上找到的:
同花顺问财挺好用的,但是如果走错门,数据也很难拿到。昨天下午折腾了一下午,总是被决绝访问,今早从百度直接打开的页面:
昨天下午打开的页面:
感觉是两个门啊,昨天我还登录了账号,也能获取数据,但是要频繁地更换token,我试着修改单页抓取数量每页1000条都能通过,做好函数,批量抓取的时候,直接就被拒绝了。
这里说一下区别:
昨天的是GET方式,今天的是POST方式这是最主要的区别。
昨天就翻篇了,记录一下今天的成功的过程:
都在检查中可以找到:
url:
Contenttype
Cookie
Useragent
Formdata
最后这个要复制源码。
你要是特别熟练,可以直接写在Web.Contents函数中。
得到回应:
如果返回的是没有组件或其他错误,试着更新网页,重新复制cookie和formdata,然后再试。
这只是其中一页数据,我们要逐页抓取么?NO
太麻烦,我们直接修改抓取参数,一次性抓取!
为了方便修改,把formdata直接复制到一个空查询中,用文本格式修改:
把查询的参数也改到这个form:
同样是成功的
然后我们修改form中的每页数量:
注意网页显示一共有7745条数据,我们修改成每页8000条应该一次就好,前面的页码要修改成1,如果不是1,就不会显示数据,因为超出数据范围了。
不出意外就会返回数据,飞快地返回,比起GET方式的要快很多。
比较简单了我们根据预览中的json数据很容易就找到具体数据的位置:
展开后整理下日期格式:
回到Power BI Desktop中做我们接下来的分析:
我们就做简单的分析,加一列,计算任职年限:
写一个度量值,统计离职人数,COUNTROWS就行了。
有了这份数据我们可以实现几个功能:
单个公司的董事长更替:
Timeline:
Gantt:
按年统计离职人数:
然后我们写三个度量值来做排名:
离职人数排名,就是说一个公司先后有多少人次董事长离职;
任职时间排名,按人统计哪个已离职的董事长任职时间最长;
一家公司任职时间排名:上一个有可能会出现点问题,如果重名就两个人统计到一起了,所以我们要连着公司一同计算;
这三个表格是可以联动的:
当我选中其中一个公司,另外两个表就会显示对应的数据。
还能做性别、离职原因等分析,但是需要去清洗数据,离职原因太过凌乱,感兴趣的大家子自己动手试试。
页面更新:2024-03-08
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号