数据之巅 | 所有的数据问题,归根结底都是人的问题

大家好,我是@狂人先生,欢迎来到“每周读本书”,今天继续为你拆解《数据之巅》,这是第七篇。


数据之巅 | 所有的数据问题,归根结底都是人的问题


上一篇我们讲到了镀金时代的技术崛起,需求倒逼科技的进步。那么,今天我们再继续谈谈镀金时代的第三个崛起,就是组织的崛起。接着数据文化的东风,有了思维上的进步,有了技术上的进步,那么人与人之间的组织,当然也不会停滞不前的。


在最早的时候,美国的人口普查都是每一个家庭,也就是每一户来统计的。在1845年,波士顿作为试点,尝试把人口普查从按照家庭普查,推进到按照人来调查,这样数据收集的颗粒度就细化了;1850年,肯尼迪更是把这个模式推向了全国。有了这些更加细致的数据,在1869年,就成立了劳工统计局。


1 以数据说话,中立的劳工统计局


为什么要成立“劳工统计局”呢?这跟工业化加速脱不了关系,在铁路、运河、炼钢中心、石油基地等纷纷出现的过程中,机器的普及也带来了血汗工厂、童工问题以及大量的事故和伤亡,引发了劳资冲突和劳工运动。随着工会的诞生,资本家和工人之间的冲突和对立局面一度非常紧张。在这种冲突当中,劳资双方相互扯皮,作为仲裁者总是左右为难、无所适从。到底怎么判断谁在理呢?最好的办法,还是“用事实和数据说话”。


比如说,工人们都说工作环境很差。那么“很差”这个词不能说明一切,到底差到什么程度呢?这就需要数据去统计,到底空气的密度有多少,氧气的供给量,每小时需要有多少立方英尺流通?这就好办了,统计学家统计出,工人的工作环境,每小时至少要有2000立方英尺的空气流通,才算是正常的。有了量化标准,这就好办了。劳工统计局再去核查这些工厂,把那些空气流通不过关的工厂都筛掉,停业整改。劳工统计局通过实地走访,统计出来的结果,其实空气密度并没有问题,真正的问题出在空气流通的情况太差。


数据之巅 | 所有的数据问题,归根结底都是人的问题


那么,应该怎么整改呢?在此,劳工统计局就不会提供任何的建议,不提供事实的理论解释,他们要做的,仅仅是提供事实和数据。反正,就是告诉大家,数据反映的情况就是这样,至于怎么做,大家看着办。反正,劳工统计局并不站队,跟政治脱离关系。


1884年,美国第二十一届总统阿瑟签署法案,成立国家劳工统计局,并且在全国公开遴选局长。作为劳工统计专家,赖特这时候已经声名远播,他在劳资双方的呼声当中获任国家劳工统计局首任局长。赖特在劳工统计局局长的位置上服务了20年,其间他组织了很多大规模的统计和调查,回答了不少重大的时代话题。这些调查也帮助他赢得了国际声誉,使其成为国际知名的劳工统计学家。


比如,工业社会最大的特点,就是机器代替了人力,那么机器的出现,到底是增加就业机会,还是减少就业机会呢?工人的收入是增加了,还是减少呢?按照我们的直觉,肯定就是很多人会失业,哪怕你没有失业,收入也会降低吧。在我们朋友圈,经常会出现这样的段子,甚至调侃说,未来机器代替人类,你就连帮领导拎包的机会都没有了。真的是如此吗?赖特经过数据统计发现,随着机器的普及,工人的工作机会其实大大增加了,其工资也一直在上涨。原本他自己的直觉也不相信这样的观点,但在数据面前,这就是事实,不信也得信。


2 “以人为本”,才是推动历史的重要力量


在人口普查进行了100年,每一届人口普查官都有一个心愿,就是把普查办公室常态化。在这以前,人口普查每十年才做一次,往往统计完、数据处理完以后,就可以就地解散了,这正是国会一直以来都不赞同“常态化”的原因。他们觉得,这根本没必要,因为留着这个普查办公室,都是需要很大的一笔成本的。然而,在1899年3月,这却变成了现实。更加戏剧化的是,推动普查办公室变成现实的,不是什么刻骨铭心、改变历史的大事件,仅仅是因为一群妹子。


数据之巅 | 所有的数据问题,归根结底都是人的问题


上一篇我们都知道,霍尔瑞斯研发了打孔机,数据都通过打孔的形式,记录在一张小卡片上。因为数据特别的庞大,当然需要大量的人手,完成打孔的工作。这样的工作,需要特别的细心,因此女性是特别适合的。普查局聘请了几千名妹子做打孔员,这些妹子们都长得年轻漂亮,而且还时不时给国会的绅士们抛一下媚眼,使得国会的绅士们看得口水都流了。终究是感性战胜了理性,国会因此而同意了把普查办公室常态化 。


但是,这还远远不够啊,毕竟要让一个组织常态化,得要总统点头的吧?当时的总统是罗斯福,他当然不能相信国会那些工作人员的一面之词,毕竟这么大件事情。但是,普查办公室又用另一件事来摆平罗斯福的,就是更加软的一招——棉花!


数据之巅 | 所有的数据问题,归根结底都是人的问题


那个时候,棉花价格波动,有不少棉农破产了。罗斯福很着急啊,想要想办法帮助那些棉农们。可是,这个数据到底应该怎么采集呢?罗斯福急需棉花产量的数据,因为他要统计一年当中各个时段的棉花产量,这样以便在价格上进行调控。但是,这个数据从何而来啊?人是聪明的,当时普查办公室的主管,虽然说不能落到实处去调查每个棉农生产多少棉花,但他想到一招:普查办公室已经掌握了全国各地轧棉机的分布和数量,每一朵棉花都要通过轧棉机去籽,因此通过轧棉机的轧棉记录,就可以准确地计算不同时间节点上的棉花产量。


仅仅用了一年的时间,在全国3万台轧棉机上建立了统计报告制度,每月统计两次,从而获得了棉花产量的准确数字。这个数据精细到半个月,罗斯福总统大感欣慰,于是也同意普查办公室升级为永久性的常设机构。


但是,这又带来了一个新问题,因为把产量的数据都统计出来,这可是每个企业的商业秘密 啊!比如说,普查局最初以县为单位,公开发布各地的棉花产量,以供各级政府、商业组织和个体农户参考。但对于一个小县,如果它只有两三台轧棉机,公布其总数,则意味着各台轧棉机的机主就能推算出其他轧棉机的产量,这相当于商业机密的变相泄露。为了补上这个漏洞,普查局很快修改了规定,规定一个郡县的轧棉机如果不超过三台,其数据必须合并在其他郡县中,不予单独发布。就这样,商业数据隐私的问题才得以解决。


到这里为止,美国镀金时代的这一章节就大概给大家拆解完毕了,看完这一章节,我感觉特别的震撼。这更加让我感觉到鲁迅先生的一句话:“不满是向上的车轮,能够载着不自满的人类,向人道前进。多有不自满的人的种族,永远前进,永远有希望。”真的是这样,我们不要害怕提出问题。如果没有提出问题,就没有想到有改进的空间;只有提出了问题,才会倒逼自己做数据的统计和分析,从而推断出解决的方案来,社会才会不断地进步。哪怕在我们这里解决不了,也总会有人解决我们提出的问题;同时,前人提出的问题,也许我们这一代人就能解决到,这也是有可能的。


好了,今天就先聊到这里,希望这三篇对大家能够起到鼓舞的作用,对自己做的事情充满信心。我是@狂人先生,感谢你关注“每周读本书”,我们下一篇见。

展开阅读全文

页面更新:2024-02-18

标签:郡县   赖特   罗斯福   棉农   数据   常态   劳工   国会   统计局   棉花   产量   人口普查   空气   机器   办公室   体育

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top