买菜时用得到数学?还真是!数学用在各个方面:计算机、新闻推送

对于很多数学专业的来说,肯定听过这样一句调侃:学数学有什么用?买菜时也用不上微积分啊!

其实买菜还真用得上微积分,比如现金的制作靠的就是微积分;扫码支付这一过程,通过基站、互联网、手机的传送,用的也是微积分。

即使你每天刷抖音、快手看到的新闻信息,背后也是靠数学算法推送给你;每天用到的搜索,底层也是数学。

甚至大家都知道的余弦定理,竟然应用在我们的新闻分类中!

吴军博士的《数学之美》作为一本数学科普书,没有艰难晦涩的公式符号,却从数学如何影响我们现在的生活,数学家背后有什么样的趣事写入书中。书中虽然涉及到马尔科夫链、矩阵、熵等概念,但读过内容的人发现,会很快将这些内容读懂。

买菜时用得到数学?还真是!数学用在各个方面:计算机、新闻推送

书中涵盖了自然语言处理的过程,比如统计语言模型、分词、熵等,也涉及了现下最热的区块链内容,还有应用广泛的算法,比如贝叶斯网络、期望最大化,甚至是神经网络都有涉及。

作为算法从业人员,读这本书会从另外视角感受数学的魅力。

这本书的内容,即“数学之美”系列文章,原刊载于谷歌黑板报,获得上百万次点击,得到读者高度评价。

吴军博士毕业于清华大学和美国约翰·霍普金斯大学,曾任职于Google和腾讯,对自然语言处理十分熟悉,领导了Google自然语言处理和自动问答等研究型项目。在腾讯,负责搜索、街景地图等项目。

他丰富的工作经验,和扎实的数学基础,以及幽默的故事写作方法,促成了这本《数学之美》的畅销。

奇妙的数学思维

现在特别火的大数据、人工智能,涉及最多的除了代码,就是底层数学内容。吴军博士从事多年自然语言处理工作,这本书有相当大篇幅讲了自然语言处理的前世今生。

从1946年现代计算机出现开始,就有人问机器能不能懂我们所说的话?发展到现在的人工智能时代,答案是肯定的,否则我们就见识不到翻译、语音识别这种产品了。

买菜时用得到数学?还真是!数学用在各个方面:计算机、新闻推送

但在最初的时候,大家不知道怎么让机器来理解我们的自然语言。首先就是我们所讲话的歧义性。

对“苹果”一词,在不同场景下,意义就不同。“比如我今天吃了一个苹果”和“今年新一代苹果四千块钱起”。相信大家都知道第1句话里面的苹果是我们说的食物,第2个是我们说的苹果手机。

如果让机器理解这些内容的话,该如何解决这种歧义性?按照我们的理解,想要明白某个词的含义,要通过上下文来理解。

如果想要用数学的方式表达出来,数学家加里尼克就觉得这个词的释义是否合理,就看它的可能性大小。这里的可能性就可以用数学上的概率衡量。

对于某个词出现的概率,我们需要知道在前面词出现的基础上的概率。如果一句话很长,或者是一篇文章,当衡量最后一个词时,可能达到成千个条件概率,那可能就没法估计了。

有个俄国数学家,马尔科夫就使用了一种偷懒的方法:对每个词,我们只衡量当前词在前一个词的基础上的概率。这样就大大简化了问题的难度。

从这里就可以看出数学的美妙之处,他把很复杂的问题变得很简单,用简单的数学模型解决了复杂的语音识别、机器翻译的问题。

数学的简单之美

说到计数,很早之前,我们没有如此完善的计数系统。最初可能3之后就是“数不清”了。后来发展成十进制,也是因为我们有10个手指头,通过掰手指的方式发展成了十进制。

到目前为止,相信没有比二进制更简单的计数方法了,二进制只有0和1两个数字。

布尔是19世纪英国的一位中学数学老师,在他生前没有人认为他是数学家。布尔喜欢在工作之余阅读数学论著,思考数学问题。他著作的《思维规律》这本书中,展示了如何使用数学方法0和1解决逻辑问题。

买菜时用得到数学?还真是!数学用在各个方面:计算机、新闻推送

也就是我们现在熟悉的与非或——1表示真,0表示假,“与”运算时,两个相同则为1,不同则为0。

如今看来如此简单的运算,当时很多人问这么简单的理论能解决什么样的问题呢?在布尔在该书提出后的80多年确实没有什么应用,直到1938年香农在他的硕士论文中指出:用布尔代数可以实现开关电路,人类用一个个开关电路,最终搭建出了电子计算机。

作为相关从业人员,对吴军博士在《数学之美》中提到的这段话深以为然:正确的数学模型在科学和工程中至关重要,而发现正确模型的途径常常是曲折的。正确的模型在形式上通常是简单的。

美国工程院院士阿米特·辛格博士也认为,好的算法应该像AK-47冲锋枪类似:有效,可靠性好,杀伤力大且简单操作。吴军博士在Google时与辛格博士合作,要研究网络搜索中的作弊问题。

最初想要搭建一个力求完美的模型,到落地差不多要花上3、4个月的时间,辛格认为找个简单有效的办法就行。他们一两个月就做成了一个版本,将作弊数量减少了一半。

辛格博士总是能找到简单有效的方法,不是靠直觉也不是撞大运,而是靠他丰富的研究经验。他对搜索的细节进行仔细研究,这些简单的方案常常是去伪存真的结果。

所以想要简单有效的方式,背后的付出不是更少,而是更多。只有掌握了搜索的本质和精髓才能永远游刃有余。

非数学式的讲述方式

读完吴军的这本《数学之美》,让我有种恍然大悟的感觉,得益于他善于讲故事的思维,以及他的扎实理论基础。

作为一名数学领域的大咖,算法工程师,他的著作并不晦涩,相反他用一种朴实有趣的语言,将这些难懂的内容描述出来,特别引人入胜。

无论是在学习还是工作中,大家应该都有遇到这样的情况:如果用自己的语言来讲,对交流的双方都有益;如果使用太复杂的描述方式,让人感觉不好接受,太难懂。

买菜时用得到数学?还真是!数学用在各个方面:计算机、新闻推送

尤其是对接业务方时,如果用纯数学的讲解方式,他们肯定一头雾水,也无法对自己的结果进行合理评判,无法推进业务。

吴军博士在《数学之美》中讲解了一个特别重要的概念——信息熵。他首先抛出一个有趣的问题,如何衡量有50万字的《史记》的信息量?

一条信息的信息量和它的不确定性有直接关系。比如说,如果我们想要讲出一件非常不确定的事,或者是了解一无所知的领域,我们所需要的信息就很多;如果我们已经了解了某件事的大部分内容,那需要一点信息就够了。

那该如何度量呢?吴军使用了一个想要猜出某场球赛的胜方为例,形象地描述出想要获得谁是获胜方这条信息,他需要5块钱。类比到信息中,将钱换成了“比特”这个信息领域的概念。

慢慢地带大家了解信息的度量方式,信息熵的概念由来。比教材中冷冰冰的公式有趣的多,也让人理解得多。

李开复这样评价这本书:现在的社会多了一点压力和浮躁,少了一点踏实和对自然科学本质的好奇求知。吴军的这本《数学之美》真的非常好。非常希望吴军今后能写出更多这样深入浅出的好书,它们会是给这个社会和年轻人最好的礼物

《数学之美》这本书不仅只是给理科生写的,不仅程序员看得懂,只要你想了解数学的应用,自然语言处理,都可以读一下这本书。

展开阅读全文

页面更新:2024-03-20

标签:数学   自然语言   微积分   数学家   布尔   概率   算法   模型   博士   苹果   简单   方式   计算机   方法   内容   新闻   信息

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top