清华大学孙茂松：理解并超越大模型，需要基础数学“应战”

瓦特发明蒸汽机后大约100年，热力学三定律才阐明其机理。眼下，ChatGPT等大模型所表现出来的智能涌现，需要多少年才能被解释清楚？在今天举行的浦江基础科学发展论坛上，清华大学人工智能研究院教授孙茂松表示，现在的AI（人工智能）绝对不会再给我们100年，理解大模型需要基础数学的加入，而一旦破解其背后的机理，就有机会超越现有大模型，建立下一代AI的理论和模型。

然而，大模型的参数规模已达到万亿级，如此庞大的数据量给应用数学家提出了极大挑战——他们从未解过如此大规模的方程组。尽管目前世界上敢于“迎战”的数学家还为数不多，但孙茂松仍坚信，不出三五年，大模型智能涌现的机理研究一定会有突破。

智能涌现挑战全球数学家

只需输入几个例子，ChatGPT就能生成一个令人基本满意的答案。这种大大超出人们预期的结果，究竟是如何产生的？这连OpenAI团队也没弄明白。

目前，学界将ChatGPT的表现归为智能“涌现”。所谓涌现，通俗而言是指当一个个孤立的能力以某种方式组织起来，在达到一定规模后，突然爆发出非常强大的能力。人脑就是一种智能涌现的产物。孙茂松说，科学家至今无法理解，为何从微观层面测到的无数简单的电化学信号，会在宏观层面表现出如此复杂的行为和深邃的思想。

对于大模型的智能涌现，在2020年GPT3发布时，就已引起了学界关注。在孙茂松看来，要阐释其背后的机理，需要基础数学的介入，“它需要数学家的深邃理解力，去抽提大模型背后的硬核本质”。对大模型的机理认识一旦突破，人工智能将进入一个全新时代。

然而，目前全球投入到这一挑战中的数学家为数寥寥。孙茂松认为，这是因为由工程驱动的AI神经网络规模已经达到了“无边无际”的程度，数学家从未解过如此庞大的方程组，而且这一问题与经典数学完全不同。

不过，他也强调，哪怕一时不能搞清大模型背后的机制，数学家的加入也能为AI发展提出新视角，创新AI现有体系。

语料耗尽将让大模型发展停滞？

训练自然语言大模型，需要不停“投喂”语料。当人类现有语料耗尽，大模型的发展会否停滞？孙茂松认为，目前大模型对语料的利用仅仅停留在粗放的简单抓取阶段，AI对语料信息的深层解析与应用，还有待进一步开发。

孙茂松举例说，如今ChatGPT能够识别的只是网页上的文本，但对于标题、小标题等代表逻辑的格式信息，还没有能力分辨，这与语言模型目前只能生成较短文本的能力是相匹配的。

下一代自然语言大模型的发展方向是要让机器能“自然而靠谱地说话”。孙茂松说，千万不要小看了“说话”这种能力，正是语言能力的发展，让智人从原始人类中脱颖而出。因此，机器能够像人一样使用语言，“这可以说开创了世界五千年以来未有之格局”。

让机器“靠谱说话”的关键，在于让语言模型的输出结果与现实与事实对齐，避免“一本正经地胡说八道”。孙茂松觉得，这背后需要付出极为艰辛而巨大的努力，“目前，国内外很多初创企业都在致力于这方面的开拓”。

决胜AI未来需要顶尖人才

ChatGPT爆火，国内各大模型纷纷冒头，呈现出“百模大战”之势。孙茂松认为，这是我国在AI领域实力的体现。尽管最后不少模型都会在竞争中淘汰，但仍有相当数量的大模型会在垂直领域中找到应用场景，推动AI技术的落地与发展。

在清华人工智能研究院，孙茂松带领团队在语言模型的垂直细分领域进行了不少示范性尝试。比如，开发生成古诗的“九歌”小程序、国内首款汉语反向词典wantword，以及与清华中文系合作开发古文大模型等。

“尽管大模型背后的机理尚未搞清，但这并不妨碍其在实际应用中的迅速发展。”在孙茂松看来，未来要在自然语言大模型领域占据先机，就必须培养出真正的世界顶尖人才，“最前沿之争就是顶尖高手之争，人才厚度决定了技术高度，而应用决定了AI的广度”。

他表示，与所有科技领域一样，决胜AI未来，离不开坚定而执着的理想、不计功利的投入，以及对前沿领域的洞察和远见。

作者：许琦敏

图片：主办方提供

展开阅读全文

页面更新：2024-04-26

标签：模型语料清华大学自然语言数学家人工智能机理领域能力语言数学智能基础孙茂松

1 2 3 4 5

清华大学孙茂松：理解并超越大模型，需要基础数学“应战”

夸克，探索下一代搜索引擎

果然发布｜“雪龙2”号已驶入北极圈，即将开始科考作业

59岁马云现身波黑！夜市豪饮啤酒心情大好，穿平价短袖引热议

美媒：推特总部标志拆到一半被警方叫停

中国突然公布，数百万吨铀矿储量，西方很好奇，中国想干什么

“狡猾”的日本品牌，一直都被误以为是中国货，竟闷声捞金1400亿

手机行业要寻找新的突破口

微信这个新功能，冲上热搜

比稀土还珍贵！金属铼全球储量2650吨，美想用“铼”卡中国脖子？

一份套餐5个盒，还要加送电烤锅：“疯狂”的外卖包装

（港澳台）30名香港中学生将赴内地参加“少年太空人体验营”

从租飞机到租绿能

中国半导体，要被“气”死了？

懂车帝夏测成绩曝光，零跑C01与比亚迪汉谁更值得选？

为什么说事业单位工勤岗是最差的岗位，没有之一？

造谣用上AI智能工具玩出“新花样”

向太香港富人区遛狗，身穿4位数基础衬衫，打扮时髦比郭碧

南华大学研究生在核领域代表性期刊发表封面文章

智能巡检机器人助力电网迎峰度夏

内容安全智能检测系统发布

暑假轻松在家做感统训练，同时锻炼孩子多方面能力！

丘成桐：人工智能的基本原理还需要数学家帮忙

加快在上海打造数学研究高地

父母共心力通过影响个体的情绪调节能力，进而促使行为问

OPPO发布K系列新机定位两千元档主打影像能力