微软CTO凯文·斯科特谈AI如何拯救互联网,而不是摧毁它

本文来源:苏哲管理咨询

作者Nilay Patel

微软CTO 凯文.斯科特谈AI如何拯救互联网,而不是摧毁它

-微软CTO凯文谈智能体、网络搜索和人工智能艺术的未来


Nilay Patel

Nilay Patel是The Verge 的主编,也是Decoder 播客的主持人,以及The Vergecast 的联合主持人。

今天,我和微软首席技术官、公司的人工智能领导之一凯文·斯科特(Kevin Scott)进行了对话。这是凯文第三次出现在《Decoder》节目中,他是我最喜欢的嘉宾之一。他对技术、艺术和文化之间的关系思考很多,而且他愿意深入探讨这些问题,显然我无法抗拒。

凯文今天在微软的Build大会上加入了节目,谈论搜索的未来- 公司刚刚宣布推出了一个开源工具,让网站可以轻松集成基于人工智能的自然语言搜索,只需付出一点努力,这样让网站所有者能够运行他们想要的模型并控制他们的数据。这是非常不错的东西- 在我和凯文聊天之前,我看到了一些演示,对大多数网站上糟糕的本地搜索的改进是显而易见的。

但这里的目标不仅仅是在一堆独立的网站上改进本地搜索功能。而是重新思考在一个人工智能更广泛分布的世界中搜索是如何工作的。这样想吧:现在,建立一个搜索引擎需要你去索引互联网上的所有页面,然后不断更新这个索引,这是一个巨大的经常性成本。

请订阅由The Verge的Nilay Patel主持的《Decoder》节目,关于重大理念和其他问题。

那些成本就是为什么现在只有两个主要的搜索索引:显然是谷歌的,还有微软的必应索引,它驱动着大多数你可能熟悉的替代搜索引擎,比如DuckDuckGo。这些集中式搜索索引也是我们当前人工智能搜索工具的基础,比如内置在ChatGPT和Bing中的搜索,或者谷歌的人工智能概览。

但如果所有这些网站突然拥有了自己强大的自然语言搜索工具,那么,您可能就不再需要那个庞大的中央索引了。您真正需要的只是一种标准,让您询问一堆网站能否回答您的问题,这将极大降低搜索的总成本,也许会让更多的竞争对手进入市场。因此,微软的本地搜索项目是基于这样一个标准构建的——它被称为模型上下文协议,或者MCP,它允许AI 智能体以一种受控的方式与数据库和服务进行交互——而不是像许多智能体产品目前所做的那样字面上在网站上点击。

MCP最初由Anthropic开发。现在,包括谷歌在内的行业其余部分开始支持它。还有很长的路要走,但第一步只是在更多的网站上启用MCP,这就是为什么微软正在使基于MCP的本地搜索变得便宜且易于实现。

很酷想象一下由MCP动力驱动的主动搜索的未来会是什么样子。也许会有更多的竞争,或者网站会获得更多流量,其中一些企业可能会更具可持续性。但显然存在一些复杂性——首先是为什么有人希望智能体使用他们的服务这种方式,以及如何赚钱。我询问了Kevin 关于这个问题,并我们花了些时间思考未来网络如何对所有真正创作内容的人保持可持续。

我可以永远谈论这个问题,但是既然有时间和Kevin在一起,我也确保询问了关于微软与OpenAI独特且常常令人困惑的关系,他对人工智能能力随着时间的推移增强的感受,以及在诉讼和争议在创意界激烈展开的情况下,他对人工智能作为创意工具的看法是否在发生变化。毕竟,Kevin本身也是一名作者,他在2020年撰写了一本关于人工智能的书,前言作者当时是一个相对不知名的人,名叫JD Vance。

所以我问了凯文:如果有人站在书店外面,向任何对购买感兴趣的人概括他的书,他会有什么感受。我认为你会觉得这个互动很有趣。

好的:微软首席技术执行官Kevin Scott。我们开始吧。

这次采访经过了轻微编辑,以缩短长度并保持清晰度。

凯文·斯科特,您是微软的首席技术官。欢迎回到Decoder。

凯文:非常感谢你邀请我。

如果你数一数我们在The Vergecast 节目中的Decoder 早期试行,我相信你是我们第一个四次上节目的嘉宾。

凯文:哇。真的吗?

Nilay Patel:你总是我最喜欢的对话之一,所以我对这次对话感到兴奋。微软有一些关于搜索和网络的消息,这正好是我节目中感兴趣的领域,因为我看到这些领域发生了巨大变化。我想和你谈一谈,现在AI已经进入第二个时代,我们学到了什么,我还想和你谈谈它的发展方向,仅仅是一些惯常的话题,小事一桩。

让我们从新闻开始。微软在今天就在听节目的时候,在Build大会上宣布了一种新的本地网站搜索方法。告诉我们那边正在发生什么。

我实际上会将其表述得更少一点作为搜索。我一直花了大量时间思考的是我们有这样一个假设,我认为它一直在得到证实,那就是您将拥有由过去几年建立的所有这些强大的新人工智能模型提供支持的主动软件,智能体需要能够代表用户执行任务。我们不再受限制,你把它称为人工智能的第二幕,这就像我们在内部谈论它时的描述,我们描述我们现在所处的阶段是中场。所以我们不再受到限制化推理的约束。我认为,在我们试图构建的这些智能体软件中,我们可以说是受到了效用的限制。

等等,受到效用约束,有很多方式来解释这是什么意思。也许最苛刻的是“它还不太好用”。也许不那么苛刻的解释是“还没有产品市场契合度”。你觉得这是什么意思?

我认为这在一定程度上取决于情况。如果你看软件开发的话,显然有产品市场契合。这种东西已经成为人们构建软件的一种必不可少的方式,就像我们构建的软件开发智能体那样。我认为,在那里,这只是智能体软件可以做的事情的前沿探险者。并不奇怪,因为开发人员通常会先构建一些使他们的生活更轻松的东西,然后才会为了使其他人的生活变得更轻松而构建东西。所以在这方面我们已经走得有些更远了,在构建这些软件工程师智能体的过程中,我们发现了一些关于如何使通用智能体软件对软件开发以外的事情更有用的东西。我们学到其中之一的是,智能体需要能够访问信息源;他们需要能够代表用户采取行动,通过在状态和系统中进行更改。

像预订酒店房间或在日历上安排事项等事情。我认为你真正希望所有这些事情发生的方式只是一种开放的协议,让整个智能体领域实现真正的互操作性,在那里,每个希望提供服务或内容以便让智能体访问的人都有一种方式来说:“嘿,在这里。” 然后,无论是谁在构建智能体,都有一种方式来连接到这些内容和服务。我们在Build大会上讨论的方式是智能网络。所以,在这个世界中必须存在什么,在这个世界中,我们有许多智能体为用户做事情,这些事情跟20、30年前的Web发展时必须出现的东西是道德等价物。

所以这就是主动网络。我们在节目中经常谈论这个话题。我曾和你的同事穆斯塔法·苏莱曼谈过主动网络和构建智能体。我一直称之为“DoorDash 问题”。我没有更好的名字。我为DoorDash 的员工感到抱歉,因为我没有征得他们的允许,但我一直称之为DoorDash 问题:好的,我想吃一个三明治。所以我和必应、ChatGPT 或其他谈话,我说,“去给我买个三明治。Alexa,给我买个三明治。”然后它会在网络上搜索。

目前,大多数智能体产品会直接打开一个网站,尝试扫描该网站,然后在网站上点击一些东西,最终给我下单一个三明治。而其中大部分公司都会说:“不要这么做。” 他们的态度是:“我们不希望你这样做。我们会阻止你,也许如果你足够小,我们会允许你这样做,但我们需要商业条款,使你无法仅仅利用我们的能力并在你的产品中以这种方式使用。”

那个问题必须解决。我很好奇你会如何解决这个问题。听起来你只是在思考一个抽象层次假设我们解决了业务问题后,如何让我的智能体与DoorDash对话变得更容易解决的问题,因为在其网站上点击来点击去从来不是一个好的解决方案。

凯文:是的,这是脆弱的,我认为实际上解决商业模式问题与解决技术问题是相辅相成的。因此,这不仅仅是要找出技术上的解决方法,而是要确保生态系统中所有的激励机制都以正确的方式对齐,使得每个人都能从中获益。因此,如果您有一家企业,并且希望您的企业能够通过用户的智能体人与用户进行交易,那么这必须在商业上是有意义的,这样您才会愿意让这种情况发生。您不能仅仅靠折衷的方式来解决这个问题,然后期望它可以持久存在。即使您可以暂时找到某种技术魔法来规避实际技术的脆弱性,您还必须消除商业模式的脆弱性。

这是目前在网络上看起来最受威胁的一块,即我创建一个网站,我添加一堆模式,使搜索引擎能够读取我的网站并在不同的分发渠道上展示我的内容。我可能会添加一个RSS订阅源,这是一种标准化的分发方式,所有人都使用并同意。这样做的方式有很多。

但如果我建立一个网站,我将让自己面向不同平台进行分发。作为回报,我得到的不一定是金钱-几乎在每种情况下都不是金钱。我将得到的是访问者来到我的网站,然后我可以选择如何实现盈利:销售订阅、展示广告,无论是什么方式。这是不完善的,对吧?随着越来越多的答案直接呈现,特别是在基于人工智能的搜索产品中,网站的流量通常会下降。我们一再看到这种情况。在智能体时代,我们已经为智能体设立了新的模式,它们可以与我的网站交流并接收一些答案。什么将会让这变得值得呢?

我认为,我们现在正在努力做的一件事情之一是,通过一些我们正在宣布和尝试以开放方式进行的事情,你将拥有技术机制让智能体能够访问人们的网站,但协议本身将允许你决定你想要提供什么以及如何提供。因此,如果你仅看看MCP,这是一个由Anthropic开发的超级棒的协议,我们正在与Anthropic合作做大量工作,并且我知道生态系统中有许多人。因此,OpenAI正在与他们合作,一大批人已经将MCP视为智能体网络的HTTP的道德等价物。MCP 对于内容或服务提供商应通过MCP提供什么或者对于访问的商业模式应该是什么并没有什么明确的意见。

因此,我认为其中一个好处是,它为那些拥有内容或服务的人提供了一种决定新商业模式将会是什么样的途径。那么,如果用户订阅了您的网站,MCP终端点是否可以在您的智能体程序内使用?是否会有一种新的广告模式,您可以免费提供一些内容,以吸引大量智能体程序活动进入您的网站,也许有一些广告用于推动分发,然后会有一些交易进行,您可以根据转化进行定价。我不知道具体的商业模式会是什么样的,但我知道您真正想要拥有的是内容和服务提供者的智能体权,以便他们能够决定他们提供什么以及他们所做的事情的商业模式。

Nilay Patel:MCP代表“模型上下文协议”?

凯文:正确。

这是一个新兴的标准,我想说。当你访问我的网站或其他服务时,我会告诉你可以做什么。从我所了解的情况来看,这非常类似robots.txt的发展。它更加复杂,更加复杂,但思想基本相同。你来了,我告诉你可以做什么,不能做什么。微软、OpenAI和Anthropic是否能够推动这一点并使其存在,或者其他人参与其中是否有好处?

嗯,我认为如果你是一名开发人员,会有很多上升空间。这让我想起了当我还是年轻的开发人员时的感觉,当时互联网在几十年前迅速发展,我所想要的是一套无需权限的机制,让我可以随意在网上发布内容,然后其他人可以以有趣的方式访问它。

因此,我认为MCP以及我们正在进行的可能在一分钟内会谈到的事情在MCP之上的这件有趣的事情——这个称为[Natural Language Web]的东西,它是一组开放协议和一堆代码,让你可以在不需要向任何人寻求许可的情况下决定要在这个智能体网络上提供什么,这样你所做的事情就可以被智能体访问。当你称其为初生协议时,我认为你是对的。有趣的是,现在上升速度有多快,每个人有多快地开始适应这种让你的产品能够被智能体访问的方法。这是有吸引力的,如果你是内容或服务提供商,越来越多的用户活动都会得到智能体的支持。

那将是用户交易和用户关注的更多来源。因此,您只需在所做的事情中保持可见,以便可以触及受众。我认为你真的会进入这种模式,智能体将以异步方式为您执行任务。在当前网络模型中,很多事情都是同步进行的。因此,你可能会坐在那里,像是“我正在盯着一个浏览器。我可能想在某家Shopify 网店购买一件工具。我的注意力集中在这个特定的任务上。我完成交易,然后继续下一个事情。”智能体的有趣之处在于,事情将开始异步发生,您会指派一个任务给智能体,而它会在您的注意力集中在其他地方时执行所有这些事情。

那是一个非常有趣的事情,我认为将会有许多机会,这些机会目前还不存在,因为在极限情况下,我只能将我的注意力花在很多网站上。如果有一群智能体为我进行研究并帮助我考虑我的暑假度假计划,或者我在我的工作室做一个疯狂的项目,为我正在做的各种随机陶器建造一个窑,如果这可以帮助我走得更远,以便当我有剩余注意力时,我可以立即采取行动,或者也许购买东西,或者我给出的注意力[我付出的]质量更高。我认为这对那些试图在网络上做生意的人来说是非常有趣的。

Nilay Patel让我们来谈谈你正在进行的NL搜索项目以及它如何与更大的愿景相连。所以我看了一个简短的演示。这是非常酷的,对吧?这是一种低成本、非常简单的方法,可以将自然语言搜索集成到网站中。我看到的其中一个演示是Tripadvisor。我被告知Tripadvisor团队在一个周三看了它,然后在下一个周二向公司领导展示了它。这很酷,低成本,它适用于所有模型。您可以在DeepSeek上运行它,也可以在OpenAI的4o mini上运行它。这就是给您MCP能力的原因,对吧?

凯文:你已经在网站上运行了这个工具,为用户提供了一个好处。如果你想要构建一个聊天机器人或自定义界面,这里有一些自然语言检索。但现在你在网站上添加了这个MCP模式,让一个微软Copilot智能体出现并以某种你可以控制的结构化方式与你的网站进行交互。所有这些都非常酷。我了解激励措施是如何对齐的。那只是另一种名义上的API吗?有一部分让我觉得这样非常简化,非常微小。

是的,我认为这实际上并不是一件坏事。实际上,这真的是一件非常好的事情,它实际上是一组简单的协议,使一堆超级丰富的行为成为可能,再次回到最基本的前提,你希望智能体能够非常有用并真正称职。因此,一个智能体应该是一种软件,您可以随着时间委托越来越复杂的任务。为了使这些任务变得越来越复杂,智能体必须能够工作。使它们能够工作的最佳方法是拥有内容和服务的普遍性; 您需要每个人的激励,包括采用门槛和商业模式,以及一切的经济都是有意义的,您得到相当广泛的采用。因此,简单性是一个明显的特征。

让我问你一个涉及网络和在网络上构建新功能时的悬而未决的问题。这显然是谷歌。现在,网络的组织围绕着谷歌的优先事项、需求和流量变幻。有一整类SEO顾问在空中挥舞火花棒为您收集流量。太棒了,我们很喜欢它。

显然,这一切正在发生改变,对吧?随着谷歌留住更多的流量,或者它对训练数据的看法有所不同,所有这些事情都在变化。在这里的交易是让你的网站更具智能体性,然后MCP 作为一种协议将允许您在此基础上构建一些新的商业模式。问题在于,我看到的情况是,随着谷歌的推荐流量下降,前往互联网的流量急剧下降。你如何解决这个问题,以便每个人都有动力继续在互联网上构建?

我不知道,老实说。我可以回答的一个方式是,我已经搭建了一个Shopify商店,只是为了让自己看看。所以我有一个小小的业务,我在业余时间经营,只是为了能够体验一下作为一个基于网络的企业主是什么感觉。

Nilay Patel:那感觉如何?

凯文:这很有趣。为了让业务吸引流量所需要做的舞蹈,以及你必须花费的精力来管理这种流量。有趣的是,我的大部分推荐客户都不是通过谷歌而是通过社交媒体和社交媒体广告进入我的实体店,这与我的预期非常不同。所以我不知道是否有任何有趣的推荐客户,当然也没有通过自然搜索带来的转化。

什么情况下退出?

Nilay Patel:很高兴知道您不会偏袒任何一方。那确实是我想问的。

是的,是的,是的。 我肯定没有。事实上,我认为微软的大多数人第一次听到凯文·斯科特在Shopify有一个商店。所以,绝对没有任何方式在干预。

凯文:作为一个网站运营者,我希望有一种方式能够让我不再花费大量时间担心流量来源。我希望能够花更多时间与那些对我的产品和服务感兴趣的人建立真诚的关系,并且有一种方式来维护这种关系。我希望在网站上有一种方式,让人们可以购买我的产品并了解我所提供的服务,然后有一种方式让他们成为忠实的客户,并真正与我建立关系,就像我在实体店铺里有人来店里的情况一样。所以对我来说,我看到所有这些东西,都是让我比起在玩一些很抽象的SEO游戏时,拥有更多这种动态的方法。

社交媒体对我来说至少感觉更像是我刚描述的情况,我已经非常努力地尝试筛选社交媒体的受众群体,只有那些可能对我作为一个创作者所做的事情感兴趣的追随者。所以,我不...这根本没有回答你的问题,我知道。我知道很多人在网络上有着非常不同的商业目标,而不只是想成为一个小小的店面。

你知道有趣的是吗?在过去几年里,我问过很多人,“为什么会有人创建一个网站?”对我来说,当我们创办The Verge 时,我们唯一要创建的就是一个网站。 我们是一群想要讨论科技的人,所以在2011年我们决定要创建一个网站。 我们甚至没有想过要创建一个YouTube频道。 那是后来人们开始以规模化方式制作YouTube频道之后的事情。 在我们开始的时候,重点是“你要创建一个大型网站”。

现在是2025年,我认为,如果我有11个朋友想要和我一起开始一个科技产品,我们会创建一个抖音。我们绝对不会像现在这样,必须建立一个庞大的网站并拥有所有这些依赖。我们会创建一个YouTube频道,我曾经问过人们,“为什么现在还有人会开始一个网站?” 几乎普遍的答案是为了做电子商务。这是为了在平台规则或平台税收之外进行交易。目的是将人们引导到其他地方去验证你是某种商业实体,然后进行交易,这就是互联网的目的。

我所能了解的另一个关键点是,就我所知,在桌面端,Web 已经成为主导的应用平台。无论是通过Electron 还是通过浏览器中的实际Web 来表达,它都是应用层。所以我明白为什么你会想说,“好的,我们要做智能体。他们将遍历已存在的开放应用层并使用这些工具。”但我仍然困惑,如果我只是想与人沟通,我会去某个封闭的平台,然后我们会进入一个地方,即使是AI 工具也会得到更少的信息,因为每个人都在TikTok 上谈论要购买什么,而所有购买的商品都在Web 上。这就是我无法完全理解的循环。

我认为这是可能发生的事情之一,例如MCP和NLWeb。如果人们想要通过他们的智能体人进行研究或交易业务,这就是意图所在和用户愿望发源的地方,那么您会希望有一些机制可以连接到那里。

那么假设你和你的11位朋友在2025年要开始一个TikTok频道来谈论科技。如果你们正在做的其中一件事是对科技产品或科技网站进行大量评测,而你们希望触达一个位于Copilot、ChatGPT或类似软件内的观众,那么你们会希望这些具有智能体能力的软件有一种方式能够进入你们的媒体频道,以便让你们的观众接触到你们发布的内容。

NLWeb可能是一个很好的方式来实现这一点,也许你并不提供所有的内容,但你提供...就像搜索所发生的,就像预览,就像摘要,一些东西,就像,好吧,你向你的智能体商询问,“嘿,我想买一部新手机,这大概是我想要的,请帮我找一些关于这个信息的来源”,如果你通过你的TikTok频道让你的智能体人知道你的内容,也许这就是智能体人从TikTok返回的转介流量,“嘿,去看这个视频,这非常有趣。”

我真的很好奇,大型平台是否能使自己被搜索或者智能体搜索,就像它们在某种程度上不得不允许自己被大型搜索引擎搜索一样,对吧?

这并不是一个选择。我认为可能最大的平台退出了搜索是Facebook,但Instagram仍然是可搜索的。对吗?有一个贸易,你希望在这些工具上被曝光和被发现,所以每个人都打开了。关于如何向智能体开放的动态,我认为,由于多种原因,其中很多是有道理的,都不太清楚。为什么我们要这样做,而不是建立自己的智能体?我们仍然处于早期阶段。

我不知道那个问题的答案。

以搜索术语来说,你是打算进行垂直搜索还是大范围水平搜索?水平搜索在某种程度上完全占优。

很难准确地说这里会发生什么。我认为这将在很大程度上由用户决定。即将发生的事情之一是用户将决定他们可以容忍什么。因此,如果使用智能体来帮助您整理生活和正在做的事情成为人们的首选,那么与智能体无关的事情对人们来说将变得看不见。你会觉得,“哦,嗯,X不能通过我的智能体联系,也许X有点故障,我会找另一种方法来做这件事。”我认为在市场弄清楚自己想要什么的情况下,你希望有尽可能多的开放协议,以便人们可以作出那些晚绑定的决策,即用户已经选择了什么。他们正在表达他们的偏好。至少要让这个东西是开放的,这样当偏好明确时,我可以选择加入。

我迫不及待想知道这将如何发展。我能看到像Tripadvisor等网站很想要这种分发。显然,我们需要构建前端工具,即汇总工具,来指派智能体商进行。您认为已经展示过或宣布过又未交付或宣布过并向五个人发货的智能体商是否是必要的?您认为通过这种方式在网络上启动MCP是智能体系统运作的必要条件吗?因为到目前为止它们一个都没有起作用。

我认为这样的东西确实是有必要的。我的意思是,我记得在移动广告的早期工作时,我为什么选择从事移动广告行业,是因为我想找到一种帮助那些建设移动应用和服务的人们找到分发和盈利方式的方法。在AdMob等技术出现之前,你唯一能获得分发的方式就是与移动电话公司签订商务协议,然后它会决定是否给你放置位置- 那时是基于WML(无线标记语言),并且是在其平台上放置。这种安排有点野蛮。那时很有道理,但是如果你看看技术的发展经过,随着时间的推移,你会感到,是的,为什么有人要选择那种方式呢?

因此,我认为目前有一点这种动态,人们绝对在这些智能体人中找到了效用,即使它们目前受到限制。在软件开发等领域,您需要让智能体人能够执行的事情范围更窄,当您已经建立了一些完整性时,比如,天啊,采用情况很好,人们喜欢这些东西正在做的事情,竞争激烈,正在彻底改变软件开发的工作方式。

所以我认为我们将会看到的是- 这是我,Kevin Scott,乐观派的观点- 如果你有一个真正完整的智能体网络,在这个智能体网络中MCP可以说是一种通用语言,有点像HTTP,就像每个人都可以搭建一个HTTP服务器并开始提供HTML内容一样,他们可以决定HTML内容是什么。你将会看到这种非常有趣的有机展开的可能性,它可能就像亚马逊或者早期网络中的早期赢家的道德等价物,当你连接足够多的管道后,事情将变得非常有用。但在实现完整的效用之前,我认为一些协议必须先行。这就是为什么MCP很有意思。我们认为NLWeb有点像HTML层,因此这是一种让您无需进行大量低级工作即可将您的东西连接到智能体网络的工具。

这里想到的类比是苹果尝试构建一款自主型的Siri,它建立在苹果操作系统中的一个名为App Intents的框架上,该框架允许iOS应用以某种方式向Siri公开自己,并让Siri在这些应用内执行操作。在这里有粗略的类比- 显然MCP是一个更开放的标准;它更为新生。App Intents也遇到了相同的商业模式问题:如果你是iOS的应用开发者,为什么要让Siri使用应用而不是用户,这样你可以向他们推销或销售应用内订阅?这是一个类比。

另一个相似的平行案例是Alexa Plus,我之前开玩笑说已经推出了,但没有人知道他们是谁。谷歌有一些智能体机构的想法。来自Anthropic、OpenAI 的计算机使用。目前还没有成功。你有看到任何迹象表明这肯定会奏效吗?

我得到了… 不。所以,是的,非常具体地回答你的问题,除了软件工程和演示之外,我并没有明确看到有效的东西,我会更加具体地说明一下。所以如果我看着我的日常生活,看看我如何使用这些东西,除了软件开发之外,没有太多东西是我会选择的,凯文·斯科特也不会选择,让这个智能体人替我做很多事情。但我对MCP有点嗅觉,我确实认为它必须是开放的。我认为以垂直整合的方式做这件事有点困难。

Nilay Patel:我想要问的另一个问题,我真的在运用媒体培训。我要问你关于Google的事情。Google之所以取得一些成功的机会,部分原因是因为微软正处于反垄断压力之下,对吧?微软捆绑了Internet Explorer,对Netscape施加压力— 这导致了一定程度的法律麻烦。Google得以进入,它能够在Windows上安装Chrome,并创建了应用层。所有人都知道这个故事。微软的反垄断压力真的为Google成功创造了机会。

这就是我们现在的情况。多年过去了,几十年过去了。对于谷歌来说,有很多反垄断压力,特别是在控制网络上的广告层和搜索层方面。有人建议政府让谷歌剥离Chrome。这是很多反垄断的干扰,而我正在与微软的一位高管讨论关于网络的新理念和网络的新标准。Nilay Patel:你是否认为这个机会一样,因为谷歌正在被分心?

我认为机遇就是我们目前所处的时刻- 技术本身正准备好让一些事情发生。Guha给你演示的这个演示两三年前是无法做到的,因为那时技术尚未成熟。想做到那样的事情几乎不可能,而Tripadvisor不可能在星期二看到一件事情,然后在星期三用自己的数据来演示。这完全是技术成熟度的体现。所以我不知道政府正在做的事情或其他科技公司将发生什么。

但我认为目前发生的部分原因是,您拥有一组新技术,能够实现一系列新事物,还有一群大型科技公司和小型创业者看到了这种可能性。我希望看到这个生态系统中尽可能多的能量变得更加成熟,尽可能多地实现。再次,我的模式匹配可以追溯到我做开心年轻开发者的时候,那是互联网出现的时期—— 就像当一堆难题变得容易和一堆协议开放时那种感觉,而且你不需要征求任何人的许可就可以尝试一些疯狂的东西。那时候才会发生有趣的事情。

让我稍微施加一点压力。我想要扩展话题,谈谈人工智能的一般情况。如果两年前你出现并说:“好的,这是微软提出的一个新的标准,用于访问网页和构建网站”,那么每个人都会说:“太好了,我们等着看谷歌对此的看法”,或者“等着看谷歌是否采用这个标准”。谷歌承受着巨大的压力。谷歌失去了许多信任。现在,OpenAI、Anthropic和微软有机会提出一个新的标准,并相信可能会实现真正的采用,而且谷歌明天无法提出自己的标准来打消你的幻想。这对你来说一定是真实的吧?你能感受到这些。

我会做的比较是这样的,在90年代晚期或者2000年代初,某人会宣布一个新的标准,微软会推出基于该标准的专有Windows变体,而另一种东西就会消失,这就是问题的一部分。你现在看到这种反映了吗?

我不知道。有时我试图闪烁其辞。我并不是在这里试图闪烁其辞。有时作为一名工程师,我觉得某些事情在技术上是不可避免的。我与微软内部关于MCP 的许多人进行过一些对话,他们说,哦,这并不完全是我们会选择的。我说,是的,但这似乎并不重要。有时在一个生态系统中存在真正的问题,每个人都可以选择采纳的最简单方案才是赢家,因为我们都会受益,因为普及性才是真正重要的事情,而现在我们似乎有很多这样的机会。

因此,我认为真正有益的一点是,其中一些已经变得非常简单,实际上不需要一个价值数万亿美元的公司做大量工作来创造adoption 迅速发生的条件。在某种程度上,通过MCP 和NLWeb,你实际上不需要一个大型科技公司来推动它。我们只是在这里说,“嘿,这是一个有趣的东西。它是开放的。拿去做你想做的事情吧,”这就是我能做的一切。在开放协议方面,我没有能力告诉任何人做任何事情。我们将把它放在阳光下,希望好事会发生。

让我们来谈谈人工智能行业的广泛情况。你将其描述为中局,我将其描述为第二幕。这项技术存在。每个人都在使用它。我们都玩过聊天机器人。一些记者被机器人要求离开妻子。我永远不会停止开这个玩笑。总的来说,你在最初的赌注中做对了什么,做错了什么?有什么让你感到惊讶的吗?

我认为我们通过基础模型的推理能力准确地发现了按比例定律变化的趋势。我认为我们在坚信这些趋势将继续发挥作用方面更多是正确的而非错误。我认为在增加模型推理能力方面,我们仍然有很大的进步空间,我不想轻视继续扩展规模实际上会有多么困难。但如果你拥有正确的资源和专注,这似乎是一组相当可解决的问题。

我认为目前困难的一点是,我觉得我们的模型具有超强的能力,实际上可以做的远比它们目前被用于做的要多。因此,即使在微软内部,我可能高估了人们会多快地充分利用基本人工智能模型的平台能力。所以我认为我们目前在产品方面有点落后了。"我们"指的不是微软,而是所有人,除了我们在软件开发工具中看到的迅速进步。所以我认为,在医疗保健领域,有很多地方可以做得比现在好得多。许多事情受到一些基础的管道工程问题的限制,这也是本次对话的主题。但很多时候,我们只是需要更多的公司成立,更多的产品推出,只是为了利用这些模型已经可能实现的内容。

而且有一点也是,我一遍又一遍地进行这样的对话。上周晚些时候我和开发人员聚会,有这种特别不利于指数级改进平台的保守主义。如果没有那种指数级改进的平台,它甚至不会看起来像保守主义。就好像有人会看着一件事情说,“啊,这对我来说有点太贵了,用来解决这个特定的问题”,或者“对我尝试解决的一个特定问题来说”,现在它的效用边际很低,所以它目前只有大约30%的准确性。但这只是边际性的效用。然后就是,“好吧,我得停下来等一等。”

这可能是正确的做法,除了暂停中等待的部分,因为在许多情况下,等待时间现在太长了。下次人们进去取样看看它是否变得更便宜或更有能力时,它已经超过了它所需达到的位置,然后你就为尝试将你的东西推向市场而来不及了。所以我认为这是一个我一次又一次看到的情况,我们集体犯了的错误,我们的模式匹配不如它本应该的那样好。

Nilay Patel:是的。你说的是,即使产品现在还不是百分之百完美,你也应该设想它们。

凯文:是的。

Nilay Patel:你提到这点很有趣,因为你是微软与OpenAI合作关系的设计师之一。几年前你曾出现在节目中。我问过你关于这段关系的事情,以及它的起源,你用平台的术语来描述这段关系。微软是一个平台公司,很显然Azure是一个庞大的平台。你说,“OpenAI在平台愿景上与你们保持一致,我们希望共同构建平台,因此我们想要建立合作伙伴关系。”

两年来,情况已经发生了变化,我想说。这些公司之间可能有点拉开距离,甚至很大。我前几天看了参议院关于人工智能的听证会,注意到微软的布拉德·史密斯和OpenAI的山姆·奥特曼坐在桌子的两端。OpenAI现在更像是一家消费类公司,对吧?很明显,它正在试图制作大型消费产品,而不是平台产品。Anthropic我认为比OpenAI更像是一家平台公司。你现在如何看待这种关系?它已完全解耦了吗?你们还在一起工作吗?你们还在努力建设一个平台吗?

我仍然花费大部分时间处理OpenAI的事务,其中涉及大量的技术内容。作为一名工程师,我们一起构建庞大的计算系统。OpenAI是微软Azure的重要客户。它的工作负载实际上占据了我们平台的一个相当大的部分,尤其是在人工智能计算方面。因此,我们一直与OpenAI合作,努力确保我们正在构建的东西符合其需求。我们之间仍然有大量的工作,涵盖了从如何优化我们正在构建的基础设施,到如何对我们训练的模型进行优化,使其真正成为平台组件。我们仍然在运营一个联合部署安全委员会,致力于确保我们发布给公众的内容在发布前经过了严格、负责任的人工智能审查。所以是的,我们还有大量工作要一起完成。

如果你仔细听的话,你会发现与之前所说的有质的不同,对吧?

凯文:“OpenAI是我们在Azure上的大客户,有着大量的工作负荷。” 当然,每个人都与他们最大的客户密切合作。之前是“我们相互依存,他们的模型正在为公司中的每个Copilot提供动力。” 这听起来很像微软已将OpenAI 从独立技术伙伴的范畴转变为我们密切合作的大客户。

这与我们拥有的任何其他大客户都非常不同。它正在Azure超级计算机上训练的模型仍然对微软正在构建的东西非常重要。它正在构建的组件是Azure平台的重要部分。因此,它既是客户,也是平台建设伙伴。看,它正在尝试独立完成一堆事情,与我们无关,比如ChatGPT。这太棒了,因为它在ChatGPT方面的成功正在帮助为Azure平台增加很大的压力。

这是另一个一致的事情。我不知道上次我们讨论OpenAI 合作时是否提到过这一点。但是在我们进行第一笔交易时,是什么时候呢,五、六年前吧,我的一个核心主张是,我们需要世界上最好的人工智能工作负载在Azure 上运行,这样我们就能确保Azure 在未来的人工智能工作负载方面以世界一流的方式构建自己。因此,ChatGPT 越成功,Azure 就会变得越好。

谈到那些人工智能工作量,我的同事汤姆·沃伦报道说,埃隆·马斯克和xAI 正在准备在Azure 上托管Grok。他告诉我要问你是否微软内部对与埃隆合作感到焦虑,以及是否可以信任该公司,特别是涉及这些其他依赖关系。你感到焦虑吗?

我实际上并没有完全参与到那个对话中。我知道我们正在做这件事。在Azure上的模型市场,我们正在尝试做的事情是确保所有开发人员想要使用的优秀开源模型都可以轻松获得和使用。所以我们能提供的一切,在那里我们都提供。

Nilay Patel:在微软,您还负责控制GPU 预算吗?

凯文:不,我不会。

Nilay Patel:这是几年前你对我说的一句话,我从未停止思考过。你不记得了吗?

我不这么认为。谢天谢地。

发生了什么?是不是觉得这太过分了?因为你把它描述成一份可怕的工作,是吗?

凯文:哦,这是一份可怕的工作。是的,真的,非常非常。

Nilay Patel:压力需求GPU是否有所减轻还是增加?

由于路透社等机构的报告显示,微软已经放缓了部分数据中心投资或将其重新分配,因为随着模型运行成本的降低,像DeepSeek这样的技术已经出现。

凯文:我们仍在紧急部署容量。我将要说的是,如果您坐在微软内部,正在与所有正在开发人工智能产品或进行人工智能研究的团队交谈,我看到的是,由于任何技术趋势,对更多GPU的需求并没有减少。

Nilay Patel:你认为我们能在当前硬件上实现人工通用智能(AGI)吗?这是一个现在在这个行业中我时常听到的议题。

我甚至不知道什么是AGI,这是我写书多年来一直感到困惑的事情。我认为首先你得定义清楚你认为这意味着什么。我认为如果你看看目前推出的一代硬件,我们正在从正在部署的下一代硬件中获得很大的性能优势。因此,如果你在思考未来12个月会发生什么,那将是对每个人系统整体性能的相当大幅度的提升,因为目前这一代硬件和你在其上可以做的优化都是非凡的。

你认为我们会因为优化还是因为硬件更强大而获得更多的容量?

这是中文翻译: 事实上,绝大多数性能提升都来自优化,所以每一代硬件都能在性价比上实现2倍的改善,这绝对是非常了不起的。你从来没有在摩尔定律的18个月内得到过这样的提升。那要慢一些,所以这里的硬件进步令人惊叹,但堆叠在硬件之上的软件性能优化甚至更大,因此,当将这两个因素结合在一起时,我们每年或更长时间都可以非常可靠地实现数量级的提升。

我们如何描述那些优化?因为模型性能的许多早期进展仅仅来自于增加更多数据对其进行训练,对吧?我们只是让模型变得更大,这就是它们变得更智能的方式。

这是一堆事情。根据你训练模型的方式,会有很多事情。很多成功之处在于能够有效地使用较小的数据类型来存储模型的激活值,无论是在推断还是训练方面,这意味着你可以并行进行更多的算术运算,因为你在算术运算中使用的是较小的数字。我是说,真的很疯狂,看到从训练方面所做的优化广度,到只是彻底重写推断栈的数值核心操作。

然后,您可以使用标准的计算机科学技术来进行提示优化和缓存,并使用多个模型来提供提示。您并不总是需要将每个提示发送到最昂贵的模型中。我们现在拥有足够大的模型组合,您可以选择使用超高性能优化但不太通用的模型来处理某些事务,并将更复杂的事务发送到更大、更昂贵的模型中。这几乎就等同于现金优化。

很有趣。当我和其他机器智能公司的CEO交谈时,他们将那种编排描述为关键,而你谈论的是MCP是关键,我好奇哪一个必须先到位。我们在编排方面做得相当出色。

我再次思考,回到这种能力过剩的问题上,我认为我们在这些模型中的推理能力现在比我们实际使用的要多,因此我的假设是,阻止我们获得更多有用东西的原因之一仅仅是行动,整个行动空间现在受到了太多限制,所以我并不是说这是非此即彼的选择。我只是认为,要让这个行动空间开放起来将是非常艰难的工作,所以我们需要像当前在处理生态系统一样着手解决这个问题。

我想要以谈论我最喜欢和你谈论的事情来结束。这件事就是科技和艺术之间的关系。你写了一本书。书名叫《重新定义美国梦想》。我们第一次交谈时,就是关于那本书的。值得一提的是,书的前言是由现任美国副总统杰德·万斯写的。我想在那时你是没有想到这一点的。

凯文:没有,我没有。

你确实看到了关于AI如何重塑经济或至少威胁到经济的许多内容。当我们谈到模型变得更加强大以及它们变得更加强大的方式时,仅仅通过摄入更多数据来使模型更加强大的想法已经达到了一个限制,对吧?

我们已经整合了所有数据,现在关于这些数据整合是否合法以及是否应该得到补偿的诉讼很多。你是一名作者。我会尽可能简单地向你提出以下问题。如果我站在书店外,拦住每一个来找你书的人,并说:“我可以为您做一个关于这本书的播客。您只需给我发个短信,我就会发送给您一段完整的书籍摘要播客。”您认为这样会增加还是减少您书的销量?

好的,我会说一些关于凯文的事情,我不确定你是否可以或者应该将其概括到一般的作者身上。我不介意别人对我的书内容做任何他们想做的事情。

以书销售为生计?

是的,这就是为什么它非常非常不同。我认为,如果你把所有的时间和心血投入到创作中,你应该得到报酬。现在,我认为有很多不同的方式可以得到报酬,我甚至觉得我并没有密切关注许多诉讼的进展,所以即使我可以评论,也不会是有用的评论。

但是我认为回到我们开始的谈话,我认为在这个智能体网络中拥有开放协议的一个可能非常好的地方是,制造东西的人可能会获得更多,特别是在整个景观还没有真正弄清楚商业模式是什么的开始阶段,我认为人们可以参与其中并在商业模式方面拥有更多主动性。我认为现在人们非常重要的一点就是要认真考虑这一点。

Nilay Patel:你在ChatGPT发布该工具时制作了一部吉卜力工作室的迷因吗?

凯文:没有,我没有。

Nilay Patel:你没有?好吧。我很好奇。很多人都这样做了。我并不表示我没有。关于这点,作为一个在这里创作的人,作为一个创作者自己,有很多人的生计取决于对他们的创作进行经济交换,他们对人工智能行业的广泛批评是,你们已经创造了所有这些能力,也许比我们现在使用的能力还要多,但我们没有得到任何回报。我们现在已经深陷其中了,对吧?第二幕,中间局面,但似乎并没有改变,除了一些诉讼。我只是想知道你的想法是否有所发展或成熟。

我认为一开始我对这个问题的思考方式就是我现在对它的看法。所以我绝对不希望看到任何事情让宫崎骏创作更少美丽的作品。我可能是世界上对他和吉卜力工作室多年来所做的事情最狂热的粉丝之一。我觉得这是在20世纪和21世纪初创造的一些最美丽的艺术之一,所以是的,像那样的人。我希望他们有世界上每一种动力去做更多他们正在做的事情。

凯文:这个平台的问题在于,我直接说出来吧。我并不是特别对这些图像生成器感兴趣。我感兴趣的是一个能够为我住在弗吉尼亚州中部农村的母亲进行医学诊断的模型,她没有真正高质量医疗保健的途径,而在美国有数以千万计像她这样处境困难的人。

他们会希望有更多的,“嘿,我是JJ艾布拉姆斯的粉丝,喜欢他的声音和作品。给我更多这样的东西,而不是像一些少年从图像生成模型中得到的随机垃圾。”但这是一个非常重要的辩论。我不希望这件事掩盖另一件事,那就是这些工具可以极大地帮助解决一些非常重要的问题。我们不想让我们正在进行的重要对话阻碍我们推进这项其他同样重要的工作,这也是非常重要的。

Nilay Patel:有趣的是,你描述的更多或更少是在特朗普解雇国会图书馆馆长和版权登记员之前版权局发布的框架,这似乎适得其反。现在,这个职位上的人员更加支持版权最大化,因为那份报告说一些用于训练数据的用途显然是合理使用,如学术研究。

根据版权局上周发布的初步报告中的引语,我只会将其念出来:“利用大量的受版权保护作品进行商业用途,制作与它们在现有市场上竞争的表达内容,尤其是通过合法途径取得的情况下,未经许可擅自使用这些东西,超越了已经设定的各种界限。”

那么就存在一个区别。有一些领域,比如医学影像,这种技术的效用非常高,工作具有极大的改变性,这可能是可以接受的。然后有一些领域,你只是复制了世界上的每个YouTube视频,让人们制作更多YouTube视频,这可能就不太行。你能想象一种框架,适用于微软正在构建的工具,你会说这是我们要做的事情,这是我们不准备做的事情吗?

我认为我们愿意进行任何理性的对话。我认为你只需要出现,对于基本技术可能和不可能的一些技术限制和约束,但我认为这里有丰富的对话可以展开。还有这么一件有趣的事情,我认为,日益增长地,你准确地指出我们已经耗尽了所有可用于训练模型的数据,所以我们现在处于这样一个阶段,这些系统的一大堆被训练成使用一套不像以前那样依赖数据的技术,因此可能有各种技术方法可以增强模型的推理能力,这些方法不太依赖于在某个时候摄入大量有机数据标记。

凯文:这也是真的,我认为上次我们谈到过这一点,对数据质量有了越来越好的理解,一份数据令牌对模型推理能力的贡献有多大,然后最重要的是,我对所有这些东西的一个怜惜是将模型视为数据库,作为信息检索系统,这种想法有点,你想谈谈一个不太优化的系统。从效率的角度来看,它们作为数据库有点糟糕,因此,再次回到像NLWeb 这样的东西,就是一个模型,它已经学会了如何推理,就像你可能教会生物大脑如何去推理一样。

一旦你具备一定水平的推理能力,有趣的事情是逐个提示,逐个任务,你有哪些信息可以访问进行推理?你如何将这两件事进行货币化,以及业务之间的分配比例可能会有很大差异。例如,如果你需要一个推理新闻的模型,如果你拥有类似NLWeb和一堆新闻媒体的订阅,你可以在用户授权令牌的发布者同意的情况下提供智能体访问这些订阅,然后让模型对这些信息进行推理。你支付订阅费用来拥有这种短暂的内容供推理。因此,我认为随着时间的推移,我们可能会找到各种解决业务模式问题的方法。

想要将这一切融合在一起。听起来,随着新的搜索项目NLWeb的推出,以及对MCP的投资并希望使其更加普及,你似乎正在试图为网络创建一个全新的架构转变。这是新型的网络,你正试图植入并激励其建设,因为旧网络的交易似乎已经完成。这样的描述是否公允?

我不知道旧网络的交易是否结束了,但我认为现在是我们考虑一些新交易的时候了。我认为当我们都在集体考虑新事物时,我们应该像每位优秀的建筑师一样去思考新的事物。就像,过去几年里对所有相关方和利益相关者来说有什么运作和未运作的,然后让我们努力去创造一些更好的、适用于所有人的东西。当所有人的激励是一致的时候,我们将达到最好的结果,创作者和消费者的利益得到平衡,没有一堆奇怪的中间人限制价值和效用的交换方式。

Nilay Patel:嗯,祝你好运,因为到目前为止,创作者们对于他们的激励措施有非常明确的看法。凯文,我显然可以和你聊上一整天。你得快点回来。我想要密切关注这个网络项目,并看看随着时间的推移它的进展如何。

凯文:非常感谢你邀请我。

“情商”的概念指的是识别、理解和管理自己的情绪以及他人的情绪的能力。

https://www.theverge.com/decoder-podcast-with-nilay-patel/669409/microsoft-cto-kevin-scott-interview-ai-natural-language-search-openai

展开阅读全文

更新时间:2025-05-28

标签:科技   斯科特   微软   智能   事情   方式   模型   人工智能   网站   东西   网络   更多

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号

Top