谷歌发布了一款性能卓越的智能体,成功攻克了悬而未决300年的数

昨日凌晨,谷歌DeepMind在官网推出了一款专为设计高级算法打造的编程AI智能体——AlphaEvolve。该智能体与谷歌的大型模型Gemini高度融合,能够自动评估并优化通用算法,助力开发者快速研发出高效且优质的矩阵计算算法。简言之,尽管大型模型能够生成各种创新的算法思路,但其实际效果难以确认,而AlphaEvolve则充当“质量检测者”的角色,根据特定标准对这些算法进行可行性评估。


在展示AlphaEvolve强大能力时,谷歌特别选取了已有三百多年历史的数学难题——亲吻数问题。这一问题最早可追溯到1694年,甚至牛顿曾对其进行过讨论和研究。核心难点在于,在特定维度的空间内,最多能有多少个尺寸相同的球体同时接触一个中心球体,且这些球体之间不会互相重叠。


AlphaEvolve成功识别出由593个外层球体组成的结构体,并在11维空间中创下了新的下界,超越了此前数学界的纪录。除此之外,AlphaEvolve还能为复杂数学难题提供创新的解决方案。借助简洁的代码架构,它设计出了一种基于梯度的新型优化程序的多个关键模块,同时还发掘出多种全新的矩阵乘法算法。

AlphaEvolve研发出了一种适用于4x4复数矩阵乘法的新算法,仅需48次标量乘法,超越了1969年Strassen提出的此前最佳方案。这一成果标志着相较于谷歌此前专注于矩阵乘法的项目AlphaTensor,取得了显著的突破。与此同时,谷歌还利用AlphaEvolve优化大型模型的训练与推理过程。通过将大规模矩阵乘法任务拆分为多个更易处理的子问题,AlphaEvolve提升了Gemini模型架构中的关键计算效率23%,整体训练时间缩短了1%,从而大幅降低了成本。


AlphaEvolve还具备优化GPU底层指令的能力。由于这一领域极为复杂,且编译器通常已经进行了深入的优化,因此人类工程师很少直接对其进行调整。通过AlphaEvolve,基于Transformer的人工智能模型中的FlashAttention核心计算实现了最高32.5%的加速。这种优化帮助专家更精准地识别性能瓶颈,并能轻松将改进成果整合进代码库,从而显著提升工作效率。

关于AlphaEvolve的架构简述,其核心组成之一是任务定义与评估模块,该模块负责明确用户需求,包括设定评估标准、提供初始方案和相关背景信息。系统通过自动化评估机制对生成的解决方案质量进行衡量,该机制以函数形式存在,将方案映射到一组可量化的评估指标上。这些指标通常是需要最大化的目标。例如,在处理数学问题时,若目标是寻找满足特定条件的最大图,该评估函数会调用进化生成代码构建图形,验证其属性,然后以图的规模作为评分依据。


大模型集成与提示采样模块负责构建丰富的上下文提示,这些提示包括问题的详细说明、相关方程式、代码片段以及参考文献等明确信息。为了增加多样性,系统还采用随机格式化技术,通过概率分布引入多种由人工撰写的备选表达。此外,该模块会展示执行后的评估结果,包括程序运行情况和评估函数给出的评分。元提示进化机制则由大模型自身在额外提示生成阶段提供指导性指令和上下文信息,这些内容与解决方案代码共同存储于独立数据库中,帮助模型获取更多背景知识,提升生成代码修改建议的准确性和有效性。

创造性生成与代码修改是AlphaEvolve的另一关键部分,依托大模型强大的理解与生成能力,提出针对现有代码的优化方案。大模型能够利用丰富的上下文信息,结合此前的尝试和灵感,设计出更优的改动方案。在具体操作中,AlphaEvolve会要求模型以差异块的形式输出代码修改,以便针对某些特定部分进行精准更新;但在代码较简短或需要整体重写时,也可配置为直接生成完整代码块,跳过差异格式。


评估与反馈模块负责监控AlphaEvolve的发展进程,并决定哪些新提出的方案能够在后续的进化代中继续传播。每个由大模型生成的解决方案都会自动执行用户定义的评估函数进行评分。为了提升评估的灵活性和效率,AlphaEvolve引入了若干可选机制:例如,评估级联允许用户设置一系列难度递增的测试,只有在前期测试表现优异的方案才会进入后续更高难度的阶段;此外,大模型还能生成辅助反馈,以更全面地评估那些用户评估函数难以精准衡量的特点;同时,还支持并行化评估,通过异步调用评估集群来分配任务,从而显著提升评估速度。

进化与数据库管理模块则负责存储和管理整个进化过程中产生的解决方案,这些数据被集中保存在进化数据库中,目的是在后续代中有效地复用之前被发现的优质想法。设计这一数据库的核心难题在于如何平衡探索新方案和利用已有最佳方案,以确保持续进步的同时维护方案多样性,激励全面的搜索。为此,AlphaEvolve借鉴了MAP精英算法和基于岛屿模型的种群进化策略,构建了独特的进化数据库管理机制。


分布式计算管道模块赋予AlphaEvolve以异步处理能力,使其能够作为一个流水线系统运行。当某个计算任务需要依赖尚未完成的结果时,便会暂时暂停等待。该管道设计侧重于提升整体吞吐量,而非单个计算的执行速度,旨在在既定的总体计算资源限制内,最大化可生成和评估的方案数量。


目前,感兴趣的用户可以前往谷歌DeepMind官网申请使用AlphaEvolve,这对于从事科研、数学及设计相关工作的朋友尤为有益。

·


我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。


欢迎关注“福大大架构师每日一题”,让AI助力您的未来发展。

·

展开阅读全文

更新时间:2025-05-17

标签:科技   悬而未决   性能   智能   卓越   模型   代码   算法   方案   模块   乘法   矩阵   球体   函数   机制

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号

Top