解决百年数学难题谷歌智能体展示强大编程能力 Agent最适配场景呼之欲出？|AI_新浪财经

《科创板日报》5月15日讯今日凌晨，谷歌Deepmind在官网发布了AI Agent工具AlphaEvolve，基于Gemini 2.0大语言模型，自动化算法发现过程，解决传统算法设计和科学发现中依赖专家直觉和手动迭代的局限性。

值得一提的是，这款智能体是被专门用于设计高级算法的编程AI Agent，其能够衡量大模型生成想法与算法的可行性并加以筛选。在性能测试下，AlphaEvolve将大规模矩阵乘法运算拆解为更易于处理的子问题，使Gemini模型架构中的核心计算效率提升了23%，节省了大量成本。

为展示AlphaEvolve的能力，谷歌试图令其解决数学难题——亲吻数问题。这道题的历史最早可以追溯到1694年，牛顿还和别人辩论、研究过。其难点在于给定维度的空间中，最多可以有多少个相同大小的球体同时接触一个中心球体，这些球体之间不发生重叠。

结果是，AlphaEvolve发现了由593个外层球体组成的结构型，并在11维空间中建立了新的下界，超越了之前数学家们创造的纪录。

事实上，近期各个科技巨头在AI编程等软件开发领域的商业化动作频频。同样在今日凌晨，OpenAI宣布，应广大用户的要求，专攻编码任务和指令遵循的专用模型GPT-4.1即日起将直接在ChatGPT中提供。

据介绍，在基准测试中，GPT4.1在编程能力方面获得54.6%的成绩，较GPT4o提高了21.4个百分点，较GPT4.5提高了26.6个百分点，成为当前领先的编程模型之一。与此同时，GPT-4.1在小模型和驱动智能体方面表现突出，可广泛应用于真实世界的软件工程、大规模文档洞察提取等复杂任务，且无需过多人工干预。

国内方面，阿里云通义灵码AI程序员已全面上线，开发效率提升数十倍，已在哈啰集团、长安汽车等公司被应用。腾讯云AI代码助手已接入DeepSeek-R1，代码生成准确率提升30%。

有券商指出，2025年将是AI Agent元年，也是软件大革命的起点。编程领域的规则明确性为Agent应用提供了天然约束框架，编程环境的技术特性为Agent自纠错提供了理想试验场，同时编程原子化任务与大模型链式推理机制深度契合。

西部证券表示，AI大模型在编程中的应用发展分为三个阶段，目前各大厂商产品多处于第一阶段向第二阶段迈进的关键节点：

从投资层面来看，该机构认为，国内软件目前估值水平普遍较低，存在显著修复空间。类似“云化”，当前国内软件公司的估值修复可基于“AI化”程度，AI化程度越高即AI收入越高时，估值越高。