启明星 | 星环科技孙元浩：通用大模型应提升模型精准度和模型效果，才能真正具备竞争力_新浪科技

编者按：在2024向星力·未来数据技术峰会上，启明创投投资企业星环科技（688031.SH）创始人、首席执行官孙元浩宣布，星环科技的定位从Data Infra进一步延伸到AIInfra，为企业客户打造AI基础设施，建立从语料处理、模型训练、知识库建设等一整套工具链，帮助企业快速建立行业大模型。

峰会期间，孙元浩接受了澎湃科技的采访。他分析指出，企业用户对于模型的需求是高精准度及解决实际问题的能力，因此，大模型的新趋势是用RAG（检索增强生成）和Agent（智能体）技术提升模型精准度。针对大模型落地的核心难点，孙元浩表示高质量语料是关键，他提出了例如构建用于推理的知识图谱的解决方案。

启明创投微信公众号经授权转载。

星环科技创始人、首席执行官孙元浩

“大模型卷价格对企业用户来说帮助并不大，企业用户对模型的精准度要求高，通用大模型更应通过提升模型精准度和模型效果，赢得竞争力。”企业级基础软件供应商星环科技创始人、首席执行官孙元浩日前在2024向星力·未来数据技术峰会期间接受澎湃科技采访时作出上述表示。

01/

企业用户对于模型的精准度要求很高

希望能够解决实际问题

近期，中国通用大模型价格战打得火热，科技巨头纷纷参战。孙元浩表示，这是由中国特殊生态造成的。在他看来，企业用户对于模型的精准度要求很高，希望能够解决实际问题，当前即使是市场上最大参数的模型也未必能达到企业要求，所以降价对企业用户而言帮助有限。“企业的要求远比现在的模型能力高很多”。

在孙元浩看来，仅依靠低价很难让用户形成粘性，“降价是为了给开发者提供低廉的Token价格，基于通用大模型开发应用，从而试图构建生态，收集高质量数据。但事实上，模型是很容易被替代的，用户想换就换，因为接口全部是自然语言，没有额度限制。”

去年，孙元浩判断，要让大模型变成“理科生”，成为专业领域的专家模型。今年，他认为大模型的新趋势是用RAG（检索增强生成）和Agent（智能体）技术提升模型精准度。“现在大家又开始开发Agent，可能马上会出现成千上万个Agent，这可能是现在大模型能力不够造成的，模型没办法聪明地学习现在该用什么工具、怎么用，构建Agent的过程就是教大模型怎么使用内部工具。”

02/

高质量语料是解决行业大模型幻觉

及可信可控等核心落地难点的重要手段

目前，通用大模型数量快速增加，并不断升级迭代，但却不能完全适应企业AI应用需求。企业对行业大模型需求增加，迫切需要降低使用门槛。“现在每个大模型应用开发都要很久，重复训练量很大。我们想把整套AI基础设施建好，用户再在大模型上开发应用就快了。”孙元浩表示，过去一年帮助企业客户落地大模型时，发现每个环节都遇到了挑战。为此，星环科技开发了语料处理、模型训练、知识库建设等工具链，就是为了帮助企业建立行业大模型，快速使用生成式AI（AIGC）。

在AI基础设施中，星环科技无涯大模型Infinity可为各行业定制自有大模型，提供意图理解、语义召回、数据处理和分析能力。基于无涯大模型，星环科技推出无涯·问知、无涯·问数、无涯·金融、无涯·工程等AI原生应用，可应用于金融、能源、制造、工程等领域。

孙元浩表示，大模型擅长生成文本，但回答严肃问题不可控，为此团队经过微调、增加语料，将模型训练成“理科生”，同时将企业内部数据知识化，利用RAG提升模型准确度。

语料质量决定了模型质量，高质量语料也是解决行业大模型幻觉、可信可控等核心落地难点的重要手段。孙元浩表示，大模型结构已不是秘密，训练方法也不是秘密，但语料散落在各种地方，导致工作量大，“目前最大的挑战是把现有资料整理起来训练或微调模型，企业应用要求100%准确，所以用现在的语料还不够，我们正在构建知识图谱用于推理，再结合大模型提升准确度。”

来源 | 澎湃科技

作者 | 张静