意见领袖 | 马天平
2022年底,OpenAI的ChatGPT横空出世,掀起了人工智能语言大模型(LLM,Large Language Model)新浪潮,在全球经济活动中,大模型也正扮演着愈发重要的作用。
生成式人工智能DeepSeek作为2025年中国发布的参数量约为OpenAI一半多的大模型,并没有走向上万亿个参数的“参数越多越好”的模式。但却在性能上超越了现有的很多开源模型,还在一些评测中不输于世界顶尖的闭源模型,这成为中国发展人工智能大模型的一个标志性事件。
这一科技创新事件,激发了中国市场的经济信心。因中国以更低能耗实现同等效果的轻量模型方式,在人工智能领域实现了创新。这让上下看到经济转型的成效与更进一步高科技、高质量发展的可能性。深度求索DeepSeek-R1作为全球开源中的一例,“绿色、低碳、高效、前沿”、“高质量、高科技、低成本、小规模、小能耗”、更强的“泛化性、涌现性、推理性”一系列标签,给“经济新旧模式和新旧动能转换”的追求打了一针强心剂。
01
为什么会出现“中国式”大模型?
近年来,尤其是2024年9月以来,政府尽力避免出台收缩性负面政策,产业政策体现出呵护和休生养息的态势。产业政策的变暖,叠加中国几十年已经积累形成的技术进步,形成了厚积薄发。人工智能在助推中国经济结构转型上,开始逐步结出各种果实。
DeepSeek并没有走20年前依赖数据标记的监督型机器学习之路,也没有走MLP(多层感知器)、CNN(卷积)等神经网络算法架构的“烧钱”之道,而是直接在Transformer算法框架基础实施算法创新。抛弃常用的监督微调(SFT,Supervised Fine-Tuning)和强化学习PPO(Proximal Policy Optimization)架构,首先在预训练的基础模型上提升算法效率和芯片沟通效率:选择MLA(Multi-head Latent Attention,多头潜在注意力机制)结合非追求最高精度的混合精度训练方式,以及MoE(Mixture-of-Experts,混合专家)实现参数协同,叠加PTX(Parallel Thread Execution,并行线程执行)语言调整芯片之间的通信互联;其次是后训练的推理模型上放弃初始人工标注、放弃有监督学习,让大模型自身生成思维链并自动迭代后再人工标注;最后是不区分推理和基础大模型,让推理模型反向改进去融合基础大模型,实现闭环迭代。
这反映出中国在全球化的基础上实现“人有我优”,走的是开放式创新之路,既遵循 GPT式的预训练路线,又遵循GPT以强化学习为核心的后训练路线,而不是封闭式的自造之路。
关键是,杭州深度求索公司作为一家民营的、主营业务为非实体的、非人工智能的中小企业,并没有耗用政府举国之力的公共财政资金,却做出了不亚于国有企业的创新成果,这也充分反映了中国民营企业的活力、中国民间创新的潜力,证明了中国市场经济的强大韧性。
02
人工智能大模型如何助力中国经济?
企业处于被政府管理和监督之中,也处于行业竞争之中。如果从企业的“政府方、行业方、自身方”三方来看,在经济活动决策中,企业可以在各类人工智能模型基础上结合语言大模型的方式,形成各种“新质生产力”。
首先,从政府看,企业可以利用人工智能分析全球不同政府制定不同政策情景下的经济和环境影响,为科学决策提供数据支撑。尤其是中国政府作为强大的政府,高密度的中央部门文件与各个地方部门政策形成的文字、图片、数据,可以成为企业的模型资料库,有助于企业对政府政策方向明晰界定,从而决定自身的战略方向。当政府出现政策逆转的边际变化时,计算模型通过添加“约束”性数学条件来改变企业目标,例如政府对房地产企业“三条红线”的实施,使得房地产企业在制定新的计划时,将受到强制性参数的约束,该约束条件将提示,禁止子企业向任意地区买地,确保政府监管成本最小化,企业违法违纪成本最小化。而且,经过调整的新数学模型输出的结果,会通过LLM转化为易于理解的政府语言答案,帮助政府决策者了解企业在被管理和被调控中的具体影响。这种方式不仅提高了政府监督企业产出过程中的透明度,还使得非技术背景的政府权力方能够及时、提前或同步了解技术性企业是否被有效监管,而不是事后检查与事后罚款。
其次,从行业看,企业从全球行业以及中国本土供应链上下游信息中,获得海量详尽数据。通过对行业信息建模,实现对行业中竞争对手的评估把握,从而进行差异化但又千变万化的产品设计、材料选择。对行业的历史变动进行针对性搜索,对行业历史科学文献深度挖掘,从而预测未来的行业趋势,帮助企业提前规划在行业中的竞争策略。不仅如此,可以与行业中的供应商、客户、投资者分别建立基于LLM的沟通交互平台,共享数据。在交互中,大模型利用对方的人工查询和交互提问,转换为新的学习资料,对自身的原始模型进行优化,从而更好地适应对方供应商、客户、投资人的具体需求。LLM也可以更有效地与公众沟通,确定新闻媒体对企业产品及盈利水平变化的立场,形成叙事技巧,完成诸如社会责任、公众舆论、社交媒体帖子、科普文章、互动体验问答等。
第三,从内部看,企业可以利用自身的细节内部数据优化运营。企业内部的细节数据包括能源使用量、新增软件代码量、会议次数、生产数据新增量、企业内部前台与后台的供应链数据等,通过人工智能模型进行能耗测算、知识产权生产评估、员工工作情绪状态捕捉、生产流程对接,从而确定供应链前后台的松弛状态,测算潜在的优化空间,提高自然资源和人力资源利用率,降低运营成本。尤其对于有成千上万种细分品类和几万道工序的制造型企业,利用人工智能模型优化调度,减少制造足迹,将生产时间缩短或原料耗材缩减。在物流网络规划、设备运行运维、客户服务等方面,精准定位,自动监控设备状况并预测故障,自动生成精确的设备“体检报告”,从而最大限度地减少设备停机时间,确保持续生产。在生产链条上,自动读取实时和历史数据,综合分析并给出评估报告及建议。同时,利用LLM智能交互和推理决策能力,快速生成满足高实时性和强可解释性需求的内部文档。对产品生产线进行极短时间和高准确度的评估,实时识别质量缺陷,立即纠正、减少浪费,实现迅速又精确的质量控制效果。
总之从宏观经济运行的细胞看,企业可以充分利用各种计算模型,融合LLM能力,不仅能实现自动化数据处理,还能通过情境学习和生成式输出,助推企业实现经济效益。多模态模型,能够整合政府、行业、员工等多源数据,构建更精准的管理体系与风险预警体系,提高应对不利变化的能力。同时利用灵活的深度学习模型,来填补传统建模中的空白,从而在多种异构数据集上使用,大大简化计算成本,但却能保持泛化能力。既不用像过去要投入过于昂贵的计算成本,又能让准确性达到前所未有的新水平。企业在各种模型下得到大发展,则中国经济将更能实现高质量发展。
03
是否需要防范过热的“中国式大模型经济”?
过去的经验看,中国很多企业喜欢一哄而上,然后一地鸡毛。每个企业是否需要上线语言大模型,需要客观评估。如果政府强推、宣传、倡导、补贴企业强上大模型,或者国有企业和地方官员为了迎合热点新潮,为了让自己的工作看起来属于创新,可能陷入尬上大模型的形式主义做法,实际将对经济造成虚假繁荣和实质伤害。
例如,当企业的生产模式较为简单时,通过Excel表格测算即可,最多在EXCEL表格里调用几个诸如VLOOKUP函数即可完成,那么没有必要引入复杂的AI系统。而且,对于一些个体户或小中型企业来说,投资于先进的AI解决方案,实际上并不符合投入产出原则,尤其是在没有做好成本与收益测算的前提下。
而且,大模型本质上仍是一种概率模型,基于不同数据、报表、场景、模板和计算流程,会得出不同的概率结果,并不是刚性的100%一致和不变,无法提供绝对的确定性。即使不计成本地上线了大模型,但公司的数据量不足,数据不符合大模型训练的基础条件,也会导致大模型运行的结果并不有效。
就以杭州深度求索公司主营业务为例,其是证券类投资交易公司,公司主要通过发行私募产品,利用定量方法做好资产管理策略,为投资人提供波动性回报。但从其过往产品业绩表现看,遇到不少的挑战。
试想,如果人工智能大模型能像提款机一样去市场交易提款,赚得盆满钵满,那么一个私募公司没有必要去做非主营业务的人工智能大模型。或者说,正是因为投资业绩遇到一定的挑战,为了更好提高产品收益率,才通过开发大模型优化策略。从这个角度上说,大模型策略不是在金融市场投资交易的“提款神器”。
因此,我们没有必要夸大大模型的边界,至少在高度随机性的证券投资交易市场,大模型仍是无力无能的禁区。
除了高度随机性的金融市场,在中国大多数实体经济微观活动中,企业团队应明白大模型的根本算法原理和能力边界,其实际上的“生成”仍只是高概率下的一种信息结果,不应对其产生迷信和幻觉。如果默认“生成即合理”,不加推演,惰性地使用,只会让团队的实际处理问题能力变差。
如果因为使用人工智能模型过度控制员工,让员工不再承担责任,或者出现了错误和事故,将责任推给算法模型,认为自己的处理权限完全被算法模型剥夺,则会导致公司员工激励机制出现问题。没有激励动力,就没有人会事先明确指出企业的风险和不确定性,甘愿变为机器人和工具人,不对企业最终盈利和风险负责。因此,企业管理层应公开公司AI系统的运作原理,适度在混合专家(MoE)架构上增加提炼,形成反馈,以便员工了解背后的逻辑,参与公司内部的模型训练,将AI作为辅助自己的工具而不是控制自己的工具,实现岗位价值的最大化。
人工智能模型,只有创新了活力,激发了信心,才能助推中国经济走向更繁荣。
来源:中国社会科学网
(本文作者介绍:全球宏观投资交易热爱者,大学老师,央行博士后,清华五道口金融学院兼职研究员。)
责任编辑:曹睿潼
新浪财经意见领袖专栏文章均为作者个人观点,不代表新浪财经的立场和观点。
欢迎关注官方微信“意见领袖”,阅读更多精彩文章。点击微信界面右上角的+号,选择“添加朋友”,输入意见领袖的微信号“kopleader”即可,也可以扫描下方二维码添加关注。意见领袖将为您提供财经专业领域的专业分析。