转自:经济日报
春节将至,中国人工智能(AI)公司密集发放节日大礼包,展现出2025年大模型竞争的新动向。仅1月20日一天就有4家公司推出新品:深度求索公司DeepSeek发布了DeepSeek-R1模型,月之暗面公司Kimi推出了k1.5多模态思考模型,两家公司新模型性能都对标OpenAI o1正式版。MiniMax海螺上线语音功能,字节豆包上线实时语音大模型,很明显是在对标OpenAI的实时语音功能。
自2022年11月美国人工智能公司OpenAI发布GPT-3.0引燃全球AI大模型热潮以来,全球科技厂商纷纷入局,密集上线大模型。
OpenAI的火爆来自“大力出奇迹”路线,以规模作为大模型的制胜法宝。但这也让AI大模型的发展陷入了一个怪圈:为追求更高的性能,模型体积不断膨胀,参数数量呈现指数级增长。这种“军备竞赛”型开发模式,带来了惊人的能源消耗和训练成本,难以为继。受大模型训练的高昂成本拖累,OpenAI在2024年的亏损额可能达到50亿美元,业内专家预计到2026年其亏损将进一步攀升至140亿美元。
而中国公司运用剪枝、量化、知识蒸馏等一系列创新技术,开启了大模型“瘦身”新风尚,走出一条“小而强”的新路径。以DeepSeek为例,R1在多个基准测试中与美国OpenAI公司的o1持平,但成本仅为o1的三十分之一。模型性能的追赶速度也很快,OpenAI推出正式版o1模型是在2024年12月,仅仅1个多月后,DeepSeek就发布了性能相当的R1模型。
DeepSeek的成功证明,大模型创新不一定要依赖最先进的硬件,而是可以通过聪明的工程设计和高效的训练方法实现。这种技术突破不仅降低了AI大模型的硬件门槛和能源消耗,更重要的是为AI技术普惠化铺平了道路。因为更小的模型意味着更低的部署成本、更快的响应速度和更广泛的应用场景。在医疗、教育、制造等诸多领域,轻量级AI模型都将带来革命性的转变。
从信息技术发展历史看,“小型化”进程也是大势所趋。计算机曾是占据整个房间的大型机,后来发展成可作为桌面设备的电脑,又进化为便携式笔记本。手机从古早的砖头式“大哥大”,改进为小巧的功能机,又进化至如今的智能终端。DeepSeek的成果,标志着AI大模型正在经历类似的进化过程。这种“小而强”的AI模型,将推动人工智能从实验室走向千家万户,从云端走向边缘端。
模型并非越大越好,而是越精越妙。大模型“瘦身”促进了AI技术的创新和突破。为了在减少参数的同时保持甚至提升模型性能,研究人员不得不深入挖掘模型架构的优化空间,探索更高效的算法和训练方法。这一过程推动了人工智能基础理论的发展,也为相关技术的跨领域应用开创了新局面。
当然,大模型“瘦身”没到终点站,仍面临诸多挑战。如何在保证模型性能的前提下实现最大程度的“瘦身”,是当前需要解决的关键问题。同时,“瘦身”后的模型如何在不同场景下保证适应性和稳定性,也需要进一步验证和优化。
在快节奏的商业环境中,高效、灵活、低成本的解决方案更具竞争力。追求极致性价比,一向是中国公司的强项。在诸多中国公司的竞争中,AI大模型正从曾经的“庞然大物”逐渐蜕变为轻盈高效的“智慧精灵”,在保持强大认知能力的同时,大大降低了计算资源的消耗。中国公司也从模仿者和追随者,逐渐转变为创新者和引领者。展望未来,大模型“瘦身”后必将走向更宽广的坦途。
【未经授权,严禁转载!联系电话028-86968276】
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
APP专享直播
热门推荐
男子用DeepSeek买彩票中奖引热议,网友:倒亏5块钱!中国体彩:再强大的AI也无法预测中奖号码! 收起男子用DeepSeek买彩票中奖引热议,网友:倒亏5块钱!中国体彩:再强大的AI也无法预测中奖号码!
- 2025年02月12日
- 13:29
- APP专享
- 扒圈小记
4,598
春晚人形机器人开售即下架?宇树科技回应
- 2025年02月13日
- 02:51
- APP专享
- 扒圈小记
1,767
43岁女子酒吧找00后男模,3个月花光450万公款!被抓后她说……
- 2025年02月13日
- 06:27
- APP专享
- 北京时间
1,728
![新浪财经公众号 新浪财经公众号](http://n.sinaimg.cn/finance/72219a70/20180103/_thumb_23666.png)
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 13:53:41
1、据网络平台数据,电影《哪吒之魔童闹海》总票房(含预售)已达到100亿元,成为中国影史上首部票房达到100亿元的电影。2、阿里巴巴联合创始人、董事局主席蔡崇信确认阿里与苹果合作,此前有报道称,苹果和阿里巴巴将合作为中国iPhone用户开发AI功能。据The Information报道,苹果仍继续与百度合作在中国为iPhone开发AI功能,以此分散风险。3、央行发布货币政策执行报告称,下一阶段,实施好适度宽松的货币政策。根据国内外经济金融形势和金融市场运行情况 择机调整优化政策力度和节奏。4、上海市发改委发布消息,延续实施免费申领新能源汽车牌照额度政策到2025年底,大力促进汽车更新消费。5、国家发改委郑栅洁表示,加力扩围实施“两新”政策,重点支持企业更新高端化、绿色化、智能化设备,扩大消费品以旧换新范围。6、7天5板光线传媒(sz300251):出品、发行的影片《哪吒之魔童闹海》正在热映中。7连板梦网科技(sz002123):公司与DeepSeek系统的开发、应用等核心技术无关。中国电信(sh601728):2月20日占公司总股本的62.7%的限售股锁定期届满并上市流通。7连板杭钢股份(sh600126):算力业务占比极小 不涉及算力核心技术的研发等。 -
趋势领涨今天 13:47:03
A股跌了一天,盘后央妈就发声呵护了:1、实施好适度宽松的货币政策,保持流动性充裕;2、把促进物价合理回升作为把握货币政策的重要考量。现在重点是央行什么时候降准?因为美联储降息预期降低,央行近期降准的概率不大! -
趋势领涨今天 11:35:14
【“惠“聚元宵】乐享头彩!即日起《潜伏擒牛》VIP课程全场六折,半年VIP课程低至881元/月;更有月课1088元/月,季课6折3088元/三个月。活动过后价格会提升,切勿错过!加入至尊擒牛VIP:享四大顶级服务 【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每日一份高端内部绝密文章:包含明日布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!赶紧戳,直接购买:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 11:34:23
华友钴业(sh603799)公告称,公司控股股东华友控股拟自本公告披露之日起1年内,通过上海证券交易所交易系统以集中竞价交易方式增持公司A股股份,增持总金额不低于人民币3亿元,不超过人民币6亿元。增持计划不触及要约收购,不会导致公司控股股东及实际控制人发生变化。 -
趋势领涨今天 10:36:30
【天成自控(sh603085):与广东高域签订战略合作协议 围绕eVTOL等方面开展战略合作】天成自控(sh603085)公告称,公司控股子公司广东天成与广东高域签订《战略合作协议》,双方将基于各自优势资源,共同围绕电动垂直起降飞行器(eVTOL)零部件及材料在技术研发和产品量产等方面开展战略合作。 -
数字江恩今天 09:49:26
最后,这里的c延伸,哪怕延伸也是末端了。不跌破支撑,还可以有时间,但今日高点之上的空间并不大。要控制仓位,而不是肆意重仓了。 -
数字江恩今天 09:49:21
图上的红线,是绿色方框震荡中最后一个低点,和绿色方框最低点,构成了回踩的两道防线。若不跌破红线则表示震荡很强,反之跌破绿色方框最低点则代表昨日拉高是诱多。明日核心是防御,只要回踩不跌破支撑位,那么震荡后下周还要再起一轮。 -
数字江恩今天 09:49:10
昨日已经明确了,拉起为延伸结构,延伸结构主要是看支撑,这里便看1分钟图。图上的绿色方框是之前3300-3330的主体震荡区间,昨日尾盘拉起来之后,今天构造了1分钟级别的顶背离,这也是尾盘下跌的原因。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:48:59
板块来看,今天出现了非常明显的变化。前期强势的deepseek概念、机器人(sz300024)概念今日都出现了较为明显的回踩,部分高位股还跌幅较大。而低位的传媒、酿酒、农林牧渔、地产建筑建材、金融却轮番上涨,但能坚持全天的,也就是传媒、酿酒和农林牧渔。 -
数字江恩今天 09:48:53
A股两市今日成交7058 + 11140 = 18198 亿人民币,相比昨日放量明显。大盘窄幅横盘震荡直至尾盘略微新高后,快速杀跌,收跌14个点。个股方面,只有约20%的个股红盘,但大幅下跌个股家数不多。