百度宣布将开源下一代文心大模型。
2月14日,百度(Nasdaq:BIDU,09888.HK)宣布,将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。
前一日,百度宣布文心一言将于4月1日0时起全面免费,所有PC端和APP端用户均可体验文心系列最新模型,以及超长文档处理、专业检索增强、高级AI绘画、多语种对话等功能。
据介绍,随着文心大模型的迭代升级,其训练和推理成本正在迅速下降。百度创始人李彦宏在迪拜AI峰会上表示,当前的创新速度比以往快得多,大模型的推理成本每年能降低90%以上,并表示将持续投入AI基础设施,以打造下一代大模型。
有消息称,百度计划在今年发布多款模型,并于今年下半年推出文心大模型5.0,将在模型多模态能力方面有显著增强。
值得关注的是,此前百度一直强调的是“闭源”。
百度创始人、董事长兼首席执行官李彦宏曾在多个公开场合,谈及开源模型的弊端。2024年4月11日,澎湃新闻记者获取的一份李彦宏的内部谈话实录显示,李彦宏认为,目前国外像Llama(编注:Meta开源模型),Mistral(编注:法国人工智能初创公司 Mistral发布的模型)都有相当的影响力,国内的智源、百川、阿里的通义也都是开源模型,市场上不缺百度这一家开源的模型。百度要开源还得自己去维护一套开源的版本,这不划算。李彦宏的判断是,闭源才有真正的商业模式,才能聚集人才和算力。
在去年的世界人工智能大会暨人工智能全球治理高级别会议产业发展主论坛上,谈及开源/闭源模型,李彦宏表示,有些外行混淆了模型开源和代码开源这两个概念,模型开源是拿到一大堆的参数,还是要去做SFT(监督微调),做安全对齐,若不知道这些参数怎么而来,无法做到众人拾柴火焰高。即使拿到对应的源代码,也不知道用了多少数据,用了什么比例的数据去训练这些参数。
“拿到这些东西,并不能够让你站在巨人的肩膀上去迭代和开发。同样参数规模之下,闭源模型的能力比开源模型要更好,而如果开源想要能力追平闭源,那么它就需要有更大的参数,这就意味着推理成本会更高,反应速度会更慢。”李彦宏也肯定开源模型在某些场景下的价值,比如,学术研究等,但他也再次强调,当处在一个激烈竞争的市场环境中时,还是要闭源。
在之后的发展中,相较于BAT推出的模型,真正让中国大模型在海外名声大振的是来自幻方量化旗下的AI公司深度求索(DeepSeek)。
今年1月,DeepSeek推出大模型DeepSeek-R1。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。随后,DeepSeek热潮席卷多个行业,不仅凭借一己之力“带崩”美股,春节假期后,国内多个行业龙头公司均宣布接入DeepSeek。
数据显示,DeepSeek应用上线20天,日活就突破了2000万,包括阿里、腾讯、华为、百度等国内多个云巨头均宣布接入DeepSeek,形成强大的“朋友圈”。
李彦宏也在迪拜AI峰会上与阿联酋AI部长对谈时谈及DeepSeek说,回顾过去几百年的历史,创新的本质是成本下降与生产力提升。不仅在AI领域或IT行业,大多数创新都与降低成本有关。如果成本降低一定比例,生产力也随之提高同样比例。在今天,创新速度比以往都快得多。
2024年11月21日晚,百度发布2024年第三季度财务报告,季度总营收335.57亿元,同比减少3%,环比减少1%;非公认会计准则(Non-GAAP)下,归属百度的净利润58.86亿元,同比减少19%,环比减少20%。
截至记者发稿,百度港股涨超1%。



![[嘻嘻] [嘻嘻]](https://n.sinaimg.cn/commnet/2018new_xixi_org.png)

![[doge] [doge]](https://n.sinaimg.cn/commnet/2018new_doge02_org.png)




APP专享直播
热门推荐
刘强东最新发声:技术算法不应用来压榨最底层的兄弟们 收起刘强东最新发声:技术算法不应用来压榨最底层的兄弟们
- 2025年03月21日
- 06:51
- APP专享
- 扒圈小记
16,532
香港《大公报》再发文:奉劝有关企业和人士,停止交割
- 2025年03月21日
- 01:22
- APP专享
- 扒圈小记
9,791
网络“大V”司马南偷税被罚超900万
- 2025年03月21日
- 02:04
- APP专享
- 北京时间
9,685

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 10:30:06
亚星锚链(sh601890)(601890.SH)发布股票交易异常波动公告,经自查,公司目前生产经营活动正常,市场环境、行业政策未发生重大调整,生产成本和销售等情况未出现大幅波动,内部生产经营秩序正常。除已披露信息外,公司、公司控股股东及实际控制人不存在其他应披露而未披露的重大事项。 -
数字江恩今天 09:17:32
下周一,只要没有加速下跌,那么3350+-5个点区间,便是2-a的结束。其后,2-b反弹和2-c再次下跌便是下周的走势了,其中,2-c的时间会跨越下周到下下周,这就等下周再说了。总之下周都处于第二浪回踩之中,之上期间有一个短线2-b反弹。 -
数字江恩今天 09:17:24
5分钟图来看,3297的上涨第一浪已经结束了,内部结构看为abc结果。本周五直接跌破3376,已经确立了第二浪回踩已经开始,而第二浪内部也是abc的内部结构。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:17:12
首先看30分钟图,本人上周末给出3430+-10点区间受阻震荡,本周完全实现,实际最高点3439点。这张图主要是看一下震荡结构的底线,其中A低点3297不容许跌破,这是3140向上走势,在震荡后继续上行的底线条件。只要不跌破A点,那么震荡后,图上的红色轮谷线、蓝色轮峰线都会突破,当然,是下周以后了。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:16:56
大盘本周成交量略微缩量,冲高新高之后出现明显回踩,收盘再5周均线附近。目前5周线3371, 10周线3325,其中10周线继续上行,是下周的重要支撑线。板块上来说,本周没有持续性热点,各个板块走马灯一遍。 -
数字江恩今天 09:16:52
下周行情展望2025.03.21 -
北京红竹今天 08:05:06
2、调整的级别行情没什么可聊的,做个调查吧这一波调整,你觉得30分钟级别调整好,还是日线级别调整好。如果是三十分钟级别调整,到时能做波段操作,仓位半仓左右。如果是日线级别调整,等待的时间可能长一些,到时候长线、波段、ETF都可以布局。目前我的2个组合几乎没什么仓位,特别是长线组合,一直都没布局,短线组合还有半仓。我先说自己的预期,当然是预期,咱就是瞎聊。我的屁股现在坐在没仓位的情况下,我当然希望日线级别调整,到时候我好布局长线(一招鲜升级版个股)和ETF,不然我只能玩短线了。所以如何来交易,都是屁股决定的,坐在哪里就希望什么,只是市场会有自己的判断而已。 -
北京红竹今天 08:05:00
1、2个中枢之后的结果最近强调最多的就是2个中枢之后不做任何的追买,只考虑如何卖出的问题。这是缠论教科书式的定义,今天一根阴线跌下来,可以谈买入了吗?依然还不是不谈,缠论不是看跌了多少,而是要看结构。市场怎么走都可以,但缠论是我们能看懂的交易体系,走出我们能看明白的走势,再干活就好了。现在就是踏踏实实等待三十分钟级别回落段的出现。对于调整我们在做个分类,第一种分类,如果日线一笔调整不破3297点,后面指数还可以继续新高,这里的干活仓位半仓就好。第二种分类,如果日线一笔调整跌破3297点,那就踏踏实实等日线级别一段下跌之后,再谈买入的事。不预测,只谈分类就好。市场给什么走势,我们做什么走势就好。 -
徐小明今天 07:08:27
【盘中直播】语音课见 -
巨丰投资张翠霞今天 07:07:18
4小时运行结束,总结全天市场运行,1)沪指上周五突破3400点整数关口后,买盘衰竭,本周缩量横盘后,下半周迎来破位下挫,周五放量下跌失守3400点,春季躁动行情没有高度,只有宽度,下周月末+4月年报季,注意个股基本面,迎接年报大考,预期后市仍为结构性轮动行情,今日释放流动性后,个股机会出现;2)量能,沪深两市今日成交额15797亿元,较上个交易日14766亿元增加1031亿元;3)行业板块方面,以加权涨幅来看56家行业7家红盘,船舶、钢铁、酒店餐饮等板块涨幅居前;汽车、软件服务、半导体等板块跌幅居前;4)市场延续结构型行情,题材热点快速轮动。详细解盘,可关注《翠霞首席课》的“热点直击”和“操盘指南”~~~