同样面对 AI 大模型领域的“鲶鱼”DeepSeek,不同于美国 AI 公司 Anthropic CEO 达里奥·阿莫迪(Dario Amodei)用“万字檄文”施压白宫加强管制的敌对态度,法国明星 AI 公司 Mistral AI 则在发布自家新模型的同时在其技术博文中两次“致敬”DeepSeek。

当地时间 1 月 30 日,Mistral AI 发布一款名为 Mistral Small 3 的开源模型。与此同时,其发表了一篇技术博文针对该模型加以详细介绍。
Mistral AI 在博文中表示:“Mistral Small 3 既没有经过强化学习训练,也没有经过合成数据训练,因此比 Deepseek R1(一项伟大而互补的开源技术!)等模型更早进入模型生产流程。”
其还写道:“对于开源社区来说,这是激动人心的日子!和最近发布的 DeepSeek 一样,Mistral Small 3 为大型开源推理模型带来了补充,作为一款强大的基础模型,其推理能力得到了更进一步的发展。”言辞之间,似乎流露着 Mistral AI 对于 DeepSeek 的惺惺相惜。

据介绍,Mistral Small 3 是一个经过预训练和指导的模型,其参数为 240 亿,其在大规模多任务语言理解(MMLU,Massive Multitask Language Understanding)上的准确率超过 81%,延迟为 150 tokens/秒,并可以被部署在任何设备上,甚至能在 32GB RAM 的苹果 MacBook 上运行。
值得一提的是,Mistral Small 3 的层数远少于同类模型,大大减少了每次前向传播的时间。
Mistral Small 3 与 Llama 3.3 70B 的指令相当,但在相同硬件上速度快出 3 倍以上。这让 Mistral Small 3 能与 Llama 3.3 70B 或 Qwen 32B 等参数更大的模型相媲美。
Mistral AI 表示,Mistral Small 3 是 GPT-4o mini 等闭源专有模型的优秀开源替代品,还称 Mistral Small 3 在延迟上得到了优化。

在评估该模型的性能时,Mistral AI 与外部第三方供应商一起针对 1k 多个专有编码和通才提示进行并排评估。这项评估任务旨在从 Mistral Small 3 与从另一个匿名模型生成的内容中,挑选出来更受欢迎的模型响应。
Mistral AI 在博文中写道:“我们意识到在某些情况下,人类判断的基准与公开可用的基准截然不同,但在核实公平评估时我们格外谨慎。因此我们相信,上述基准是有效的。”
评估结果显示,相比三倍于其大小的开源权重模型和专有 GPT4o-mini 模型,Mistral Small 3 的指令调优模型在代码、数学、常识和指令遵循基准测试上更加出色。
由于所有基准测试的性能准确性,均是通过相同的内部评估流程获得。因此,测试结果可能与 Qwen2.5-32B-Instruct、Llama-3.3-70B-Instruct、Gemma-2-27B-IT 这几款模型之前报告的性能略有不同。
而 Wildbench、Arena hard 和 MTBench 等基于评判的评估,均基于 OpenAI 于 2024 年 5 月 13 日发布的 GPT-4o 模型。
Mistral AI 表示,Mistral Small 3 是目前同类产品中最有效的模型,它很好地补全了大型开源推理模型,其还称 Mistral Small 3 极大降低了计算成本,并表示这可能会重塑先进 AI 部署的经济性。
正因此,Mistral AI 在其领英主页上称 Mistral Small 3 是“加速全球各行各业采用生成式 AI 的游戏规则改变者(game-changer)”。

Mistral AI 的联合创始人兼首席科学官纪尧姆·兰普莱(Guillaume Lample)也告诉媒体:“我们认为,它在所有参数小于 700 亿的模型中是最好的。”“我们估计它基本上与几个月前发布的 Meta Llama 3.3 70B 相当,而 Mistral Small 3 却比它小了近三倍。”
据介绍,Mistral AI 之所研发这款新模型,是为了在适合本地部署的规模上拉满模型性能。Mistral AI 的技术方法侧重于效率而非规模,其主要通过迭代模型训练技术来提高模型性能,这样一来无需再投入更多的计算能力。
事实上,不仅 Mistral AI 的模型训练方式有所不同,其模型优化的方式也有所不同。据介绍,Mistral Small 3 在 8 万亿个 tokens 上进行训练,而同类模型的训练量为 15 万亿,这让那些重视计算成本的企业更容易获得先进的 AI 功能。
据该公司称,Mistral Small 3 可以在单个图形处理器(GPU,graphics processing unit)上运行,并能处理 80-90% 的典型业务,这些业务往往需要严格的语言和指令遵循表现、以及对于延迟要求非常低。与此同时,Mistral AI 在 Apache 2.0 协议下发布了预训练和指令调优的检查点。

目前,该模型已经可以在 Hugging Face、Ollama、Kaggle、Together AI、Fireworks AI 等平台下载使用,未来不久开发者也能在 NVIDIA NIM、Amazon SageMaker、Groq、Databricks 和 Snowflake 等平台下载使用。
Mistral Small 3 允许企业自由修改和部署它,因此 Mistral AI 表示它非常期待开源社区来采用 Mistral Small 3 以及基于定制其进行模型性质,并表示非常欢迎开发者通过破解 Mistral Small 3 来使其变得更好。
同时,Mistral AI 还在官网预告称,预计未来几周内 Mistral AI 的小模型和大模型将具有更强的推理能力。
随着 AI 行业的成熟,Mistral AI 对更小、更高效模型的关注,可能会被证明是一种具有先见之明的做法。目前,OpenAI 和 Anthropic 等公司更专注于开发越来越大、越来越昂贵的模型,而 Mistral AI 的做法则和其形成鲜明对比。
该公司的联合创始人兼首席科学官纪尧姆·兰普莱(Guillaume Lample)也预测称:“很多开源模型都可能带有非常宽松的许可证。我们认为,这种‘条件型(conditional)’模型很可能会成为一种商品。”
另据悉,Mistral AI 成立于 2023 年 4 月,一共有三位创始人。他们分别是:担任联合创始人兼 CEO 的阿瑟·曼斯(Arthur Mensch)、担任联合创始人兼首席科学家的纪尧姆·兰普莱(Guillaume Lample)以及担任联合创始人兼 CTO 的蒂莫西·拉克鲁瓦(Timothée Lacroix)。

图 | 三位联合创始人(来源:https://medium.com/lightspeed-venture-partners/meet-europes-next-great-generative-ai-startup-mistral-ai-25ee537b1f9e)
联合创始人兼 CEO 阿瑟·曼斯(Arthur Mensch)此前曾在 DeepMind 的法国工作室担任研究员。其本科毕业于法国巴黎综合理工学院,硕士毕业于法国巴黎萨克雷高等师范学校,博士毕业于法国巴黎萨克雷大学。

联合创始人兼首席科学家纪尧姆·兰普莱(Guillaume Lample)此前曾在 Meta 法国分公司工作过六年多之久。早年其先后在法国巴黎综合理工学院和美国卡内基梅隆大学获得两个硕士学位,并在法国巴黎第六大学获得博士学位。

图 | 纪尧姆·兰普莱(Guillaume Lample)(来源:https://www.actuia.com/acteur/guillaume-lample/)
联合创始人兼 CTO 蒂莫西·拉克鲁瓦(Timothée Lacroix)此前也在 Meta 法国分公司工作过数年之久,早年其在法国巴黎高等师范学院获得了本科学位。

图 | 蒂莫西·拉克鲁瓦(Timothée Lacroix)(来源:https://soundcloud.com/timothee-lacroix)
2024 年夏,Mistral AI 获得 6 亿欧元的融资,投资者中包含微软和英伟达。目前,Mistral AI 公司估值约为 60 亿美元,其将自己定位为全球 AI 竞赛中的“欧洲领头羊”。
2025 年 1 月,Mistral AI 与法新社签署了一项协议,这让用户使用 Mistral AI 的产品能够访问法新社以六种语言发布的新闻。
最近,该公司的联合创始人兼 CEO 阿瑟·曼斯(Arthur Mensch)在参加达沃斯世界经济论坛时,接受了彭博社的采访。采访中其表示,Mistral AI 正在为最终的首次公开募股(IPO,Initial Public Offering)做准备。
在全球 AI 领域,“法国 AI”是一股不可忽视的力量。图灵奖得主&Meta 首席科学家杨立昆(Yann LeCun)、“Keras 之父”& 前谷歌高级工程师弗朗索瓦·肖莱(François Chollet)均出生于法国。
法国现任法国总统马克龙也曾表示希望将法国变为欧洲的一个创业国家,此前马克龙还亲自出席过巴黎一家孵化器的落成典礼。
尽管如此,作为一家 AI 公司要想在全世界都能“吃得开”那就必须拥抱美国市场,此前有报道称 Mistral AI 将在美国加州旧金山湾区帕洛阿托建立办事处。
与此同时,该公司还计划在新加坡开设一个办事处,以便更好地拓展亚太地区业务。总之,Mistral AI 早已不满足于在法国发展而是志在全球。
参考资料:
https://mistral.ai/news/mistral-small-3/
https://venturebeat.com/ai/mistral-small-3-brings-open-source-ai-to-the-masses-smaller-faster-and-cheaper/
https://www.zdnet.com/article/mistral-ai-says-its-small-3-model-is-a-local-open-source-alternative-to-gpt-4o-mini/
https://insiderpaper.com/frances-mistral-hails-deepseeks-ai-model/
https://www.linkedin.com/feed/update/urn:li:activity:7290735119026257921/
https://techcrunch.com/2025/01/21/mistral-ai-plans-ipo/
https://www.ibm.com/think/news/french-ai-goes-west
https://www.pymnts.com/artificial-intelligence-2/2024/mistral-reportedly-eyes-us-expansion-to-take-on-ai-giants/
运营/排版:何晨龙
01/
02/
03/
04/
05/



APP专享直播
热门推荐
结婚不到一年就离婚,男方要求女方返还彩礼被法院驳回 收起结婚不到一年就离婚,男方要求女方返还彩礼被法院驳回
- 2025年02月28日
- 06:56
- APP专享
- 扒圈小记
22,495
莲花集团CEO冯擎峰疑似回应小米:对赛道的敬畏并不是单纯堆积电机与马力,弯道快的只有莲花和保时捷
- 2025年02月28日
- 10:51
- APP专享
- 扒圈小记
19,837
活久见!泽连斯基与特朗普、万斯当众吵架 饭都没吃就被轰出白宫
- 2025年02月28日
- 21:35
- APP专享
- 北京时间
13,722

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势起航今天 07:19:49
【小鹏汽车2月共交付新车30453台 同比增长570%】小鹏汽车公布最新交付成绩。2025年2月,小鹏汽车共交付新车30453台,同比增长570%。小鹏汽车已连续4个月交付量突破30000台。2025年1月-2月,小鹏汽车累计交付新车共60803台,同比增长375%。 -
趋势起航今天 06:49:47
【中国空军代表与古巴外训学员举行交流活动】当地时间2月28日,中国空军代表在古巴哈瓦那与十多名曾来华学习飞行的古巴空军退役飞行员举行了一场交流活动。中国驻古巴大使、古巴空军和防空军司令等人出席活动。 -
趋势起航今天 06:19:45
【极氪科技:2月集团销售31277辆】新近成立的极氪科技集团公布,2月该集团销量31,277辆。其中,旗下2月极氪品牌销量14,039辆,同比增长86.9%,环比增长17.6%;领克品牌销量17,238辆,同比增长30.5%,新能源占比47.9%。(财联社记者 刘阳) -
趋势领涨今天 06:01:08
今天最火热的视频就是老特与小泽谈崩了,没有签订协议,最终不欢而散。老特多次强调,你没有资格要求我们怎么想,你手上都没有牌可打了,但小泽还是不屈服于老特的淫威,不屈服于美国的霸权,小泽还是挺有血性的!弱者无外交,只有自己足够强大才有话语权,我们很荣幸能够出生在中国,背靠祖国的强大,同样,只有股市强,股民才有幸福,你们说A股下周能强起来吗? -
趋势领涨今天 05:54:07
【国家统计局:2月制造业采购经理指数(PMI)为50.2% 比上月上升1.1个百分点】财联社3月1日电,国家统计局数据显示,2月份,制造业采购经理指数(PMI)为50.2%,比上月上升1.1个百分点,制造业景气水平明显回升。从企业规模看,大型企业PMI为52.5%,比上月上升2.6个百分点,高于临界点;中、小型企业PMI分别为49.2%和46.3%,比上月下降0.3和0.2个百分点,均低于临界点。 -
趋势起航今天 05:49:44
库尔德工人党宣布与土耳其停火。 -
趋势领涨今天 05:19:58
=加入潜伏擒牛VIP,享四大顶级服务=【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每周一份高端内部绝密文章:包含近期布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!(VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!)现月课7.5折,1288元!季课6.9折,3558元,续费季度更划算!新朋友可先月课体验!点网址,直接买,订购地址:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势起航今天 05:19:42
澳门2月幸运博彩毛收入197.4亿澳门元,同比增长6.8%。澳门1-2月份幸运博彩毛收入380亿澳门元,同比增长0.5%。 -
趋势起航今天 04:49:40
【美国务卿:欧洲有人建议将乌克兰冲突再持续一年以削弱俄罗斯】美国国务卿鲁比奥称,欧洲有人建议将乌克兰冲突再持续一年,希望以此削弱俄罗斯,但美国认为这不现实。鲁比奥还说,冲突再持续一年将导致更大的破坏和伤亡,美国认为这样的计划是不现实的。 -
趋势起航今天 04:19:39
【首两月TOP100企业拿地总额同比增长26.7%】中指研究院最新发布《2025年1-2月全国房地产企业拿地TOP100排行榜》,重点房企拿地总额同比为正。2025年1-2月,TOP100企业拿地总额1998.6亿元,同比增长26.7%。土地市场点状回暖、“开门红”行情延续,TOP100企业拿地总额同比两位数增长。从新增货值来看,华润置地、保利发展(sh600048)和中国金茂位列前三。