幻方量化旗下DeepSeek发布开源模型,超越阿里Qwen、Meta Llama

幻方量化旗下DeepSeek发布开源模型,超越阿里Qwen、Meta Llama
2024年12月27日 10:53 网易新闻

蓝鲸新闻12月27日讯 12月26日晚,AI公司深度求索(DeepSeek)正式上线全新系列模型DeepSeek-V3首个版本并同步开源。该模型在多项评测集上超越了阿里Qwen2.5-72B、Meta的Llama-3.1-405B等其他开源模型,并逼近GPT-4o、Claude-3.5-Sonnet等顶尖闭源模型。据官方技术论文披露,v3模型的总训练成本为557.6万美元,GPT-4o等模型的训练成本约为1亿美元。DeepSeek-V3定价为每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元,并享有45天的优惠价格体验期。今年5月,DeepSeek是率先发起国内大模型价格战的公司之一。(蓝鲸新闻 朱俊熹)

海量资讯、精准解读,尽在新浪财经APP
阿里 Meta 美元

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 01-06 惠通科技 301601 --
  • 01-06 思看科技 688583 --
  • 12-30 钧崴电子 301458 10.4
  • 12-30 赛分科技 688758 4.32
  • 12-24 星图测控 920116 6.92
  • 新浪首页 语音播报 相关新闻 返回顶部