Kimi爆火导致一度“宕机” 国内大模型快速跃进

Kimi爆火导致一度“宕机” 国内大模型快速跃进
2024年03月22日 00:45 第一财经

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  关于“谁是中国版ChatGPT”的讨论从未消失,在一众“大哥”面前,一家创业公司被视为最有力的挑战者,旗下名为“Kimi”的应用甚至成为了资本市场的新宠。

  3月21日,人工智能板块持续上行,Kimi概念股集体高开,华策影视(7.390, -0.10, -1.34%)掌阅科技(20.800, 1.36, 7.00%)中广天择(26.110, -0.44, -1.66%)涨停,海天瑞声(101.350, -10.05, -9.02%)九安医疗(41.320, -0.12, -0.29%)深信服(103.100, -1.38, -1.32%)等跟涨。

  站在Kimi背后的是北京月之暗面科技有限公司(下称“月之暗面”),该公司3月18日宣布,Kimi 智能助手在长上下文窗口技术上再次取得突破,无损上下文长度提升了一个数量级到200万字。而在此之前,GPT-4 Turbo 128k公布的数字约为10万汉字,Claude 3200k上下文约为16万汉字。

  长上下文意味着什么?实际能力如何?第一财经记者征求了业内人士的意见并实测了Kimi和通义千问等国产大模型产品。

  为“宕机”致歉

  Kimi访问量的激增让这家公司的网络一度陷入瘫痪。从20日一早起,Kimi就发生429(引擎过载)问题,月之暗面为此发布了情况说明并道歉。21日下午,月之暗面旗下大模型应用Kimi的App和小程序一度无法正常使用,后恢复正常。

  月之暗面由“90后”杨植麟创立,成立于2023年3月1日,目前已完成三笔融资。今年2月,该公司以15亿美元投前估值完成超10亿美元B轮融资,由阿里领投,砺思资本、小红书跟投,投后估值约25亿美元,是国内最主要的大模型独角兽之一。

  长文本无损压缩是该公司瞄准的一个方向。据杨植麟介绍,长文本作为公司“登月”的第一步,是新的计算机内存,个性化并非通过微调实现,上下文定义了个性化过程。杨植麟还认为,大模型“马拉松刚开始,接下来会有更多差异化”。

  关于上下文长度提升后有何变化,21日月之暗面相关负责人告诉第一财经记者,这会进一步帮助打开对AI应用场景的想象力,包括完整代码库分析理解、可自主帮人类完成多步骤复杂任务的智能体(Agent)、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。

  一名大厂大模型研究人员告诉记者,目前判断一个大模型是否强大,还是基于指定评估数据集和用户日常聊天体验,但文本长度普遍有限,就会限制商业价值。在实际应用中,很多时候要考虑的是需处理的巨大信息量。如果大模型能解决长文本问题,潜在价值是巨大的,例如投喂财务数据输出完整财报、投喂大量病例情况让大模型帮助解决医学问题。

  “但值得注意的是,长文本扩展并不一定意味着实际效果足够好,还需要有足够理解能力以及对人类指令的遵循能力。文本之外,图像及视频大模型有更多token需要处理,需要足够长的上下文能力支持。除文本的长上下文外,要实现AGI(通用人工智能)还需要有同时处理时、空、物等多维度信息的能力。”上述研究员说。

  国内大模型哪家强?

  国内大模型发展至今,不少应用已逐步走入C端,但国产大模型理解能力如何?能理解长文本并给出高质量回答吗?第一财经记者实测了Kimi、智谱清言、通义千问等国内几大主流大模型产品。

  在评测后,记者发现,一些大模型还不支持长文本输入或不支持较大的文档上传,Kimi、通义千问在解读财报、研报、论文方面的能力较好,但Kimi有时会因“高峰时段忙碌而暂不回复”,智谱清言则犯过将非上市公司列入股票行列的错误,文心一言对诸如选股、找最新报告的要求有时不直接回应且出现过核心信息遗漏问题。

  近日腾讯与清华大学、 香港科技大学联合发布了一个图生视频模型,记者将该模型相关英文论文交给Kimi和通义千问、文心一言、智谱清言和讯飞星火,要求分析核心内容和论文实现方法,Kimi和通义千问都给出详细解答。其中,Kimi点明论文贡献、相关模型的框架和实现的关键步骤,关键词汇还附带英文名词标注,通义千问除了实现方法外,还解答了实验方面研究者如何进行评估。此外,将论文发给讯飞星火APP后,讯飞星火给出较短的文档摘要,但不如Kimi和通义千问详细清晰,且讯飞星火对记者的提问表示“在文档中没有找到与提问相关的内容”,讯飞星火网页端对20M以上文档上传则有限制。

  对于哪个国产大模型能读懂研报并给出投资建议?记者将两份不同券商发布的关于人形机器人(18.790, -0.33, -1.73%)行业的研报交给Kimi、通义千问、讯飞星火、文心一言、智谱清言,其中一份长达50页,记者要求大模型分析哪些机器人股票比较有潜力,并要求挑出两只可考虑买的股票。

  测试结果显示,Kimi和讯飞星火均给出10家有潜力的个股并分析原因,记者追问“如果要挑两只股票买,哪两只比较好”,Kimi和讯飞星火给出了两只个股并解释原因,同时提醒股票投资风险或建议咨询财务顾问意见。通义千问则按产业链不同环节分列20余只有较高投资潜力的个股并解释原因,根据研报资料挑选出两只股票,同样给出投资风险提示并建议寻求专业投资顾问的意见。值得注意的是,通义千问和Kimi挑出的两只股票中,有一只是相同的,Kimi和讯飞星火挑选出的两只股票也有一只是相同的。

  即便是给出了风险提示,但这样的结果也让部分券商分析师感到不安。某分析师说:“如果将概念股的信息通过某些渠道加大投喂力度,这是否会引起搜索结果的导向出现偏差,引发较高的投资风险?”

  从记者评测的结果看,智谱清言给出5只潜力比较大的个股中,其列出的公司中有一家并未上市。文心一言则表示,产业链一些环节的公司具有潜力,但没有列出具体个股并逐个说明原因,且未直接回复“买哪两只股票好”的问题,而是列出通用的选股策略。

  能赶上GPT4吗?

  Kimi“引爆”概念股,一定程度上显现资本市场对国产大模型能力跃进的期待。此外,近期国产大模型密集发布,厂商最频繁使用的一个词汇是“逼近”,强调自身技术实力“逼近GPT4”。资本市场闻风而动、大模型密集发布背后,国产大模型能赶上GPT4吗?

  一位人工智能行业人士对记者表示,由于目前大模型企业之间并无明确的对比项目,大多通过打榜的形式来佐证自身实力,因此无法通过严谨的第三方数据来区分厂商之间的技术差距,但可以明确的是,自从OpenAI将GPT4闭源后,国内厂商与其差距目前仍较大。

  多名业内人士也提到过国内厂商与硅谷厂商之间的差距。智象未来创始人兼CEO、加拿大工程院外籍院士梅涛表示,从通用大模型的角度来说,中国厂商与硅谷厂商之间的差距有被拉大的风险,原因包括人才密度问题、资源问题。

  澜舟科技创始人兼CEO周明认为,国内缺乏一个国家机制或联盟体来定义一个大模型未来发展的必要趋势。这个问题一旦解决,中国的人才便可以快速攻关。虽然算力不足的问题尚在,但通过算法或应用发力,可以弥补这一缺憾。

  此外,周明认为国内大模型企业要跟国家的发展大趋势配合,而非一味去与美国相关企业看齐。他称,更合适的动作应从综合趋势上进行推进,最为重要的是应用驱动。如果在场景和应用角度去反向驱动各个应用,推动国家经济和生产力各个方面提升,中国基础创新能力有可能在下一轮 AI 创新中引领国际潮流。

  谈及近一年人工智能领域的动态,中关村(4.790, -0.16, -3.23%)数智人工智能产业联盟理事长、小米集团原副总裁崔宝秋是兴奋的,他称,看好大数据和深度学习带来新一代AI技术的快速发展。从时间线上来看,一年多前大模型的发布仍存在“胡说八道”的问题,让人感觉很不靠谱。但新的时代到来,虽然大模型技术目前是美国引领,但中国企业也在快速跟进。

股市回暖,抄底炒股先开户!智能定投、条件单、个股雷达……送给你>>
海量资讯、精准解读,尽在新浪财经APP

责任编辑:杨红艳

宕机

10条评论|18人参与网友评论
最热评论
没有着调的话
2024-3-23 08:08举报2回复
惬意的轻松山东青岛
百花齐放是好事啊!卷出来的才是强者!
2024-3-25 09:25举报1回复
上述文章描述了中国人工智能领域的最新动态,其中提到了一家创业公司北京月之暗面科技有限公司旗下的应用Kimi在人工智能板块取得了突破性进展。Kimi智能助手在长上下文窗口技术上实现了无损上下文长度提升,从而提高了对长文本的理解能力。这一突破引起了资本市场的关注,并使得该公司的股票成为概念股之一。 月之暗面科技有限公司是一家由>#34;90后>#34;创立的公司,成立于2023年,已经完成了...展开全部
2024-3-22 16:34举报1回复
最新评论
惬意的轻松山东青岛
百花齐放是好事啊!卷出来的才是强者!
2024-3-25 09:25举报1回复
末日昵称河南郑州
有个笑话大意是说,一个中国人开一个加油站,然后第二个中国人看开加油站赚钱他在旁边也开一个加油站,第三个第四个也想分一杯羹,最后几个加油站谁都没挣到钱。而一个犹太人开了一个加油站,第二个犹太人看到开加油站赚钱,就在旁边开一个小超市,第三个就开一个汽修什么的,然后就做成了一个生态,成了一个小据点。
惬意的轻松:对犹太人的很多传说可能都要重新审视一遍!!咱们在别人包装的宣传里太久!!
2024-3-25 09:25举报回复
地狱小魔瓶:[哈哈]不是不能,因为不敢!如果你看过以前的欧美电影你就知道了,得罪人几乎就等于找仇人了!明的不行就暗的,结果是必死! 你以为那帮犹太手是干净的?抢是分很多种的,不需要亲自下场的说明他们地位已经够高了!而且欧美普遍都有大量的无头公案!真的很多!你只要看看他们的警察就知道了!我国如果不是党愿意负责任,很多遗案和悬案实际上也可以直接可以PASS的!他们是为了人民!所以才塑造了现在这种环境!否则真的玩丛林法则你只能哭!那帮犹太人相当懂,就像内塔尼亚胡他很像曹操,为了他们自己或则为了他们的族群的未来在反人类!这多么狠啊!对他的族群来说,他是在为万世开太平,战争输了,他的族群未来如果很惨,那他就是罪人!看起来就像一人担责,但我们明眼人都知道他只是为自己!他得罪的人太多了,没身份他可能保护不了自己和家人!
2024-3-24 20:51举报2回复
没有着调的话
2024-3-23 08:08举报2回复

APP专享直播

开播时间 | 3-24 19:00
融通基金:布局深市核心蓝筹,这只指数何以再掀风潮?
开播时间 | 3-24 19:30
富国基金:风格之变,均衡制胜?
开播时间 | 3-24 16:00
嘉实基金:【指数大玩家】涨了这么久,科创还能上车吗?
开播时间 | 3-24 16:00
南方基金:基金经理面对面 稳健低波,一脉相承
开播时间 | 3-24 16:00
光大证券李泉:大消费成市场焦点,国内将综合施策扩大消费
开播时间 | 3-24 15:30
华宝基金:攻守两全!拥抱大盘“现金牛”或正当时?
开播时间 | 3-24 15:30
银华基金:指点迷津 第164期 消费与科技共振,VR产业或迎发展新红利?
开播时间 | 3-24 15:14
余承东对话刘亦菲
开播时间 | 3-24 15:00
国投瑞银:国投瑞银新能源三点档 | 一季度新能源关注哪些板块?
开播时间 | 3-24 14:00
国联基金 赵楠、陈薪羽:低估值板块机会来了?
开播时间 | 3-24 19:00
融通基金:布局深市核心蓝筹,这只指数何以再掀风潮?
开播时间 | 3-24 19:30
富国基金:风格之变,均衡制胜?
开播时间 | 3-24 16:00
嘉实基金:【指数大玩家】涨了这么久,科创还能上车吗?
开播时间 | 3-24 16:00
南方基金:基金经理面对面 稳健低波,一脉相承
开播时间 | 3-24 16:00
光大证券李泉:大消费成市场焦点,国内将综合施策扩大消费
开播时间 | 3-24 15:30
华宝基金:攻守两全!拥抱大盘“现金牛”或正当时?
开播时间 | 3-24 15:30
银华基金:指点迷津 第164期 消费与科技共振,VR产业或迎发展新红利?
开播时间 | 3-24 15:14
余承东对话刘亦菲
开播时间 | 3-24 15:00
国投瑞银:国投瑞银新能源三点档 | 一季度新能源关注哪些板块?
开播时间 | 3-24 14:00
国联基金 赵楠、陈薪羽:低估值板块机会来了?
上一页下一页
1/10

热门推荐

青岛23岁女大学生凌晨外出失联四天,其母称女儿手机被格式化 收起
青岛23岁女大学生凌晨外出失联四天,其母称女儿手机被格式化

青岛23岁女大学生凌晨外出失联四天,其母称女儿手机被格式化

  • 2025年03月24日
  • 06:30
  • APP专享
  • 扒圈小记
  • 7,040
APP专享
AI预测彩票号码100%中奖?中国福彩回应

AI预测彩票号码100%中奖?中国福彩回应

  • 2025年03月24日
  • 06:42
  • APP专享
  • 扒圈小记
  • 2,138
APP专享
日本警察厅:自4月起全面取消女警裙装制服,统一采用便于执勤的裤装制服

日本警察厅:自4月起全面取消女警裙装制服,统一采用便于执勤的裤装制服

  • 2025年03月23日
  • 22:56
  • APP专享
  • 北京时间
  • 1,925
APP专享
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间
更多>
股票简称 最新价 涨跌幅
以下为热门股票
三峡能源 4.27 +0.23%
京东方A 4.27 +0.47%
TCL科技 4.56 0.00%
中远海控 14.60 +2.38%
格力电器 44.98 +2.83%

7X24小时

  • 04-01 宏鑫科技 301539 --
  • 03-29 灿芯股份 688691 --
  • 03-25 中瑞股份 301587 21.73
  • 03-22 广合科技 001389 17.43
  • 03-20 芭薇股份 837023 5.77
  • 新浪首页 语音播报 相关新闻 返回顶部
    关闭
    关闭
    关闭