转自:上观新闻
![](http://n.sinaimg.cn/spider20250129/200/w640h360/20250129/49a0-ab9d6d50924c595f43a20ff5c29e14fc.jpg)
![](http://n.sinaimg.cn/spider20250129/740/w640h100/20250129/c27c-b1ef1bfc3f28eb67b71c6e8ab789cad4.png)
深度求索公司研发的DeepSeek大模型最近“出圈”,其实,国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到,上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4,改用DeepSeek-V3生成合成数据,开发垂类大模型。
达观数据公司去年5月就引入DeepSeek-V2大模型,开发办公智能体(Agent),取得了很好效果。“DeepSeek的性价比极高,而且全面开源,对产业应用很友好。”达观数据董事长、首席执行官陈运文博士说。
大幅提高办公智能体的专业能力
近年来,赵海团队利用GPT-4等基座大模型,为政府和企业开发了十多个垂类大模型。在开发过程中,基座大模型的主要作用是生成合成数据。这类数据通过人工方式生成,而不是从真实世界中获取,用于训练大模型。“我用过一些国产基座大模型,它们的效果和GPT-4比起来,还是有一定差距。”赵海教授告诉记者,“但使用DeepSeek-V3后,我发现它的性能与GPT-4处于同一量级,而价格只有GPT-4的十分之一,所以现在不用GPT-4了。”
与赵海团队相比,达观数据使用DeepSeek更早。陈运文介绍,DeepSeek-V2是一个精简高效的开源模型,只需要相对低配的GPU和显卡内存,就能让办公智能体获得很好的推理效果。DeepSeek-V3发布后,这家上海人工智能企业立即成为它的用户。
“这个大模型有6710亿参数,激活参数为370亿,在14.8万亿token(词元)上进行了预训练,生成速度比上一个版本V2.5模型提升3倍,达到每秒吞吐量60token。”陈运文介绍,“V3对GPU资源的使用效率极高,因为很多单位没有庞大的GPU集群,DeepSeek这种低资源、高效果的特性有利于今后大规模推广应用。”
DeepSeek-V3为何对GPU资源的使用效率极高?陈运文解释,它运用了多种技术创新,如采用MLA(多头潜在注意力)架构,成功压缩了键值缓存;使用对偶流水线机制,通过设计流水线调度,让GPU算力和通信算力在训练中并行隐藏,成功减少了计算瓶颈,实现几乎不间断的运算;还使用PTX这一接近汇编语言的低级指令集,对GPU进行细致控制,如调整寄存器分配和线程运行方式,从而更精细地管理GPU资源。
本月发布的推理大模型DeepSeek-R1在复杂的数学和逻辑任务上表现优秀,达观数据使用后,大幅度提升了办公智能体在审阅处理复杂的工程报告、金融文书、财务报表、招投标书等专业文档上的能力。
![](http://n.sinaimg.cn/spider20250129/267/w640h427/20250129/eaf0-000eca9d65ecf7a4038a71cfecded14e.jpg)
DeepSeek风靡美国后,投资者抛售人工智能主题相关股票,纳斯达克综合指数1月27日显著下跌。新华社发
R系列模型将推动科学智能发展
“DeepSeek-V3和DeepSeek-R1的问世,是大模型领域的标志性事件。”赵海认为,大模型近年来的发展历程可分为三个阶段:第一阶段的标志性事件是ChatGPT问世,其表现令人惊艳,但因为不开源,大多数开发者并不清楚这个大模型是如何开发出来的;在第二阶段,很多团队重现了ChatGPT开发过程,涌现出Llama、Qwen等一批开源大模型,这类模型的性能越来越强,但与OpenAI发布的大模型相比,存在一定差距;DeepSeek-V3和DeepSeek-R1则开启了第三阶段,它们的性能可分别比肩GPT-4和OpenAI o1,意味着开源大模型终于追赶上了闭源大模型。
这位长期研究自然语言处理的学者说,自从OpenAI在2020年发布不开源的GPT-3以来,这家标榜“从事开放性人工智能研究”的机构就背离了初心。如今,随着深度求索公司的异军突起,大模型研发可谓“回归初心”,让开源再度成为业内的主流形态。通过深度求索发布的技术报告,全球开发者都了中国研发团队的创新智慧。可以预见,DeepSeek将引发大模型创新和产业生态的变革。
未来,DeepSeek的R系列推理大模型最值得关注。赵海解释:“过去,ChatGPT等大模型像文科生,不擅长理科和逻辑推理。而对人类智慧来说,最底层的智慧是逻辑,逻辑之上是数学,再上面是物理、化学等科学。”去年9月,OpenAI发布的o1推理大模型改变了“文科生”形象,它擅长逻辑推理和数学,为今后将大模型用于科学研究、处理复杂任务奠定了基础。
目前,DeepSeek-R1的性能与OpenAI o1不分上下,为中国的科学智能(AI for Science)发展提供了利器。在赵海看来,人工智能这门学科的终点是“人工大脑”问世,这种通用人工智能(AGI)设备可用于研究数学、自然科学、社会科学等各个专业领域的复杂问题。未来20年内,科学家有望开发出“人工大脑”,从而颠覆现有的科研范式,使人类获取新知识和解决方案的效率大幅提升。
深度求索创始人梁文锋近日接受专访时表示,DeepSeek的终极目标是实现通用人工智能,而非仅仅追求商业化应用,“生成式AI只是通往AGI的必经之路,AGI有望在我们有生之年实现”。
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
![](http://n.sinaimg.cn/sinanews/eb9bf575/20190108/TouXiang120.png)
![](http://n.sinaimg.cn/sinanews/eb9bf575/20190108/TouXiang120.png)
APP专享直播
热门推荐
酒后在小区挪车被认定醉驾吊销驾照,司机起诉交警!法院判了 收起酒后在小区挪车被认定醉驾吊销驾照,司机起诉交警!法院判了
- 2025年02月15日
- 11:55
- APP专享
- 扒圈小记
29,865
事闹大了,前国乒教练尹肖驳斥吴敬平:颠倒黑白!
- 2025年02月16日
- 07:07
- APP专享
- 扒圈小记
2,808
重庆燃气道歉:针对燃气收费问题已派驻整改督导专班
- 2025年02月16日
- 09:51
- APP专享
- 北京时间
2,326
![新浪财经公众号 新浪财经公众号](http://n.sinaimg.cn/finance/72219a70/20180103/_thumb_23666.png)
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势起航今天 15:45:04
【美官员将前往沙特 就俄罗斯相关问题进行会谈】美国中东问题特使威特科夫表示,他将于今晚与美国总统国家安全事务助理迈克·华尔兹一起前往沙特阿拉伯,就俄罗斯相关问题进行会谈。威特科夫表示,希望此次会谈能在俄乌冲突问题上取得一些真正良好的进展。他还称,美国官员也在与乌克兰官员进行单独交谈。乌克兰第一副总理、经济部长尤利娅·斯维里坚科当天则表示,乌克兰政府代表团已开始在沙特筹备乌克兰总统泽连斯基访问沙特。此前多家媒体15日援引美方官员的消息报道,美国国务卿鲁比奥等高级官员定于未来数天内在沙特阿拉伯与俄方代表就乌克兰问题开始谈判,同时为普京与特朗普会面做准备。 -
趋势起航今天 15:15:02
【以色列内阁投票确认扎米尔为下任以军总参谋长】以色列内阁已正式投票确认埃亚勒·扎米尔为以国防军下任总参谋长。扎米尔将于3月5日就职。根据以色列法律,以军总参谋长人选必须先通过高级任命咨询委员会的审查,然后再由内阁投票确认。即将离任的以军总参谋长哈莱维于今年1月21日发表声明说,在2023年10月7日巴勒斯坦伊斯兰抵抗运动(哈马斯)对以色列的袭击中,以军应对失误,自己对此负有责任,因此申请于3月6日辞职,并已将辞职信递交给以色列国防部长卡茨和总理内塔尼亚胡。 -
趋势起航今天 15:10:48
以色列政府批准任命埃亚勒·扎米尔 (Eyal Zamir)为下一任以色列国防军参谋长。 -
趋势领涨今天 11:48:52
中信建投(sh601066)策略陈果团队发文称,当前内需平稳开局,外需扰动有限,稳增长导向明确、地产逐步走出需求冰点、政策推动增量资金入市等因素支撑下,中期市场仍将维持震荡上行趋势不变。近期科技板块涨幅已较可观,部分主题方向短期交易指标存在过热,但对比23年的基本面逻辑,本轮科技行情演绎预计仍有空间,包括港股科技巨头在内的一批代表性公司的估值中枢与上沿也有理由明显高于过去两年,而具体演绎预计科技主线内部可能存在一定的轮动。 -
趋势领涨今天 11:20:10
【“惠“聚元宵】乐享头彩!即日起《潜伏擒牛》VIP课程全场六折,半年VIP课程低至881元/月;更有月课1088元/月,季课6折3088元/三个月。活动过后价格会提升,切勿错过!加入至尊擒牛VIP:享四大顶级服务 【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每日一份高端内部绝密文章:包含明日布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!赶紧戳,直接购买:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 09:42:23
【财政部划转中国农业再保险55.9%股份至中央汇金】中国农业再保险股份有限公司2月14日公告,其控股股东财政部将其持有的中国农业再保险的全部股份(占总股本的55.90%),无偿划转给中央汇金投资有限责任公司。划转完成后,财政部将不再持有任何中国农业再保险股权,中央汇金将持有中国农业再保险约55.90%股份,成为公司控股股东。 -
趋势起航今天 09:19:42
【北京发布网络平台交易新规 未经同意不得滥发营销短信】北京市市场监管局近日公布《网络交易平台经营者服务协议与交易规则合规指引》《网络交易平台经营者信息公示与披露合规指引》《网络交易平台经营者禁限售商品管理合规指引》。指引提出,不得编造、修改、删除、屏蔽消费者的评价信息,也不得好评前置、差评后置误导消费者。自动续费前五日应以显著方式提醒,并提供简便的随时取消或变更选项。 -
趋势起航今天 09:03:21
2015年发生股.灾时,中证金融公司和中央汇金作为国家队救市,买了很多股票,后来中证金融公司一部分股票减持,另一部分股票都转给了中央汇金。现在财政部和中证金融公司又将很多股票转移给了中央汇金,中央汇金的大股东是中投公司,中投公司有四张牌照,中央汇金现在又收到了中证金、信达、长城等三张牌照,相当于中央汇金现在手握七张牌照,后期进行证券整合、处理不良资产是手到擒拿,所以,证券整合、资产重组应该要拉开序幕,下周就看市场炒不炒作了!中金公司(sh601995)现在有钱,有股票,基本能够控制整个市场,所以,将他们称之为平准基金,应该不为过!但经过这次整合以后,后期应该不会推出平准基金了,中央汇金大概率就是所谓的平准基金。 -
趋势领涨今天 07:44:23
周末最大的王炸来了,腾讯的微信正式接入DeepSeek。只要成功接入,那全球范围内没有比DS用户更多的大模型!上一个享受这个待遇是华为鸿蒙,而且鸿蒙是搞了很多年才各方支持的!DeepSeek横空出世不到一个月,就得到了所有巨头的支持,这才叫国运级的产品。DeepSeek破圈最大的作用,就是带来全球AI的平权,我们是最大的受益者!有了AI的助力,人工智能、无人驾驶、低空经济、机器人(sz300024)等新兴产业就能全面发力,让我们的经济换道超车,迎来新一轮增长周期!中国资产、中国科技也会迎来全面重估,A股慢牛也有望正式开启。 -
趋势领涨今天 07:14:00
许多外资巨头看到了中国高科(sh600730)技的力量,纷纷改变了对中国高科(sh600730)技的看法,纷纷唱多中国资产,唱多中国股市。A股科技股迎来一波牛市行情。瑞银给出中美上市公司对标的名单:英伟达——寒武纪(sh688256)(估值比英伟达高312%)、海光信息(sh688041)、地平线机器人(sz300024)、黑芝麻(sz000716)智能;特斯拉——小米集团和理想汽车,折价竟然高达80%甚至90%;台积电——对标中芯国际(sh688981)和华虹半导体;思科——对标中兴通讯(sz000063);meta——对标腾讯;亚马逊——对标阿里巴巴;谷歌——对标百度;阿斯麦——对标北方华创(sz002371)。