
深度求索公司研发的DeepSeek大模型最近“出圈”,其实,国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到,上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4,改用DeepSeek-V3生成合成数据,开发垂类大模型。达观数据公司去年5月就引入DeepSeek-V2大模型,开发办公智能体(Agent),取得了很好效果。“DeepSeek的性价比极高,而且全面开源,对产业应用很友好。”达观数据董事长、首席执行官陈运文博士说。
大幅提高办公智能体的专业能力
近年来,赵海团队利用GPT-4等基座大模型,为政府和企业开发了十多个垂类大模型。在开发过程中,基座大模型的主要作用是生成合成数据。这类数据通过人工方式生成,而不是从真实世界中获取,用于训练大模型。“我用过一些国产基座大模型,它们的效果和GPT-4比起来,还是有一定差距。”赵海教授告诉记者,“但使用DeepSeek-V3后,我发现它的性能与GPT-4处于同一量级,而价格只有GPT-4的十分之一,所以现在不用GPT-4了。”与赵海团队相比,达观数据使用DeepSeek更早。陈运文介绍,DeepSeek-V2是一个精简高效的开源模型,只需要相对低配的GPU和显卡内存,就能让办公智能体获得很好的推理效果。DeepSeek-V3发布后,这家上海人工智能企业立即成为它的用户。“这个大模型有6710亿参数,激活参数为370亿,在14.8万亿token(词元)上进行了预训练,生成速度比上一个版本V2.5模型提升3倍,达到每秒吞吐量60token。”陈运文介绍,“V3对GPU资源的使用效率极高,因为很多单位没有庞大的GPU集群,DeepSeek这种低资源、高效果的特性有利于今后大规模推广应用。”DeepSeek-V3为何对GPU资源的使用效率极高?陈运文解释,它运用了多种技术创新,如采用MLA(多头潜在注意力)架构,成功压缩了键值缓存;使用对偶流水线机制,通过设计流水线调度,让GPU算力和通信算力在训练中并行隐藏,成功减少了计算瓶颈,实现几乎不间断的运算;还使用PTX这一接近汇编语言的低级指令集,对GPU进行细致控制,如调整寄存器分配和线程运行方式,从而更精细地管理GPU资源。本月发布的推理大模型DeepSeek-R1在复杂的数学和逻辑任务上表现优秀,达观数据使用后,大幅度提升了办公智能体在审阅处理复杂的工程报告、金融文书、财务报表、招投标书等专业文档上的能力。

R系列模型将推动科学智能发展
“DeepSeek-V3和DeepSeek-R1的问世,是大模型领域的标志性事件。”赵海认为,大模型近年来的发展历程可分为三个阶段:第一阶段的标志性事件是ChatGPT问世,其表现令人惊艳,但因为不开源,大多数开发者并不清楚这个大模型是如何开发出来的;在第二阶段,很多团队重现了ChatGPT开发过程,涌现出Llama、Qwen等一批开源大模型,这类模型的性能越来越强,但与OpenAI发布的大模型相比,存在一定差距;DeepSeek-V3和DeepSeek-R1则开启了第三阶段,它们的性能可分别比肩GPT-4和OpenAI o1,意味着开源大模型终于追赶上了闭源大模型。
这位长期研究自然语言处理的学者说,自从OpenAI在2020年发布不开源的GPT-3以来,这家标榜“从事开放性人工智能研究”的机构就背离了初心。如今,随着深度求索公司的异军突起,大模型研发可谓“回归初心”,让开源再度成为业内的主流形态。通过深度求索发布的技术报告,全球开发者都分享到了中国研发团队的创新智慧。可以预见,DeepSeek将引发大模型创新和产业生态的变革。
未来,DeepSeek的R系列推理大模型最值得关注。赵海解释:“过去,ChatGPT等大模型像文科生,不擅长理科和逻辑推理。而对人类智慧来说,最底层的智慧是逻辑,逻辑之上是数学,再上面是物理、化学等科学。”去年9月,OpenAI发布的o1推理大模型改变了“文科生”形象,它擅长逻辑推理和数学,为今后将大模型用于科学研究、处理复杂任务奠定了基础。
目前,DeepSeek-R1的性能与OpenAI o1不分上下,为中国的科学智能(AI for Science)发展提供了利器。在赵海看来,人工智能这门学科的终点是“人工大脑”问世,这种通用人工智能(AGI)设备可用于研究数学、自然科学、社会科学等各个专业领域的复杂问题。未来20年内,科学家有望开发出“人工大脑”,从而颠覆现有的科研范式,使人类获取新知识和解决方案的效率大幅提升。
深度求索创始人梁文锋近日接受专访时表示,DeepSeek的终极目标是实现通用人工智能,而非仅仅追求商业化应用,“生成式AI只是通往AGI的必经之路,AGI有望在我们有生之年实现”。
原标题:GPT-4下岗了,上海高校和企业用DeepSeek开发大模型和智能体


APP专享直播
热门推荐
接吻时长世界纪录保持者夫妇分手,曾连续吻了58小时35分钟 收起接吻时长世界纪录保持者夫妇分手,曾连续吻了58小时35分钟
- 2025年02月27日
- 08:58
- APP专享
- 扒圈小记
29,058
微博:为避免体育极端饭圈行为波及到运动员,解散相关运动员超话
- 2025年02月27日
- 15:01
- APP专享
- 扒圈小记
9,065
余华英被执行死刑
- 2025年02月28日
- 04:21
- APP专享
- 北京时间
7,904

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
数字江恩今天 10:28:08
由于下周依旧处于宽幅震荡时间内,所以图上的蓝色轮谷线跌破之后便成为压力。下周任何反弹都难以站上蓝色轮谷线,只是依照3306来判断大盘是反复反抽震荡,还是稍微下移一些空间。 -
数字江恩今天 10:28:03
这里有必要分辨一下下周属于高位震荡结构,还是深幅回踩结构。如果是高位震荡结构,那么3306正常支撑震荡,即高点回撤70-80点水平。如果跌破3306,那么便是图上的白色震荡结构向下扩展,正常也在2倍螺旋之内。无论是哪一种结构,其实都不威胁到15分钟级别的轮峰线。 -
数字江恩今天 10:28:00
5分钟图来说,春节之后是沿着蓝色轮谷线向上运行的,3140之后则是沿着红色轮谷线向上运行。周四假突破3386之后,周五的大阴线将两条轮谷线都跌破了。【更多独家重磅股市观点请点击】 -
数字江恩今天 10:27:43
大盘窄幅波动中,假突破特别多,首先看15分钟图。3494后的下跌12345+abc反弹已经完成,目前处于宽幅震荡结构之中,而且整个下周时间都在这个宽幅震荡时间之内。从结构来看,图上的15分钟级别蓝色轮峰线突破后,震荡只要不跌回去都是正常震荡,震荡之后还可以有新的上涨。所以这条轮峰线是看震荡结构是否健康的标准。【更多独家重磅股市观点请点击】 -
数字江恩今天 10:27:34
板块上,本周前热点在高位的科技、机器人(sz300024)回撤较大,而低位的消费类、新能源类表现不错。连酿酒都能连续拉起来,可见市场的风险厌恶情绪增大,高位股短期内表现都不会好。 -
数字江恩今天 10:27:29
大盘本周放量持续温和放量,周一到周四缓慢攀升,但周五一根大阴线吃掉了所有涨幅,打到了上周周线几乎最低点。目前5周线维持金叉10周线,而周五大阴线收盘价便是正好5周线位置。 -
数字江恩今天 10:27:22
下周行情展望2025.02.28 -
股道龙门今天 08:49:36
今日大跌核心原因解析1、外部压力: 地缘政治风险升温:中越外交磋商强化区域合作,但美国对欧盟加征关税、特朗普对墨西哥关税政策落地,引发全球供应链扰动预期。 流动性预期反复:美联储降息节奏分歧(哈克称“利率或长期维持高位”),叠加英伟达单日市值蒸发近2万亿,压制全球科技股风险偏好。 隔夜外围表现:隔夜美股纳指大跌2.78%,英伟达暴跌8%,纳斯达克中国金龙指数重挫5.24%,全球科技股估值修正压力直接冲击A股相关板块2、内部调整压力: 政策真空期博弈:两会前资金兑现高估值板块(如AI算力、机器人(sz300024)),转向防御性资产(煤炭、公用事业)。 技术面超买回调:上证指数3400点附近抛压集中释放,触发量化策略止损盘,北向资金单周净流出8.73亿元。—— 不利因素已在今日大跌中彻底消化,未来市场走向该如何把握? 下周两会将细化“新质生产力”支持措施,预计出台AI算力基建(华为沙漠光伏项目)、机器人(sz300024)产业化(蚂蚁集团(sh688688)具身智能)等专项政策;《2025年能源工作指导意见》明确非化石能源占比提升至20%,光伏柔性支架(华能1GW招标)、储能(特斯拉上海工厂)等领域受益;广东“金融强省”规划、国企市值管理考核强化,低估值央企(电力、军工)或迎价值重估。—— 当前市场调整是短期的情绪释放和筹码重构,基于政策全面发力、产业技术突破、资金增配势能三大核心要素,A股中长期上涨逻辑明确。随着市场逐步稳定,两会中的重要产业或是未来投资的主要方向,大家反倒可以利用本轮调整尽快做出战略调整!- 数据来源:东方财富(sz300059)- 以上内容仅供参考,不构成投资建议,股市有风险,入市须谨慎!内容来源华源证券投顾万雷,执业编号:S1350623120005 -
宋谈股经今天 08:34:48
【VIP教室】组合个股前天空仓,短期躲过大跌,下周寻找布局机会,组合个股教学,速戳抢购查阅〉〉【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
北京红竹今天 08:26:55
3、情绪最差的一天上涨570家,下跌4773家,涨停46家,跌停47家2月份还是第一次跌停家数这么多,看来获利筹码这么多,一次性都倒出来了。人形机器人(sz300024)也跌破防守线了,指数大跌7.26%,DS也跌破防守线了,指数大跌5.07%。这是最近这几天,我反复强调了,所有关注的指数都出现防守线了,并且科创50和人形机器人(sz300024)是五分钟级别2个中枢的上涨。这次踏实了,踏踏实实待几天,下一波继续干。