IT之家的家友们,蛇年吉祥!
在这个农历新年期间,科技界却并不平静...
距离 OpenAI 发布由 GPT-3.5 模型驱动的 ChatGPT 聊天机器人(19.460, -0.36, -1.82%),已经过去了两年多的时间。
在这两年间,不管是微软、谷歌这样的科技巨头,还是如雨后春笋般出现的初创企业,都在 AI 大模型领域,投入了巨额的资源。
算力逐渐膨胀,大模型的训练及推理成本也同样水涨船高。
OpenAI 去年推出的 ChatGPT Pro 会员,价格已经来到了每月 200 美元。
“屠龙者终成恶龙”,每月 20 美元的 ChatGPT Plus 会员,包含的 o1 模型使用次数,可以说仅仅只够“玩一玩”,很难真的应用于自己的工作之中。
![](http://n.sinaimg.cn/spider20250129/316/w660h456/20250129/def4-e389724f53e27fc4b1211e646d2c18dd.jpg)
如果未来成本进一步上涨,难道 AI 的未来,是每月 2000 美元的“ChatGPT Pro Max 会员”吗?
然而,一家来自杭州的“小公司” DeepSeek,却给整个 AI 行业带来了新思路,这两天可以说是火遍了全网。IT之家这就来跟大家一起看看是怎么回事。
01.用起来怎么样?
去年年底,DeepSeek-V3 模型发布,其多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。
![](http://n.sinaimg.cn/spider20250129/378/w660h518/20250129/83c3-7308ea5d883c4465ddaac46e5e0fb8a4.jpg)
作为一款开源的 MoE 混合专家模型,DeepSeek-V3 当时获得了业内人士不少的关注,但是还并没有“出圈”。
不过,在 DeepSeek 官方的手机应用 1 月上旬上线之前,已经有一些山寨 App 准备凑热度了。
![▲极速推出的的山寨应用](http://n.sinaimg.cn/spider20250129/44/w660h184/20250129/9605-fa4aaa3d1b1440e769f35cd25e7c6759.jpg)
而 1 月 20 日发布的推理模型 DeepSeek-R1,则在性能上实现了对 OpenAI-o1 正式版的对标。
![](http://n.sinaimg.cn/spider20250129/343/w660h483/20250129/92da-482fdf25328319d121f092d77da1fd7b.jpg)
此外,DeepSeek 也并没有藏着掖着,同期公开了 DeepSeek-R1 的训练技术,并且开源了模型权重。
而且对我们普通用户来说,DeepSeek-R1 直接在其官网免费开放使用。
![](http://n.sinaimg.cn/spider20250129/123/w660h263/20250129/ac35-15a38421505babf63705807aaacd819c.jpg)
而且,DeepSeek-R1 还可以联网搜索信息,增加了不少使用上的灵活性。
要知道,去年 10 月 31 号上线的 ChatGPT Search 搜索功能目前还不支持与 ChatGPT o1 模型协同使用,我们只能退而求其次选择 4o 模型。
![](http://n.sinaimg.cn/spider20250129/205/w660h345/20250129/01e6-105dd0a05b62dbed614a216872f42e57.jpg)
此外,作为一款采用CoT 思维链技术的推理模型,DeepSeek-R1 直接把其思考过程显示给用户,这一点令我们可以直观感受到目前大模型技术的实力。
![](http://n.sinaimg.cn/spider20250129/354/w660h494/20250129/00d3-012d89ad326019c6a8d3d9bb3ab0aafc.jpg)
在海内外全网爆火的同时,DeepSeek 也承受了非常大的压力,相信我们不少家友都对下面这句话非常熟悉。
![](http://n.sinaimg.cn/spider20250129/143/w660h283/20250129/091a-5ac89692837f04da126ea101d7b10828.jpg)
除了大量用户的涌入,DeepSeek 甚至还承受了大规模的恶意攻击。
![](http://n.sinaimg.cn/spider20250129/393/w660h533/20250129/5f65-652fedd70161dfe4c7c06b5f95eeeb3b.jpg)
要知道,即便是 ChatGPT,也经常出现宿机事件,这方面也希望大家可以“理解万岁”。
除了 671B 参数的完整模型,DeepSeek 还蒸馏了好几款小模型,32B 和 70B 模型也在多项能力上实现了对标 OpenAI o1-mini 的效果。
![](http://n.sinaimg.cn/spider20250129/186/w660h326/20250129/ffee-b61a9903ef7a228aecee2aa579e16a23.jpg)
而这些蒸馏后的模型,我们已经可以尝试在自己的设备上,本地进行运行。
02.两把杀手锏- MoE混合专家模型
DeepSeek-R1 的成本优势,便在其官方 API 服务定价中体现了出来:
![](http://n.sinaimg.cn/spider20250129/282/w660h422/20250129/4d50-6acdeb4eb49d2dec41d0841aff500ae5.jpg)
其输出 API 价格,甚至只是 ChatGPT o1 的约 3%,这就要聊到 MoE 混合专家模型了。
IT之家前面提到,DeepSeek-R1 是一款 671B 参数的模型,从传统的角度来看,运行起来绝不会轻松。
而 MoE 架构的核心思想,其实就是将一个复杂的问题分解成多个更小、更易于管理的子问题,并由不同的专家网络分别处理。
![](http://n.sinaimg.cn/spider20250129/369/w660h509/20250129/e2fb-923c2effb454bca1a5ffa5dff0a91dee.jpg)
这样,当我们向 MoE 模型输入提示时,查询不会激活整个 AI,而只会激活生成响应所需的特定神经网络。
因此,R1 和 R1-Zero 在回答提示时激活的参数仅为 37B,不到其总参数量的十分之一,“让专业的人干专业的事”,推理成本大大降低。
其实,MoE 并不是一个新概念,最早起源于 1991 年的论文《Adaptive Mixture of Local Experts》。
不过这一思路的“起飞”,还要等到 2023 年 12 月 Mixtral 8x7B 模型的推出。
外界普遍认为GPT-4 就使用了 MoE 模型,但对于已经变成“CloseAI”的 OpenAI 来说,其旗舰模型的许多技术细节,我们无从得知......
- RL 强化学习
传统的 AI 大模型训练,使用的是SFT 监督微调过程,在精心策划的数据集上训练模型,教会它们逐步推理。
而 DeepSeek-R1 则使用 RL 强化学习的方法,完全依赖环境反馈(如如问题的正确性)来优化模型行为。
它也第一次证明了通过纯 RL 训练,即可提升模型的推理能力。模型在 RL 训练中自主发展出自我验证、反思推理等复杂行为,达到 ChatGPT o1 级别的能力。
这项技术,说明我们未来在训练的过程中,可能不再需要付出极为高昂的成本,获取大量经过详细标注的高质量数据。
03.多模态,补短板
尽管 DeepSeek-V3 和 DeepSeek-R1 十分强大,但他们还都是名副其实的“大语言模型”,并不具有多模态的能力。
也就是说,我们目前还没发把图片、音频等信息丢给他们,他们也不具备生成图片的能力,只能通过文字的方式来进行信息交流。
![](http://n.sinaimg.cn/spider20250129/150/w644h306/20250129/1200-281f4ee2aabc41b45a0d1935849123b2.jpg)
目前 DeepSeek 官方提供的文件上传能力,其实只是走了一遍文字 OCR 识别。
不过,就在 1 月 28 日凌晨,DeepSeek 开源了全新的视觉多模态模型 Janus-Pro-7B。
其在 GenEval 和 DPG-Bench 基准测试中击败了 Stable Diffusion 和 OpenAI 的 DALL-E 3。
![](http://n.sinaimg.cn/spider20250129/124/w640h284/20250129/5fab-0e43f7569d32b9518eabe90fc23e2d63.jpg)
![](http://n.sinaimg.cn/spider20250129/234/w640h394/20250129/cf7d-b6ada61d03ef29f6f84ccf7c18968060.jpg)
不过作为一款仅有 7B 参数的“小”模型,Janus-Pro目前只能处理 384 x 384 分辨率的图像。
但我们相信,这只是一道开胃菜,我们期待在新思路下,DeepSeek 未来多模态大模型的表现。
04.除夕不眠夜
DeepSeek 的爆火,让不少 AI 大模型领域的“友商”,都没法无视这样一家“小公司”。
今天(1 月 29 日)凌晨,农历新年的钟声刚刚敲响,阿里通义团队带来了他们的“新年礼物”——Qwen2.5-Max 模型。
![](http://n.sinaimg.cn/spider20250129/142/w660h282/20250129/f92f-8052953832a55605cbbf15f8e19f75a4.jpg)
通义千问团队,也在 Qwen2.5-Max 模型的介绍中提到了 DeepSeek-V3。
与业界领先的模型(包括 DeepSeek V3、GPT-4o 和 Claude-3.5-Sonnet)相比,Qwen2.5-Max 的性能表现也相当有竞争能力。
![](http://n.sinaimg.cn/spider20250129/236/w660h376/20250129/5669-86934dcb6612eb4d5597c6ba61199586.jpg)
在基座模型的对比中,与目前领先的开源 MoE 模型 DeepSeek V3、最大的开源稠密模型 Llama-3.1-405B 相比,Qwen2.5-Max 在大多数基准测试中都展现出了优势。
![](http://n.sinaimg.cn/spider20250129/232/w660h372/20250129/e189-c292493f8f298de1aa958aebc8ea551e.jpg)
目前 Qwen2.5-Max 已经面向用户开放,不过作为“Max”定位的模型,Qwen2.5-Max 暂未开源。
![](http://n.sinaimg.cn/spider20250129/315/w660h455/20250129/91fb-5ae1bb889cbc94b3481195ff5103fb5d.jpg)
而与 DeepSeek-R1 的直接对决,我们可能要等到未来新版的 QwQ、QVQ 模型。
OpenAI 的 CEO 阿尔特(12.120, -0.09, -0.74%)曼也对 DeepSeek-R1 进行了评价:
![▲很“官方”的标准回答](http://n.sinaimg.cn/spider20250129/437/w660h577/20250129/c2f1-cee7e256d6490ea8ff138cecd8d3a607.jpg)
面对大家价格上的抱怨,阿尔特曼也表示未来的 ChatGPT o3-mini 模型将会开放给免费用户使用,Plus 会员则每天有 100 条请求的额度。
此外,新的 ChatGPT Operator 功能也将尽快向 Plus 会员开放,而 OpenAI 的下一款模型也不会由每月 200 美元的 Pro 会员独占,Plus 会员就能用
![](http://n.sinaimg.cn/spider20250129/339/w660h479/20250129/0ff6-5eaa1e0948b205997e184fe7866f720c.jpg)
这究竟是来自于 DeepSeek 等竞争对手的压力,还是 OpenAI 自身的成本优化,我们不得而知。
我们期待着在 2025 年,还会有哪些关键领域的突破,AGI通用人工智能是不是也离我们越来越近了。
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
APP专享直播
热门推荐
酒后在小区挪车被认定醉驾吊销驾照,司机起诉交警!法院判了 收起酒后在小区挪车被认定醉驾吊销驾照,司机起诉交警!法院判了
- 2025年02月15日
- 11:55
- APP专享
- 扒圈小记
29,865
事闹大了,前国乒教练尹肖驳斥吴敬平:颠倒黑白!
- 2025年02月16日
- 07:07
- APP专享
- 扒圈小记
2,808
重庆燃气道歉:针对燃气收费问题已派驻整改督导专班
- 2025年02月16日
- 09:51
- APP专享
- 北京时间
2,326
![新浪财经公众号 新浪财经公众号](http://n.sinaimg.cn/finance/72219a70/20180103/_thumb_23666.png)
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势起航今天 15:45:04
【美官员将前往沙特 就俄罗斯相关问题进行会谈】美国中东问题特使威特科夫表示,他将于今晚与美国总统国家安全事务助理迈克·华尔兹一起前往沙特阿拉伯,就俄罗斯相关问题进行会谈。威特科夫表示,希望此次会谈能在俄乌冲突问题上取得一些真正良好的进展。他还称,美国官员也在与乌克兰官员进行单独交谈。乌克兰第一副总理、经济部长尤利娅·斯维里坚科当天则表示,乌克兰政府代表团已开始在沙特筹备乌克兰总统泽连斯基访问沙特。此前多家媒体15日援引美方官员的消息报道,美国国务卿鲁比奥等高级官员定于未来数天内在沙特阿拉伯与俄方代表就乌克兰问题开始谈判,同时为普京与特朗普会面做准备。 -
趋势起航今天 15:15:02
【以色列内阁投票确认扎米尔为下任以军总参谋长】以色列内阁已正式投票确认埃亚勒·扎米尔为以国防军下任总参谋长。扎米尔将于3月5日就职。根据以色列法律,以军总参谋长人选必须先通过高级任命咨询委员会的审查,然后再由内阁投票确认。即将离任的以军总参谋长哈莱维于今年1月21日发表声明说,在2023年10月7日巴勒斯坦伊斯兰抵抗运动(哈马斯)对以色列的袭击中,以军应对失误,自己对此负有责任,因此申请于3月6日辞职,并已将辞职信递交给以色列国防部长卡茨和总理内塔尼亚胡。 -
趋势起航今天 15:10:48
以色列政府批准任命埃亚勒·扎米尔 (Eyal Zamir)为下一任以色列国防军参谋长。 -
趋势领涨今天 11:48:52
中信建投(sh601066)策略陈果团队发文称,当前内需平稳开局,外需扰动有限,稳增长导向明确、地产逐步走出需求冰点、政策推动增量资金入市等因素支撑下,中期市场仍将维持震荡上行趋势不变。近期科技板块涨幅已较可观,部分主题方向短期交易指标存在过热,但对比23年的基本面逻辑,本轮科技行情演绎预计仍有空间,包括港股科技巨头在内的一批代表性公司的估值中枢与上沿也有理由明显高于过去两年,而具体演绎预计科技主线内部可能存在一定的轮动。 -
趋势领涨今天 11:20:10
【“惠“聚元宵】乐享头彩!即日起《潜伏擒牛》VIP课程全场六折,半年VIP课程低至881元/月;更有月课1088元/月,季课6折3088元/三个月。活动过后价格会提升,切勿错过!加入至尊擒牛VIP:享四大顶级服务 【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每日一份高端内部绝密文章:包含明日布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!赶紧戳,直接购买:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 09:42:23
【财政部划转中国农业再保险55.9%股份至中央汇金】中国农业再保险股份有限公司2月14日公告,其控股股东财政部将其持有的中国农业再保险的全部股份(占总股本的55.90%),无偿划转给中央汇金投资有限责任公司。划转完成后,财政部将不再持有任何中国农业再保险股权,中央汇金将持有中国农业再保险约55.90%股份,成为公司控股股东。 -
趋势起航今天 09:19:42
【北京发布网络平台交易新规 未经同意不得滥发营销短信】北京市市场监管局近日公布《网络交易平台经营者服务协议与交易规则合规指引》《网络交易平台经营者信息公示与披露合规指引》《网络交易平台经营者禁限售商品管理合规指引》。指引提出,不得编造、修改、删除、屏蔽消费者的评价信息,也不得好评前置、差评后置误导消费者。自动续费前五日应以显著方式提醒,并提供简便的随时取消或变更选项。 -
趋势起航今天 09:03:21
2015年发生股.灾时,中证金融公司和中央汇金作为国家队救市,买了很多股票,后来中证金融公司一部分股票减持,另一部分股票都转给了中央汇金。现在财政部和中证金融公司又将很多股票转移给了中央汇金,中央汇金的大股东是中投公司,中投公司有四张牌照,中央汇金现在又收到了中证金、信达、长城等三张牌照,相当于中央汇金现在手握七张牌照,后期进行证券整合、处理不良资产是手到擒拿,所以,证券整合、资产重组应该要拉开序幕,下周就看市场炒不炒作了!中金公司(sh601995)现在有钱,有股票,基本能够控制整个市场,所以,将他们称之为平准基金,应该不为过!但经过这次整合以后,后期应该不会推出平准基金了,中央汇金大概率就是所谓的平准基金。 -
趋势领涨今天 07:44:23
周末最大的王炸来了,腾讯的微信正式接入DeepSeek。只要成功接入,那全球范围内没有比DS用户更多的大模型!上一个享受这个待遇是华为鸿蒙,而且鸿蒙是搞了很多年才各方支持的!DeepSeek横空出世不到一个月,就得到了所有巨头的支持,这才叫国运级的产品。DeepSeek破圈最大的作用,就是带来全球AI的平权,我们是最大的受益者!有了AI的助力,人工智能、无人驾驶、低空经济、机器人(sz300024)等新兴产业就能全面发力,让我们的经济换道超车,迎来新一轮增长周期!中国资产、中国科技也会迎来全面重估,A股慢牛也有望正式开启。 -
趋势领涨今天 07:14:00
许多外资巨头看到了中国高科(sh600730)技的力量,纷纷改变了对中国高科(sh600730)技的看法,纷纷唱多中国资产,唱多中国股市。A股科技股迎来一波牛市行情。瑞银给出中美上市公司对标的名单:英伟达——寒武纪(sh688256)(估值比英伟达高312%)、海光信息(sh688041)、地平线机器人(sz300024)、黑芝麻(sz000716)智能;特斯拉——小米集团和理想汽车,折价竟然高达80%甚至90%;台积电——对标中芯国际(sh688981)和华虹半导体;思科——对标中兴通讯(sz000063);meta——对标腾讯;亚马逊——对标阿里巴巴;谷歌——对标百度;阿斯麦——对标北方华创(sz002371)。