幻方量化梁文峰和DeepSeek

幻方量化梁文峰和DeepSeek
2025年01月26日 10:09 市场资讯

专题:DeepSeek为何能震动全球AI圈

  来源:全产业链研究

  1月20日下午,总理主持召开专家、企业家和教科文卫体等领域代表座谈会。

  此前,非常少露面的DeepSeek老板梁文锋,受邀参加并发言。

  中国AI界的传奇大佬,真人比想象中还年轻啊,皮肤保养好,看着还以为是学生代表。

  这是见证历史性一刻,AI大佬上新闻联播了。

  在参加总理会议的同一天,DeepSeek在官微上,发布了DeepSeek-R1 发布,性能对标 OpenAI o1 正式版。

  DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

  在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

  R1的32B和70B版本,性能远远超过了OpenAI的GPT-4o,并逼近 o1-mini。

  现在,DeepSeek已经全面上线了 R1,大家可以直接体验。

  美国建筑设计工作室 Workshop-APD 的创始人Matthew Berman 表示:DeepSeek R1 拥有我所见过的最像人类的内心独白。

  现在本地运行的 14b DeepSeek R1 蒸馏模型,能够把问题回答成这样,咱还要啥自行车呢?

  17岁考入浙大

  30岁创办幻方

  如此厉害的DeepSeek大模型,背后并是不什么互联网科技大厂,而是炒股的。

  DeepSeek深度求索,来自金融领域的头部量化:幻方量化。

  梁文锋是幻方量化的实际控制人,他在DeepSeek最终受益的股份比例超80%。

  1985年,梁文锋出生于广东湛江,那里盛产生蚝。他本硕就读于浙江大学,攻读人工智能,年轻读书时就笃定“AI定会改变世界”。

  2008年,在浙大读书期间,23岁的梁文锋与同学一起组团队开始积累市场行情数据、金融市场其他相关数据以及宏观经济等数据。

  梁文锋开始使用机器学习等技术,探索量化交易。

  他的硕士毕业论文题目是《基于低成本PTZ摄像机的目标跟踪算法研究》。

  梁文锋表示:自己是八十年代在广东一个五线城市长大的。

我的父亲是小学老师,九十年代,广东赚钱机会很多,当时有不少家长到我家里来,基本就是家长觉得读书没用。

但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。

  毕业后,梁文锋没去做程序员,而是下场做量化投资,成立幻方量化。

  他主导的幻方量化在2016年首次上线AI策略,并于2017年实现投资策略全面AI化,成为量化投资领域的创新先锋。

  幻方量化成立仅6年管理规模即曾达到千亿,被称为‘量化四大天王’之一。

  也是国内唯一公开宣称有拥有万张英伟达A100显卡的企业,其算力储备量就算是在一众互联网公司科技公司里,也豪不逊色。

  2023年,梁文锋创立了深度求索(DeepSeek)。

  有消息称,DeepSeek团队不招聘高级技术专业人员。

  员工的工作年限约为3到5年,而那些拥有8年以上研发经验的人还可能会被直接拒绝。因为他们害怕这样的人包袱太重、缺乏创新的动力。

  梁文锋曾对36氪暗涌说:

  “如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性、热爱等更重要。”

  就像大家不可能猜到,做游戏显卡的英伟达,最后会成为AI界最重要的公司。

  大家也不可能猜到,中国AI大模型的希望,可能就在炒股的公司身上。

  背靠幻方量化的DeepSeek还不差钱。

  梁文锋在2024年表示,短期内没有融资计划,面临的问题从来不是钱,而是高端芯片被禁运。

  不参与融资,也很少对外发声,闷声去做AI。

  外界都觉得DeepSeek很神秘。

  近期“雷军千万年薪挖95后天才AI少女”的热门话题也间接地与梁文锋有关,因为雷军尝试挖走的这位90后少女罗福莉,此前正是梁文锋旗下深度求索(DeepSeek)团队的研发成员。

  2024年12月26日,DeepSeek发布了DeepSeek-V3,并且还公开了由梁文锋、罗福莉等人撰写的53页论文《DeepSeek-V3 Technical Report》。

  AI界拼多多

  此前DeepSeek一直被冠以“AI界拼多多”。

  它开启了中国大模型价格战。

  2024年5月,DeepSeek发布的一款名为DeepSeek V2的开源模型,提供了史无前例的性价比:

推理成本被降到每百万token仅 1块钱,在当时约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。

  随后,字节、腾讯、百度、阿里、kimi等AI公司跟随降价。

  梁文锋表示,自己不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。没想到价格让大家这么敏感。只是按照自己的步调来做事,然后核算成本定价。

  这次新发布的DeepSeek-R1 API 价格,一样给力。

  DeepSeek-R1 API定价为:每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。

  对比OpenAI o1 的 API 定价:每百万输入 tokens 15 美元、每百万输出 tokens 60 美元。

  每百万输出定价,大概仅为OpenAI的3.65%。

  DeepSeek极高的性价比,简直是AI大模型界的拼多多。

  DeepSeek还继续开源到底,放出了背后的研究论文。

  DeepSeek-R1的推理能力蒸馏到较小的密集模型中,展示了较小模型也可以拥有强大的推理能力。

  使用Qwen和Llama系列模型进行蒸馏,结果表明蒸馏后的模型在基准测试上表现优异,例如DeepSeek-R1-Distill-Qwen-14B在AIME 2024上的通过率为69.7%。

  Deepseek不会闭源,他们认为先有一个强大的技术生态更重要。MIT 授权:自由提炼和商业化!

  英伟达的高级研究科学家Jim Fan(范麟熙)对DeepSeek-R1的评价是:

  我们生活在这样一个时代:一家非美国公司正在让 OpenAI 的初衷得以延续——真正开放、为所有人赋能的前沿研究。这毫无意义。最有趣的结果才是最有可能的。

  DeepSeek-R1 不仅开源了一系列模型,还公开了所有训练秘诀。它们可能是第一个展示 RL 飞轮重大、持续增长的 OSS 项目。

  梁文锋曾总结过,中国AI和美国AI的差距。

我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。

海量资讯、精准解读,尽在新浪财经APP

责任编辑:何俊熹

6条评论|21人参与网友评论
最热评论
大胃王Xeca江苏盐城
量化交易在股市横扫一切,梁文锋贡献巨大
1月26日21:35举报6回复
解忧猫Barista广东佛山
问同样的问题给豆包和DeepSeek,豆包的回答详细多了。感觉深度探索有点过度炒作
1月26日20:37举报6回复
幻方量化靠AI发家,DeepSeek会不会成下一个巨头
1月26日19:41举报1回复
大胃王Xeca江苏盐城
量化交易在股市横扫一切,梁文锋贡献巨大
1月26日21:35举报6回复
解忧猫Barista广东佛山
问同样的问题给豆包和DeepSeek,豆包的回答详细多了。感觉深度探索有点过度炒作
1月26日20:37举报6回复
幻方量化靠AI发家,DeepSeek会不会成下一个巨头
1月26日19:41举报1回复

APP专享直播

开播时间 | 2-23 19:00
华安基金:ETF会客室:港股领涨全球,如何把握投资机会?
开播时间 | 2-23 14:00
纳米AI搜索新能汽车活动:首批幸运车主和周鸿祎面对面
开播时间 | 2-23 14:00
2025巴菲特致股东信来了!第一时间解读
开播时间 | 2-22 15:00
第八届中国企业改革发展峰会:尹艳林、刘俏、樊纲等演讲
开播时间 | 2-22 14:00
人工智能的未来:从科研到产业化
开播时间 | 2-22 09:00
CMF研讨会:读懂价格信号,稳住经济大盘
开播时间 | 2-21 20:12
2025蛇年投资大趋势——寻找科技浪潮机会 
开播时间 | 2-21 19:55
《智客星球》大辩论:200+企业押注DeepSeek,谁是AI新王?
开播时间 | 2-21 16:00
光大证券李泉:AI、国产芯片迎来风口,沪指再创反弹新高
开播时间 | 2-21 15:30
国投瑞银:“债”与你相遇 | 2月债市等待破局?
开播时间 | 2-23 19:00
华安基金:ETF会客室:港股领涨全球,如何把握投资机会?
开播时间 | 2-23 14:00
纳米AI搜索新能汽车活动:首批幸运车主和周鸿祎面对面
开播时间 | 2-23 14:00
2025巴菲特致股东信来了!第一时间解读
开播时间 | 2-22 15:00
第八届中国企业改革发展峰会:尹艳林、刘俏、樊纲等演讲
开播时间 | 2-22 14:00
人工智能的未来:从科研到产业化
开播时间 | 2-22 09:00
CMF研讨会:读懂价格信号,稳住经济大盘
开播时间 | 2-21 20:12
2025蛇年投资大趋势——寻找科技浪潮机会 
开播时间 | 2-21 19:55
《智客星球》大辩论:200+企业押注DeepSeek,谁是AI新王?
开播时间 | 2-21 16:00
光大证券李泉:AI、国产芯片迎来风口,沪指再创反弹新高
开播时间 | 2-21 15:30
国投瑞银:“债”与你相遇 | 2月债市等待破局?
上一页下一页
1/10

热门推荐

特朗普要求从乌克兰获得任何能得到的东西 以收回投入的资金 收起
特朗普要求从乌克兰获得任何能得到的东西 以收回投入的资金

特朗普要求从乌克兰获得任何能得到的东西 以收回投入的资金

  • 2025年02月22日
  • 22:30
  • APP专享
  • 扒圈小记
  • 31,186
APP专享
国能置业公司发布关于网络关注员工招聘情况的说明

国能置业公司发布关于网络关注员工招聘情况的说明

  • 2025年02月23日
  • 06:09
  • APP专享
  • 扒圈小记
  • 2,549
APP专享
于东来:胖东来超市公司决定在郑州开店

于东来:胖东来超市公司决定在郑州开店

  • 2025年02月23日
  • 02:31
  • APP专享
  • 北京时间
  • 2,400
APP专享
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间
更多>
股票简称 最新价 涨跌幅
以下为热门股票
三峡能源 4.27 +0.95%
京东方A 4.54 +0.89%
TCL科技 4.87 +0.41%
中远海控 14.35 0.00%
格力电器 41.36 -1.17%
广告

7X24小时

  • 01-17 宏海科技 920108 5.57
  • 01-16 亚联机械 001395 19.08
  • 01-16 海博思创 688411 19.38
  • 01-14 富岭股份 001356 5.3
  • 01-13 超研股份 301602 6.7
  • 广告
    新浪首页 语音播报 相关新闻 返回顶部