由国产大模型公司杭州深度求索开发的Deepseek应用27日登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT,在中国、美国的科技圈受到广泛关注。
环球时报27日称,Deepseek被认为是大模型行业的最大“黑马”,在外网被不少人称为“神秘的东方力量”。


DeepSeek成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
2024年12月,DeepSeek-V3发布。AI数据服务公司Scale AI创始人Alexander Wang就发帖称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”
今年1月20日,DeepSeek正式开源R1推理模型,“物美价廉”的特性在海外开发者社区中引发了轰动。
目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。
长安街知事(微信ID:Capitalnews)注意到,DeepSeek备受关注的原因主要是性价比、开源及推理能力的提升等方面。
在性价比上,DeepSeek R1成本很低,预训练费用只有557.6万美元,不到OpenAI GPT-4o模型训练成本的十分之一。DeepSeek还公布了API(应用程序编程接口)的定价,收费大约是OpenAI o1运行成本的三十分之一。
同时,DeepSeek与外国大模型巨头闭源的路径不同,采用开源模式。DeepSeek公布了相关论文,整个过程可复现。
网络上已经出现了一波复现热潮,加州大学伯克利分校、香港科技大学、知名人工智能公司HuggingFace等纷纷成功复现,复现成本甚至低至几十美元。
报道称,中国DeepSeek的模型是开源的,是令人兴奋的真正原因,他们将制造这些东西的知识免费提供给全世界,确保没有人能够真正垄断它。
而美国公司和中国公司的做法截然相反。“你能看到OpenAI、Anthropic或谷歌开源任何强大的模型吗?到目前为止,我们从他们那里得到的只是皮毛。”
英伟达高级研究科学家Jim Fan在个人社交平台上公开发表推文表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”
在推理能力方面,据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
这种卓越的性能不仅吸引了科技界的广泛关注,也让投资界看到了其巨大的商业潜力。

据悉,DeepSeek的团队不到140人。工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,工作时间都不长。
《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。

责任编辑:何俊熹








APP专享直播
热门推荐
特朗普批评泽连斯基:三年前就该结束这一切 收起特朗普批评泽连斯基:三年前就该结束这一切
- 2025年02月19日
- 00:27
- APP专享
- 扒圈小记
11,592
事发上海!妻子被撞,丈夫拦停酒驾肇事逃逸者,致其十级伤残,被索赔30万,法院判了
- 2025年02月18日
- 14:18
- APP专享
- 扒圈小记
3,537
明查|德国防长称对美副总统万斯的讲话“感到恶心”?假
- 2025年02月18日
- 23:16
- APP专享
- 北京时间
3,265

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 10:23:29
捷昌驱动(sh603583)公告称,公司股票连续三个交易日内日收盘价格涨幅偏离值累计超过20%,属于股票交易异常波动情形。经自查,公司目前生产经营活动正常,市场环境、行业政策未发生重大调整,生产成本和销售等情况没有出现大幅波动。公司控股股东及实际控制人不存在应披露而未披露的影响公司股价异常波动的重大信息。公司专注于线性驱动行业,生产的线性驱动系统广泛应用于智慧办公、医疗康护、智能家居等领域。公司主持的“领雁”研发攻关计划项目仍处于研发和测试阶段,目前尚未对市场进行批量供货,暂未形成收入。 -
趋势领涨今天 10:23:05
=加入潜伏擒牛VIP,享四大顶级服务=【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每周一份高端内部绝密文章:包含近期布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!(VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!)现月课7.5折,1288元!季课6.9折,3558元,续费季度更划算!新朋友可先月课体验!点网址,直接买,订购地址:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 10:04:53
【南向资金今日净买入超103亿港元 阿里巴巴获净买入居前】南向资金净买入103.24亿港元。其中,阿里巴巴-W、快手-W、华虹半导体分别合计获净买入约28.30亿港元、8.13亿港元、7.35亿港元;美团-W、晶泰控股-P合计遭净卖出13.31亿港元、0.49亿港元。 -
数字江恩今天 09:45:35
这里昨日的急跌、今日的急涨都属于宽幅震荡结构,哪怕略为突破3366也不改变这个事实。宽幅震荡中,急跌不杀跌、急涨不追涨,今天修复之后,等待再次回踩,配合5分钟底背离和轮峰线的支持寻找机会。 -
数字江恩今天 09:45:27
这里先不看细节,直接看15分钟图。图上的3464-3418蓝色轮峰线是核心,3140的反弹abc突破蓝色轮峰线之后,只要不有效跌破轮峰线,维持之上震荡,其实都是宽幅震荡结构。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:45:17
今日最瞩目的板块当属人形机器人(sz300024)机器人(sz300024),此外,deepseek各个细分行业也在修复。无论是大盘,还是双创,还是国政2000都反V了昨日的中阴线实体部分。市场大悲后迎来大喜,大悲大喜后自然是各种观点的混乱。 -
数字江恩今天 09:45:11
A股两市今日成交6751 + 10459 = 17210 亿人民币,相比昨日缩量近800亿。大盘早盘1小时左右强力拉升,然后全天在20点内的小区间窄幅震荡,收涨27个点。个股方面,和昨日想法,超过85%的个股收红。7%以上大幅上涨个股家数也超过了昨日大幅下跌个股家数。 -
数字江恩今天 09:45:07
宽幅震荡忌追涨杀跌 -
趋势领涨今天 09:25:41
盘后再放利好,两部门:鼓励外资在华开展股权投资 引导更多优质外资长期投资我国上市公司;适时进一步扩大电信、医疗领域开放试点 研究制定有序扩大教育、文化领域自主开放实施方案。五部门印发《优化消费环境三年行动方案(2025—2027年)》 -
北京红竹今天 08:47:20
3、指数调整还没到位目前沪指五分钟级别三买还是没有出现,恒生科技指数和创业板也没有跌破防守线,昨天第一次洗盘,今天快速修复。对于指数来说,调整还没有完成,至少五个新低还没有。如果你是纯指数交易者,还要继续等。不过我在直播中也大家说过了,指数会有回落,但不谈大风险,定义为洗盘。目前指数的洗盘还没结束。