天云数据首发完成DeepSeek-Janus-Pro-7B适配,训练平台推动AI推理全民化丨华映Family

天云数据首发完成DeepSeek-Janus-Pro-7B适配,训练平台推动AI推理全民化丨华映Family
2025年02月13日 13:21 华映资本

来源:华映资本

2月3日,DeepSeek上线了DeepSeek-Janus-Pro-7B模型,天云数据率先完成基于沐曦GPU服务器的DeepSeek模型适配首发完成国产模型 + 国产GPU + 国产训练平台全兼容服务,实现AI全流程国产化流水线时代。

天云数据成立于2011年,是一家同时具备分布式计算平台产品和AI平台基础设施的科技厂商,华映资本曾于2018年联合领投天云数据1亿人民币融资。

天云数据提供从“数据工程”到“云原生机器学习平台”到“云原生大模型平台”再到“模型推理服务发布平台”的端到端AI生产流水线服务,支撑多个国产模型的异构部署,助力AI服务成熟度达到国际L5级水平。随着大模型后训练市场兴起,开始服务千行百业。

近年来,人工智能领域的竞争日益激烈,尤其是大型语言模型(LLM)的技术突破不断重塑行业格局。近期,DeepSeek R1推理模型基于强化学习的独特优势和创新算法,成为LLM的新焦点,引发全球关注,甚至间接导致英伟达市值波动。天云数据训练平台推动CoT(Chain-of-Thought)技术走向大众,赋能AI全流程国产化。

DeepSeek R1

用强化学习开启大模型训练新纪元

DeepSeek-R1在Introduction部分提到,R1通过结合冷启动数据、多阶段训练管道和纯强化学习,显著提升了大型语言模型的推理能力,实现了与OpenAI o1系列模型相当的性能,并通过蒸馏技术将推理能力传递给更小的模型。

DeepSeek-R1在Contributions部分重点提到两个贡献:

(1)后训练:在基础模型上进行大规模强化学习。通过在基础模型上直接应用大规模强化学习,成功开发出具备自我验证和长思维链等推理能力的DeepSeek-R1。

(2)蒸馏:小模型同样强大。同时证明了大模型的推理模式可被有效蒸馏到小模型中,实现性能显著提升。

正是这些技术突破,使DeepSeek-R1在多项基准测试中比肩OpenAI的o1系列模型,同时因对英伟达GPU依赖度的降低,引发资本市场对传统算力巨头的重新评估,成为英伟达股价短期波动的重要因素。

如天云数据在2023年预测的“大模型时代的数字化转型最具潜力和影响力的技术趋势是什么?”一般,云原生和模型蒸馏技术会推动边缘网络的大规模发展,模型蒸馏后的小尺寸会嵌入更多个人设备终端,无需网络支撑的个性化推理服务。

天云数据训练平台让更多人使用上CoT

为什么天云数据看好CoT?正如DeepSeek-R1-Zero所表明的一样,大型语言模型的推理能力可以仅通过强化学习来激励,而无需监督微调。天云数据训练平台直接在基础模型上应用强化学习而不依赖于监督微调作为初步步骤,使模型能够探索用于解决复杂问题的思维链。进而展示了自我验证、反思和生成长思维链等能力。

天云数据训练平台如何成为CoT技术普及的关键推手?天云数据训练平台通过技术普惠,让CoT从实验室走向产业端。其具体实现路径包括以下四方面:

1. 全流程国产化适配,降低硬件门槛

天云平台率先实现“国产模型+国产GPU+国产训练框架”全栈兼容,通过优化算法与国产算力芯片的协同,使中小企业无需高价采购海外硬件,即可低成本训练具备CoT能力的模型。

2. 模块化工具链,简化CoT开发流程

平台提供“开箱即用”的CoT开发套件,包含三大核心模块:

· 强化学习自动化引擎:用户仅需定义任务目标,系统自动设计奖励函数并优化训练策略。

· 思维链可视化工具:实时展示模型推理路径,支持人工干预修正逻辑错误,加速模型迭代。

· 轻量化蒸馏接口:一键将大模型能力压缩至小型终端,支持ONNX、TensorRT等多种格式导出。

企业开发者无需深入掌握强化学习理论,即可快速构建具备复杂推理能力的行业模型。

3. 开放生态与场景化解决方案

天云数据联合多个垂直领域头部企业,推出预训练CoT模型库,覆盖金融风控、医疗诊断、影视文娱等场景。例如,在医疗领域,平台提供基于CoT的临床决策支持模型,可自动解析患者病史、生成鉴别诊断链。

4. 云边端协同架构,扩展应用边界

针对边缘设备算力限制,天云设计分层推理框架:

云端:完成大模型训练与复杂任务处理;

边缘节点:部署蒸馏后的小模型,支持低延时推理;

终端:集成微型模型(<100MB),实现完全离线的个性化服务。

天云数据训练平台不仅实现了算力市场格局重塑,让国产GPU与算法优化的结合,削弱了传统GPU巨头的垄断地位;还让边缘AI爆发,通过蒸馏技术推动智能终端渗透率提升;最后实现人机协作范式升级,CoT使AI的决策过程透明化,人类可更高效地与模型协同解决复杂问题。

长期来看,AI算力需求的指数级增长仍将带来机遇。真正的颠覆在于,中国AI企业通过底层技术创新在关键领域跻身全球第一梯队。“降低技术门槛比单纯追求性能更有价值”,这也是天云数据一直践行的使命。通过全栈国产化、工具链简化和生态共建,CoT技术从顶尖实验室走入寻常开发者的工位。未来,随着更多行业拥抱思维链推理,AI将不再局限于“黑箱式”应答,而是成为人类真正的智能伙伴。这场由中国企业引领的技术革命,或许正是全球AI民主化的开端。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片