GiteeAI 联合沐曦首发全套DeepSeekR1 千问蒸馏模型,全免费体验!

GiteeAI 联合沐曦首发全套DeepSeekR1 千问蒸馏模型,全免费体验!
2025年02月10日 14:29 中关村在线

GiteeAI刚刚上线了DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四个较小尺寸的DeepSeek模型。值得关注的是,本次上线的四个模型均部署在国产沐曦曦云GPU上。

与全尺寸DeepSeek模型相比,较小尺寸的DeepSeek蒸馏版本模型更适合企业内部实施部署,可以极大的降低落地成本。

同时,这次 DeepseekR1 模型+沐曦曦云GPU+ Gitee AI 平台,更是实现了从芯片到平台,从算力到模型,全国产研发、中国制造。

100%国产AI的力量

国产模型DeepSeekR1

DeepSeekR1 是一款大型混合专家(MoE)模型,拥有6710亿个参数,支持128000个Token的大输入上下文长度。在数学、代码和自然语言推理等任务上表现出色。

本次部署在沐曦曦云GPU上的是四个DeepSeekR1 蒸馏模型,以更小参数量的资源占用,实现了性能与大参数模型旗鼓相当。

国产GPU沐曦曦云

曦云系列通用GPU产品(包括C550、C500、C500X、C290、C280、N260等型号)采用完全自主研发的GPUIP,拥有完整的知识产权,并具备强大的多精度混合计算能力及高带宽显存支持。同时,沐曦产品搭载先进的时空互联技术和全球兼容的MXMACA软件栈,可广泛应用于智能、通用计算和数据处理等场景。

在本次部署适配工作中,得益于沐曦曦云良好的CUDA兼容性,同时得到沐曦的算力供应商超讯通信的鼎力支持,最终实现了模型的快速部署、稳定调用。

国产平台GiteeAI

2024年初上线以来,GiteeAI 平台以ServerlessAPI、模型引擎、AI应用为核心功能与服务,致力于让开发者轻松构建和部署AI应用,为企业客户提供更加智能、高效的AI应用解决方案。

100%国产AI免费跑

目前GiteeAI 上的DeepSeek-R1-Distill系列模型现已面向全体开发者免费使用!免费使用!免费使用!

本次上线的模型参数虽小,但它们表现并不亚于大参数模型,如下图中的DeepSeek-R1-Distill-Qwen-14B,虽然参数较小,但简单任务相较于大参数模型其响应速度更快,同时也具备体现思考过程的能力:

模型自强、算力自强、平台自强,100%国产AI的新时代已然来临。我们一起在国产AI的土壤上,种出下一个时代的参天大树。

访问GiteeAI,体验基于沐曦算力的DeepSeekR1,开启你的100%国产AI开发之旅!

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片