尽管走上行业风口不过一年多时间,但AI大模型的基础研发和应用场景的讨论热度始终高企。到2024年,AI大模型迈入应用元年的声音更是一时甚嚣尘上,行业果真走出这一步了吗?
事实上,鉴于“研发和应用两手抓”需要的能力与资本都巨大,行业之中配得上这一拷问的公司并不多:百度“文心一言”、阿里“通义千问”、昆仑万维(39.920, 0.46, 1.17%)“天工”、商汤“日日新”、科大讯飞(52.370, -0.92, -1.73%)“星火”等等企业及其大模型,都是牌桌上的有力角逐者。
真正要在其中脱颖而出,不仅需要性能超前的基础大模型,同时也要与之相配、并有“爆品”潜质的产品应用场景。对此,昆仑万维以“天工3.0”和“天工SkyMusic”尝试回答。
4月17日,昆仑万维自研四千亿级大语言模型“天工3.0”正式开启公测并同步开源。这一采用4000亿级参数的MoE混合专家模型,是目前全球模型参数最大、性能最强的MoE模型之一,相较上一代在模型语义理解、逻辑推理等多个性能维度均有明显提升。

技术层之外,这可能也是AI应用领域的潜在引领者之一。与“天工3.0”一同开启公测的还有昆仑万维的AI音乐生成大模型“天工SkyMusic”,该大模型在小范围邀测时已经激起不小的音乐创作浪潮。
而不仅是音乐,“天工3.0”当前已将AI能力集成进搜索、写作、长文本阅读、对话、代码等多个高频应用场景,为大模型领域即将开启的落地应用之战筹备砝码。
至此,一个完整的AI大模型技术与应用生态正在成型。这是AI大模型叙事最重要的章节之一,它可能就此建立一条行业分水岭。
天工SkyMusic,引领AIGC音乐浪潮
自OpenAI将大模型推上行业风口以来,属于中国市场的“百模大战”已经拉开序幕一年有余,进入2024年,行业关注点开始从技术研发向应用落地逐渐倾斜——无可置否,大模型的落地应用才是决定其技术与价值的长尾指标。
就所有内容模态而言,音频内容是相比文本和图片更好理解人类情感的方式,同时,音乐也是人类情感表达最充沛且不受地域和文化限制的内容载体。因此,众多落地场景之中,音乐创作成为普罗大众最易上手和感受到趣味性的AIGC场景。对于AI公司而言,这是一个将自己推向C端市场、获得大众认知的有利机会。
天工SkyMusic正是昆仑万维面向音乐行业发布的大模型,此前于4月2日面向社会开启邀测,今天随天工3.0正式发布。该大模型自邀测阶段就受到行业专家及音乐从业者的广泛关注,它不仅是国内唯一公开可用的AI音乐生成大模型,同时也是中国首款AI音乐大模型SOTA模型,更是中国的自研大模型技术第一次在AIGC领域领跑全球。
在大模型领域中,SOTA模型指的是被认为是“State of the Art”(SOTA)的模型。正如OpenAI被视为文本大模型和视频生成大模型的SOTA,"State of the Art"这个术语通常用于描述某个特定领域或技术中当前最先进、性能最好的技术或方法。
在与海外顶尖的AI音乐大模型Suno V3的横向测评中,天工SkyMusic在人声&BGM音质、人声自然度、发音可懂度等领域显著领先对手,并以6.65分的综合得分超越Suno V3,成为全球AI音乐SOTA模型。

目前,AI音乐生成有两大技术路径,分别是符号音乐生成路线和大模型音乐音频生成路线。前者是指先标注大量乐谱,再训练模型,最后生成的结果也是乐谱,需要额外的算法或工具将乐谱转换成音乐;后者则是直接学习并生成音频波形,乐器、人声、旋律、音量、音符等等都一体化端到端生成,但这种方式不仅艰难、成功经验稀缺,还需要高昂的算力和资金。
天工SkyMusic选择的是技术意义上更难的音频生成路线。不仅如此,由于这一路线所覆盖的Song、BGM(Background Music)、Speach三个领域中,Song领域因为包含人声、生成技术难度更高,始终没有出现极佳方案。对此,天工SkyMusic投入大量资源实现了一定技术突破,使得该领域的生成质量终于得到提升。
值得注意是,天工SkyMusic是音乐AIGC领域罕见公开自身技术路径的产品。其由“Encoder-DiT-Decoder”三大核心模块组成的技术路线图,成为了“音频路线+人声Song路线”的重要技术参考。

相较于行业中的同类产品,天工大模型带动天工SkyMusic拥有了更突出的产品优势。
例如,其拥有独创的参考音乐生成与方言歌曲生成的能力。参考音乐生成是指,用户可上传自有参考音乐,或选择“天工SkyMusic”资料库中现有的参考音乐,从而生成风格、唱腔类似的歌曲,这种能力能够结合创意、技术和音乐制作技巧,让用户利用现有的音频资源来创作出更加丰富多彩的音乐作品;
方言歌曲生成能力包含粤语、成都话、北京话、上海话等,这不仅能扩大其受众范围,还能加强音乐创作生成的多样性。同时,基于强大的数据库及训练模型,天工SkyMusic还可打造出更具辨识度的自然人声,这也将使其区别于普通音乐AIGC产品较浓的“AI人声质感”。
此外,天工SkyMusic可通过歌词控制情绪变化,实现如颤音、歌剧、吟唱等多种歌唱技巧,还支持创作说唱、民谣、放克、古风、电子等多种音乐风格。
这种音乐创作上的灵活性和普适性,为天工SkyMusic的创作成果带来了更多趣味。在其公布的大量demo中,《龙行龘龘》演绎了戏曲唱腔与电子音乐如何完美融合;《悟空》从歌词上贴合了人物本身的传奇色彩与不羁性格,其独特理解与领悟最终与旋律合二为一;《Pack my bags》则诠释了欧美流行音乐的精妙之处,其女声唱腔兼具欧美女歌手的音色与技巧。
借此,天工SkyMusic得以大幅降低音乐创作的门槛,让每个用户都能够更加容易创作属于自己的旋律和歌曲,这使其有望成为行业中最重要的全民音乐创作工具之一。而随着该音乐大模型的不断进化,它还有可能加入专业音乐人改善创作质量、提高创作效率的辅助进程中,逐步推动建立属于自己的AI音乐创作者生态。
开源MoE大模型的时代来临
事实上,天工SkyMusic只是昆仑万维迈向AIGC大千世界的第一站。自天工3.0发布后,这一大模型将覆盖听、说、读、写、画、唱等更多高频AIGC应用场景,正式开启一个多模态大模型时代。
从单一模态逐渐过渡到多模态,进而构建世界模型,是业界共识度最高的,迈向AGI的演进路径。而在OpenAI展现GPT-4和GPT-4V的能力之后,行业便一直在等候一个更具场景覆盖力的多模态大模型,将大模型技术的应用现实进展再往前推一把。
昆仑万维“天工3.0”正是登场于这样的背景之下。“天工3.0”采用了4000亿级参数MoE混合专家模型,是全球模型参数最大、性能最强的MoE模型之一,并已同步选择开源。相较上一代,其在模型语义理解、逻辑推理、通用性、泛化性等领域均有明显提升。
具体而言,“天工3.0”的模型能力提升集中于逻辑推理能力、语义理解能力、专项Agent训练和内容创作能力四大方面。逻辑推理方面,“天工3.0”数学与推理能力均提升超过30%;语义理解则能够更好理解和处理用户自然语言Query中的复杂语义信息,包括隐喻、多义词等。
专项Agent训练是此次模型能力提升的核心。当前,AI Agent(智能体)已经成为大模型技术的主流落地方向,而“天工3.0”针对模型独立规划、调用、组合外部工具及信息的模型Agent能力进行了专项训练,使其能够独立生成并调用代码,完成包括图表绘制、工具调用、语义判断等多项复杂用户需求。

自此,“天工3.0”成为具备多个领域专业知识和能力的全能专家。它能够对复杂任务进行拆解优化,更深入理解用户需求,也具备实时判断并调用专用模式扩展基座模型的能力,最大程度提升模型性能。诸如产业研究、产品横评、信息分析、图片生成、图表绘制等需求场景,已经可以由“天工3.0”较为高效覆盖。
对AI用户而言,“天工3.0”性能升级最直观的价值就体现在AI搜索场景上。在信息呈现方式上,天工AI的研究模式可提高问答的专业性质,围绕用户的某个简单指令进行相关问题的延伸,自动生成研究大纲、图谱、实践总结、思维导图,而增强模式可对模糊问题做进一步引导,帮助用户获取更有效的信息,提高回复质量。

同时,天工3.0展现出行业同类AI搜索引擎所不具备的差异化优势。——它不仅有文本回复能力,还有图文并茂能力,在文本回答的同时附带图片或视频,帮助用户加强信息理解。

在内容创作层面,基于专项Agent训练等带来的性能提升,“天工3.0”的内容创作能力已有跨阶段性发展。
在基础推理与理解方面,天工3.在数学推理能力的提升,也让它能够更准确地理解用户需求。
在上一代AI搜索、AI语音、AI对话、AI二次元漫画生成等强大内容创作能力基础上,“天工3.0”又发展出了更强的多模态性能,例如在对话中,结合文本需求实时生成图片、或实时分析内容及图表的能力,成为了集合听、说、读、写、搜、画、看、唱等能力的千亿级开源MoE大模型。
至此,天工3.0得以实现多模态的深度融合与应用。对行业而言,这将带来更高效智能的解决方案,同时降低AI技术的研发门槛和使用成本,最大化共享技术能力和经验。
降低AIGC使用门槛,推动产业升级
从ChatGPT惊艳亮相那一天起,就持续关注AI大模型发展的用户们,大概可以体会到“天工3.0”给行业带来的显著冲击力——它不仅在技术层面提高了自身竞争力,也在实际应用层面逐步覆盖当下高频应用场景,同时向搭建大模型应用生态的目标大步前进。
在这一视角下,天工3.0的发布意义不只是大模型应用场景的升级,它还加速了AI应用的普及,促使更多企业和开发者参与到AI引领的科技变革中。
从天工SkyMusic到天工3.0释放的多模态能力,行业已经可以预测到昆仑万维意图掀起的AIGC浪潮。
因为不仅是中国首个音乐AIGC SOTA,作为全球最大规模开源MoE大模型,天工3.0有能力带领更多领域的创作者群体自由出入AIGC的理解与生成的通道,利用多模态的深度融合与应用,大幅降低内容生产的门槛与成本,重新定义创作效率和质量标准。这种影响力将逐步促进整个内容生产行业进化,释放更多的创作力和内容价值。
这不仅是一家公司的使命愿景,也是一个行业实现突破的硬性阶段目标。为此,昆仑万维已付诸多年实践。
自发布天工系列大模型以来,昆仑万维已在AGI和AIGC两大方向上完成自己的业务矩阵布局:从千亿级大语言模型到多模态AI内容生成能力,从AI搜索、AI音乐、AI 社交等再到国内领先的AI Agent开发平台,无论是模型技术还是工程能力,都竭力站稳国内AI企业头部阵营,做好为产业提供支撑的准备。
在这背后,走向AGI和促进AIGC应用发展,始终是这家企业的目标与使命。如今,随着“天工3.0”的发布与展示,昆仑万维在“All in AGI与AIGC”这一战略征程上再下一城,即将把大模型战事推向新的高潮。


APP专享直播
热门推荐
冲击全球第六!《哪吒2》票房破147亿,将在日本上映!背后A股公司宣布:拟12.2亿买楼 收起冲击全球第六!《哪吒2》票房破147亿,将在日本上映!背后A股公司宣布:拟12.2亿买楼
- 2025年03月08日
- 08:59
- APP专享
- 扒圈小记
2,349
深夜飙车近300公里/小时!李某某,被抓
- 2025年03月08日
- 23:42
- APP专享
- 扒圈小记
1,671
突变,俄罗斯猛攻,数千名乌军被包围?特朗普:不能这么干!泽连斯基呼吁空中、海上停火!美国切断乌克兰对卫星图像访问权限
- 2025年03月08日
- 05:56
- APP专享
- 北京时间
1,594

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 04:11:02
【2月份全国居民消费价格同比下降0.7%】国家统计局发布数据,2025年2月份,全国居民消费价格同比下降0.7%。2月份,食品烟酒类价格同比下降1.9%,影响CPI(居民消费价格指数)下降约0.54个百分点。 -
趋势领涨今天 01:00:35
=加入潜伏擒牛VIP,享四大顶级服务=【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每周一份高端内部绝密文章:包含近期布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!(VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!)现月课7.5折,1288元!季课6.9折,3558元,续费季度更划算!新朋友可先月课体验!点网址,直接买,订购地址:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 01:00:15
下周有5只新股申购,周一一只,周二两只,周五两只。以前每周最多不超过3只新股申购,下周一下子提到了5只,你们说这是新股发行加速吗?有人说,现在行情走好,新股发行多一点是正常的,重点是这些新股有多少不是垃圾?像杭州六小龙如果在A股上市,我们会热烈欢迎,但如果上市是为了卖公司,大家还是会用脚投票的!二、存储行业启动新一轮涨价周期全球知名的存储产品供应商闪迪(SanDisk)发予客户的涨价函披露。据称,闪迪将于今年4月1日开始实施涨价,涨幅将超10%,存储芯片涨价,主要是因为涨价AI相关行业风生水起,AI与新兴技术驱动需求大幅增加,引发了存储行业涨价,该消息主要利好存储芯片相关板块,但这个板块已经炒作很多次了,大家不要希望太高。上周五上涨的有色金属就是涨价消息的刺激,另外还有因为周末加的事情,下周相关农产品(sz000061)等应该也有涨价的预期,对这些板块也是利好。总的来说,下周市场应该会迎来震荡,上半周虽然还有向上的可能,但下半周还是要注意风险 -
趋势领涨今天 01:00:11
大盘自2月份底收出中阴线以后,上周走出了修复性行情,三大股指都收回了前期跌幅,沪市还创出了新高,创业板和深市只是收复了前面的中阴线,主要原因就是沪市有中字头、有银行板块,关键时候能够出现护盘,但创业板应该才是大家账户的真实写照,也就是大盘虽然没有下跌,但想赚钱,不是那么容易!大盘看似走势很强,但上周四内资流入近400亿元,周五却大幅流出777亿元,这是赶着去过三八吗?现在大家都看不到外资的流向,但内资的流出极大地打击了大家做多的信心,内资只要出现大幅流出,大盘想上涨是很难的!上周四大盘跳空向上,留下了一个跳空缺口,但创业板已经回补了这个缺口,不出意外的话,沪市和深市也会回补这个缺口,所以,大家整体还需谨慎。板块上,因为有重要事件,中字头、银行板块在护盘,大家都在炒作题材股,这就是蓝筹股搭台,题材股唱戏,但一旦蓝筹股不搭台,题材股还会唱戏吗?这个概率是很大的,主要原因一是下周重要事件要结束;二是一季报预告即将开始,一般业绩不好的上市公司要率先发布预告,这些个股基本都是集中在高位题材股。另外,牛市旗手券商走势很弱,很多人都说现在就是牛市,如果是牛市,那券商为什么不启动呢?上周大盘量能已经放大到接近2万亿,严格说已经到了券商启动的节点,但券商还是涨一天,跌两天,严重影响了市场人气,市场热点还是机器人(sz300024)和人工智能相关概念上,但这些已经经过了连续大涨的个股,有几个人敢追呢?所以,大家不要看见每天有近两千只个股上涨,但你真正参与进去,想赚钱还是很难的,因为第一天上涨的板块,第二天不一定有逃跑的机会,主要原因就是量化在不停地收割,量化现在还有所忌惮,重要事件结束以后,你们觉得他们还会忌惮吗?本周末消息面比较平静,我们昨天的文章已经做了详细解读,大家注意查看前文,这里分享两个行业方面的消息: -
趋势领涨今天 01:00:06
大家早上好!趋势为王,做股海的领航者,新的一天,新的战斗,欢迎你来到本直播室!新进的朋友请注意点赞,收藏本直播室,以方便你下次观看,谢谢大家的支持!【更多独家重磅股市观点请点击】 -
趋势领涨2025-03-08 10:51:39
【2月深圳新房成交暴涨197% 深铁前海时代·尊府入市锁定“日光”?】今年政府工作报告首次提出“稳住楼市”,并释放了多项地产利好信号,为后续市场回暖奠定了基础。市场方面,2025年2月深圳新建商品住宅成交面积25.6万平米,同比增长197.2%。面对3月小阳春,深铁集团将推出多个新房产品,其中豪宅项目“深铁前海时代·尊府”也将入市,户型为245-285平方米四居,共计77套,样板间于3月8日开放。该项目此前多次出现“日光”,市场普遍预期此次推出的房源也将迅速售罄,凸显深圳高端住宅市场的火爆需求。 -
趋势领涨2025-03-08 05:29:59
私募股权公司Sycamore Partners与老牌连锁药店沃博联达成最终协议,以近100亿美元价格将后者私有化,包括债务在内的交易总价值为237亿美元。这笔交易预计将于今年四季度完成。沃博联的市值自2015年以来已下跌90%,截至当地时间6日为93亿美元。 -
趋势领涨2025-03-08 00:27:08
=加入潜伏擒牛VIP,享四大顶级服务=【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每周一份高端内部绝密文章:包含近期布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!(VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!)现月课7.5折,1288元!季课6.9折,3558元,续费季度更划算!新朋友可先月课体验!点网址,直接买,订购地址:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨2025-03-08 00:26:42
人工智能是后期主要发展方向,这点没有任何疑问,人工智能板块的炒作也是后期主要热点,这点也没有疑问,但近期涨幅确实有点大了,树不能长到天上去,虽然后期还有行情,但短期也有调整的风险。该消息主要涉及的是AI+教育,前期也已经经过了多次炒作,所以,大家还是要注意追涨的风险。另外,骏利亨德森投资环球科技领先团队表示,近期减持中资科技股,将资金调回美股。这个信号也要引起大家的注意。三、美国2月非农就业人数略低于市场预期 降息预期降温美国2月季调后非农就业人口15.1万人,预期16万人,前值由14.3万人修正为12.5万人。数据公布后,美国短期利率期货下跌;交易员不再押注美联储5月降息。美国利率期货交易员现在押注美联储要等到6月才能重新开始降息。以前市场预期美联储将在12月份才有降息,随后提到5月份降息,现在美国2月非农就业人数低于预期,市场不再预期5月份会有降息,总之,美联储要降息时,公布的数据都是符合降息的;否则,美国公布的数据都是不利于降息。一句话就是美联储通过不断地恐吓,将资金留在国内,给美国服务,但美元指数的大幅回调,说明资金正在逃离美国,东升西落,美国正在进入衰退期,大摩将2025年美国GDP增长预测下调至1.5%,之前的预测为1.9%,这个应该也是信号。资金都是逐利的,只要有一小部分资金能够进入A股市场,A股今年出现牛市是可能的,但前提是内资不能天天砸盘!下周重要事件将要落幕,大盘应该会迎来震荡,但中期走势还是向好的,所以,大盘回调将是机会。今天是三八节,没有太阳、花朵不会开,没有爱、幸福不会来,没有妇女,也就没有爱,所以,妇女是爱的根源,也是爱的源泉,祝天下妇女三八节快乐! -
趋势领涨2025-03-08 00:26:37
昨天港股再创新高,港股这波走势确实很牛,港股恒生指数大涨超过32%,恒生科技指数大涨近50%,主要原因就是港股里面有国内科技股巨头腾讯、阿里等,而A股连上攻3400点的勇气都没有,主要原因就是量化资金收割,垃圾股太多,港股炒业绩,A股炒垃圾,这就是宿命!所以,我们始终认为,本轮炒作要盯紧港股,港股一旦见顶,A股必定见顶,只要港股能够继续上行,最终资金会流向A股,因为以前港股便宜,A股跟港股的逆差较大,但经过本轮上涨以后,A股跟港股的逆差已经大幅缩小,随着后期进一步缩小,A股就会变成低估了,所以,对今年的行情不悲观,但短期不会一帆风顺。一、华为正式组建医疗卫生军团据科创板日报,华为正式组建医疗卫生军团。据悉,医疗卫生军团将重点构建AI辅助诊断解决方案体系,推动医疗大模型在临床场景的应用。华为作为国内领军企业,不管走到哪个行业,都会引发大家的关注,华为+都将是行业龙头,比如华为算力,华为汽车等,现在华为组建医疗卫生军团,这就是华为+医疗,再叠加AI+医疗,后期医药板块会迎来机会,当然重点是跟AI对应,比如医疗、创新药方向等。二、北京:从2025年秋季学期开始 全市中小学校开展人工智能通识教育北京市推进中小学人工智能教育工作方案发布,从2025年秋季学期开始,全市中小学校开展人工智能通识教育,每学年不少于8课时,实现中小学生全面普及。学校可将人工智能课程独立设置,也可与信息科技等课程融合开展。