大模型到了该「验收」的时候

大模型到了该「验收」的时候
2024年09月05日 22:23 36氪

来源:36氪

所幸仍有人愿意埋头做些“脏活、苦活、累活”,让一项新兴技术普惠真正大众的时间,来得更早了一些。

2024年9月,整个大模型产业,来到了一个微妙的时间窗口。

一方面,是海外AI明星项目的接连“换血”与“卖身”。

Runway深陷“删库跑路”风波;Stability AI在管理层大换血后再传资金链断裂消息;Character.AI以缩水50%的估值卖身谷歌;Inflection与Adept相继被微软与亚马逊收入囊中;Reka AI则仍在寻找买家。

可另一方面,却是AI大模型应用的探索全面铺开。

在C端,以内容创作、办公助理、图像生成为首的To C应用席卷市场,AI会议、AI音乐、AI短剧、AI PPT等新兴应用层出不穷,Sora的火热更是催生了一大批AI视频应用紧锣密鼓地集中亮相。

在B端,“百模大战”与“Token价格战”连番上演,实打实地冲开了一片广袤的市场;两年前,GPT 3.5每百万Token的价格约为60美元,而今天,Gemini Flash只需要0.05美元。在企业降本增效的永恒需求下,AI大模型在智能客服、智能营销、知识问答等场景中的应用开始看到可量化的效果。

在同程旅行上,大模型为用户解答关于酒店预定、退改、查询等问题,很大程度上降低了客询转人工率;

在易车APP上,AI解读、AI对比问答和AI搜索3D等能力正在提升用户获取信息的效率。这背后,是大模型加速训练技术支撑,让模型迭代周期加快了30%;

在迈瑞医疗产品的临床应用中,大模型能够让重症科医生病情应答快至5秒,大幅提升医疗效率,真正做到“从病魔的手里抢时间”;

在工业富联的产线上,大模型开始参与工业质检、企业知识管理、产线助手、安全质量检测、生产效率分析;

在中信百信银行,大模型技术开始落地到风险管控中,提升风控的质量和效率。

甚至在“打工人”高频使用的腾讯会议APP中,AI都能自动生成文字转录、会议纪要、待办事项。

就在今天,腾讯宣布,已经有超过700款产品接入了腾讯混元大模型。

700款产品是什么概念?

在2023年9月,这一数字大约为,50款。

这是毫无疑问的大模型场景应用爆发。

在2024腾讯全球数字生态大会上,腾讯发布了最新版的腾讯混元大模型Hunyuan-Turbo。相较于上一代混元Pro MoE大模型,Turbo模型自研了万亿级分层异构MoE结构,不仅模型效果大幅提升,其训练推理效率也提升了超过100%,并带来了50%的推理部署成本下降。而Turbo版本的混元大模型,定价仅为前一代Pro版本的一半。

性能更强、价格更低,这是大模型是深入落地场景的前提。

走进场景的第一步:找到场景

解决问题的第一步是,定义问题,而落地场景的第一步是,明确场景。

大模型的核心是NLP(自然语言处理)技术的突破,其对于大规模文本知识处理有着天然的优势;同时,在亿级规模参数的密集训练下,模型能够捕捉到语言的复杂性和细微差别,也能通过融合知识图谱等外部知识进行知识增强。另外,大模型拥有较强的泛化能力,可以通过自监督学习的方法在大量无标注数据上进行训练,也可以通过少量的任务特定数据进行微调。最后,以Stable Diffusion为首的技术突破也使得大模型在多模态内容创作生成上表现极佳。

抽取一下关键词:知识密集、自然语言、泛化与小样本、多模态内容创作。

顺着大模型技术能力往下匹配,场景呼之欲出:知识管理、智能客服、研发提效、智能营销、内容生成……

首先是智能客服与知识管理场景,由于大模型天生的NLP与知识密集属性,使其能够在处理大量自然语言场景时显著提升复杂问题的解决效率,提升回答质量——尤其在涉及高专业度、多复杂知识的领域。

以汽车售后服务为例,与一般的商品售后沟通不同,汽车售后客服是一个典型的高专业度场景,需要客服人员拥有复杂的汽车知识储备,并能够处理说明书、图片、表格等众多形式的客户信息输入,传统客服机器人根本无法满足客户需求。

一个典型的案例是长安汽车,腾讯云告诉36氪,通过与长安汽车共创,双方利用大模型知识引擎整合汽车使用手册等资料,有效解决了客户在车辆使用和维护中的疑问,显著提升了客户服务体验。 

这是大模型知识管理能力在企业中“对外”的展现,其实“对内”亦然。

比如,在知识壁垒同样极高的法律领域,旷真律所将4万多份员工编撰的内部知识文档导入到腾讯乐享中,形成了律所专属的AI知识库,员工能够随时通过乐享AI助手的分析与自然语言生成能力进行问答,根据员工调研显示,对典型问答的AI回答满意度高达93分,端到端问题准确率达91%。

早在今年5月,腾讯云就将大模型的这项技术沉淀下来,作为PaaS类产品大模型知识引擎发布。通过知识引擎,企业5分钟就能开发出一款专用客服营销、企业知识社区类知识服务应用。

腾讯云大模型知识引擎采用的是目前主流的RAG(检索增强生成)技术架构为基础,不仅整合了OCR文档解析、向量检索、多模态大模型等技术,更能让企业通过模块化的应用模板快速开发落地。除了上文提到的汽车、法律等领域,腾讯云大模型知识引擎还在金融、教育等多个行业落地。

除了知识管理、智能客服外,在大模型AIGC的“老本行”内容创作领域,智能营销、内容生成等同样是大模型的适宜落地场景。

在市场营销领域,Campaign广告素材生产效率、营销互动趣味性等都是核心的关注参数——在消费周期短、需要频繁购买的快消品领域更是如此。例如,奶业巨头蒙牛通过与腾讯云合作,用图生图能力,将用户上传的全家福转化生成为特制的卡通画风,使得小程序活跃度相对于去年同期提升80%,极大地提升了提升用户的参与度。 

而在制作周期更长、成本更高的视频内容创作领域,大模型的降本增效能力则更为凸显。过去,视频内容需要一帧帧进行设计和制作,制作周期短则数天,长则数月。而人民日报、新华社等媒体如今则能够通过混元大模型的文生视频能力,通过一段文字或几张图片,在几分钟内就能快速生成优质视频内容,极大提升了内容创作效率。

此外,强泛化能力与zero-shot/few-shot能力则能让大模型在小样本场景下表现出色。比如,在风险管控、质量检查等领域,大量企业只拥有少量异常样本,使用传统方式建模的时间长、精度也不够。而大模型则能够通过打包丰富的反欺诈知识,实现“小样本”训练,快速构建契合业务需求的风控模型体系。

根据腾讯云数据,在东风日产汽车金融的大模型合作中,双方能够只基于少量提示样本就完成了适配业务场景的风控模型定制,相比于传统的建模方式,模型KS性能提升超过20%,跨场景泛化性测试性能提升了高达53%。

此外,还有研发提效、办公协同等等场景,不一而足。

此外,AI大模型作为一项新兴技术,整个配套设施都要从0开始打造。除了上述面向场景的PaaS产品,在整个AI大模型的AI infra基建层,腾讯也一直在“埋头铺路”。

为了帮助企业更好地训练大模型,腾讯云推出了集算存网一体的高性能智算底座“腾讯云智算”。目前,腾讯云智算的集群千卡单日故障数已经刷新到0.16,是行业水平的1/3;1分钟就能完成万卡Checkpoint写入,数据读写效率是业界10倍;千卡集群的通信时间缩短到6%,是业界一半。腾讯云智算集群从机器上架到开始训练可以做到只需1天,相比业界以月为单位大为缩短。

当前,大模型还达不到“开箱即用”的地步,IaaS、PaaS、SaaS层都需要一点点“往下磕”。腾讯在底层做好基建、中层做好工具、上层理解场景,三管齐下,如今已经能看到不少落地的成效。

长期、优质、多元、独到

在大模型的所有应用场景中,医疗场景十分特殊。而在所有医疗场景中,重症无疑是医疗场景中最值得关注的。

当前,能够承担重症治疗的医护人员极为紧缺,而重症患者又通常伴随大量复杂的生理和生化指标和辅助检查,涉及的药品、机器使用频繁且情况复杂。同时,重症患者病情又普遍都相对严重,对治疗及时性要求极高。

为了解决这些问题,在重症医疗领域,腾讯云与医疗器械厂商迈瑞医疗合作,着力打造一套完整的、适配医疗场景数据、医院环境使用需求的重症大模型解决方案。

然而,想要模型真正落地,首先需要解决的是医院真实使用场景中出现的问题。

当前,医学能力可对标开源大模型尺寸高达70B,对于终端医院来说几乎无法真正落地,为了适配医疗场景数据并充分考虑医院环境的使用需求,腾讯云与迈瑞医疗的重症大模型在保持效果的前提下模型尺寸更精巧,推理、部署成本更优。

同时,通过构建知识图谱,录入全量重症知识、预制检验检查指标、药品等信息的映射关系,大模型在知识录入阶段,就会将知识进行整理,拆分,结构化,再转化到特征空间,并通过生成式训练保证大模型对重症医学的理解能力和表述的专业性。

此外,基于腾讯云医学行业大模型,结合知识引擎、知识图谱等相关产品技术,以及迈瑞在重症医学领域的完整的解决方案和对临床场景的深刻理解,重症大模型能够将重症治疗中沉淀出的海量医生经验与高质量医学文献结合,通过迅速预测病情演进帮助医生辅助决策,还能辅助病历撰写、患者信息检索、重症知识检索等环节,将医生从繁琐的机械性工作中解放出来,“把医生的时间留给患者”。当前,这项解决方案能够让重症科医生的病情应答速度快至5秒,大幅提升了医疗效率。

“要实现AI大模型应用,需要结合不同层面的技术,包括基础设施、模型、agent与工具、还有应用场景,每一层都需要考虑到,才能在合适的行业场景中,找到业务落地机会。”在此前的采访中,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生曾经这样告诉36氪。

“(跟之前相比)客户选择云服务不只是看一次的价格,而是看你有没有实力支撑长期的、更优质的服务。我们的很多客户,之所以选择腾讯云,就是看重了我们的一些多元化、独有的能力。”汤道生说。

此外,在工业制造领域,工业富联也与腾讯云联手探索工业大语言模型和工业多模态大模型在制造场景中的落地。

例如,为了解决数据孤岛问题,在大模型建设的前期,工业富联与腾讯云需要先共同搭建一个统一的数据存储平台,实现不同厂区、产线、质检工位的数据采集和管理,再通过接入腾讯的TI平台,实现高效的数据集成与标准化处理。

基于腾讯云的数据生成和异常检测算法,工业富联只需要提供少量正常图像数据进行训练,就能让系统自主生成缺陷样例,解决工业场景训练数据量少的问题。

而上文提到的知识引擎方案,则能够将分散于生产线上各个系统中,“几十年老师傅沉淀的经验”,各类复杂的文档与非结构化数据融合搭建,构建出一套专属于工业富联的知识库。在此之上,工业富联便能够利用大模型为员工提供更为精准和智能的知识服务,盘活了大量知识资产。

医疗、制造、法律、金融、消费……不知不觉间,大模型已经悄然走进我们生活的方方面面。

半年之前,大模型产业内曾经掀起了一场轰轰烈烈的口水战,围绕着“信仰”与否,辩论双方各执一词,争得不亦乐乎。

今天,终于没人再提了。

经过近两年的市场教育,当前,人们开始逐渐对大模型的概念祛魅,在行业的狂热逐渐回归冷静的今天,从业者的关注重心从榜单、参数、模型大小逐渐转移,大模型终于从投资的热潮里走了出来,开始回归其本来的意义——在真实场景中,创造价值。

跟历史上每一轮技术革命必经的Gartner周期一样,AI大模型也将走过它命中注定的跌宕曲线:技术萌芽、期望膨胀、泡沫破灭、稳步爬升、生产成熟……

所幸,资本热潮与技术落地之间永远存在着真实的差距,无论是工业制造、医疗护理,还是智能营销、知识管理等众多应用场景中,企业的真实痛点既不会随着行业热度而盲目高涨,也不会随着资本退潮而突然消失。

在“烧钱”与“泡沫”的声量减弱,在盲目跟风的热潮退去前,所幸仍有人愿意埋头做些“脏活、苦活、累活”,让一项新兴技术普惠真正大众的时间,来得更早了一些。

AI腾讯
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片