国际电信联盟第二十一研究组(简称ITU-T SG21)于2025年1月13—24日在瑞士日内瓦召开全体会议,来自中国、美国、德国、日本、韩国、瑞士、加拿大、英国等国家的专家和企业代表参加本次会议,围绕人工智能等热点议题展开标准化讨论。在ITU-T SG21 Q5会议上,由工业和信息化部新闻宣传中心和阿里云联合牵头提出的“Functional framework of media content enhancement and editing system based on multimodal foundation model for media”(基于媒体多模态大模型的媒体内容增强及编辑系统功能框架)标准成功立项,计划2026年正式发布。

该标准是ITU-T首个基于多模态大模型的媒体内容增强与编辑领域的国际标准,将定义基于媒体多模态大模型的媒体内容增强与编辑系统的功能框架、场景及接口,提升媒体多模态大模型及媒体能力组件之间的互通效率,用于指导使用基于媒体多模态大模型的媒体内容增强与编辑系统的建设,助力基于多模态大模型的媒体产业及生态发展。

近年来,随着人工智能领域大模型技术迅猛发展,媒体行业正在经历前所未有的变革。特别是在媒体内容增强与编辑方面,通过多模态大模型技术的应用,文本、视频和音频的处理变得更加智能化和高效。然而如何促进基于媒体多模态大模型的媒体内容增强与编辑系统上下游之间的兼容互通成为行业关注的问题。
《基于媒体多模态大模型的媒体内容增强及编辑系统功能框架》有助于通过接口定义提升媒体多模态大模型及媒体能力组件之间的互通效率,并为产业提供建设指导依据。
未来,工业和信息化部新闻宣传中心和阿里云将联合产业各方,持续推动媒体多模态大模型标准体系建设工作,为完善国际标准体系做出更多贡献。
编辑:曹倩
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)










