转自:贝壳财经
新京报贝壳财经讯 (记者白金蕾)近期,快手科技2024年投资者日活动在总部元中心举办。快手高级副总裁、主站业务与社区科学线负责人盖坤在会上透露,近期可灵AI(人工智能)正在内测全新的1.5版本基础模型,新模型将在画质、美感、运动合理度和语义响应度上有大幅提升。此外,可灵AI还在内测全新的运动笔刷功能,将为用户打造更可控的视频编辑能力。
今年6月,快手推出了自研的视频生成大模型“可灵AI”,作为全球首个用户可用的影像级视频生成大模型,截至目前,可灵AI已经累计服务了超过260万用户,生成5300万张图片、2700万个视频。6月6日发布以来,可灵AI已进行了9次迭代和升级。
会上,盖坤还介绍了一项可灵AI导演共创计划。李少红、贾樟柯、叶锦添、薛晓路、俞白眉、董润年、张吃鱼、王子川、王卯卯等9位知名导演,将依托可灵AI的技术能力,制作出品9部AIGC电影短片。盖坤表示,乐观估计,预计1年左右视频生成大模型就能达到个人制作影视剧的成熟度。
二季度,快手的语言大模型也实现了显著的性能提升,目前,快意大模型已经实现了在中文场景下综合性能超过GPT-4的目标。盖坤表示,目前快手的大模型布局核心还是围绕内容理解应用、推荐大模型和视频生成大模型三个方向进行重点突破,并力图实现算法、应用和商业模式的多方创新。在模型训练和投入上则倾向和快手已有业务打配合,形成正循环。
以快意语言大模型的应用为例,在商业场景里,基于快手大模型构建的数字人脚本创意生成、数字人渲染生成、数字人实时互动等全流程AIGC(人工智能生成内容)服务,可助力商业化广告主低成本生成高品质的视频和直播内容。以海天集团为例,借助女娲数字人直播平台,海天实现了直播时长从每天16小时到24小时的增长,月度销售也实现了环比增长约200%。
在内容的理解和推荐方面,快手通过大语言模型、多模态大模型等技术,已经可以准确高效地理解视频内容和用户兴趣,而将这些标签应用在推荐、搜索、广告、垂类运营、生态分析、内容安全等各种场景中,也可以全面提升全站运营效率。
会上,快手高级副总裁、研发线负责人于冰也介绍了快手底层架构和技术创新的最新成果。在去年的投资者日上,于冰曾提出了研发线是快手这艘航空母舰的基座,经过十几年的积累,拥有了丰富强大的“武器库”,保障业务行稳致远。今年,于冰回顾了这一观点,并且介绍了研发线在成本治理、研发提效、基建升级等方面的进展。
在成本治理方面,快手今年系统性落地了Finops(云成本管理)方法论,把资源成本优化能力推进到一线研发的毛细血管里,预期未来三年能够为公司多节约数亿成本。在研发效能方面,于冰着重介绍了快手自研的AI研发助手全家桶Kwaipilot。据介绍,Kwaipilot将AI大模型能力贯穿于研发全周期,是一款在内部认可度高的研发生产力工具。今年6月,Kwaipilot全库代码生成率达到了18%,也即快手所有的新增代码中有近五分之一由AI生成。
过去一年里,研发线推出了自研音视频处理大模型LPM,是业界第一家用大模型做视频增强任务的公司,该创新技术的上线应用,大幅提升了视频清晰度,并且推动了App使用时长的显著增长。基于快手自研智能视频处理芯片,支持了全网独家4K60帧的《黑神话:悟空》直播,可以把码率压缩到竞品的50%以下,进而呈现了清晰且流畅的体验。
编辑 杨娟娟
校对 赵琳
VIP课程推荐
APP专享直播
热门推荐
收起24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)