谷歌 DeepMind 最强 AI 手语翻译模型:SignGemma 登场,打破手语沟通壁垒

谷歌 DeepMind 最强 AI 手语翻译模型:SignGemma 登场,打破手语沟通壁垒
2025年05月31日 11:24 IT之家

IT之家 5 月 31 日消息,谷歌 DeepMind 团队于 5 月 27 日宣布推出 SignGemma,是其迄今为止最强大的手语翻译模型,可将手语转化为口语文本,该开源模型将于今年晚些时候加入 Gemma 模型家族。

IT之家注:SignGemma 模型支持多语言功能,但目前主要针对美国手语(ASL)和英语进行了深度优化,开源属性意味着开发者可以自由使用并改进它。

DeepMind 希望通过这一技术,打破手语使用者在沟通上的障碍,让他们在工作、学习和社交中更顺畅地参与。

DeepMind 今年还推出 Gemma 3n 模型,支持从音频、图像、视频及文本输入生成智能文本,助力开发者打造实时互动应用。

此外,谷歌还与佐治亚理工学院及 Wild Dolphin Project 合作,推出 DolphinGemma 模型,分析并生成海豚声音,基于巴哈马大西洋斑点海豚的长期研究数据构建。

同时,MedGemma 模型作为 Gemma 3 家族新成员,聚焦医疗 AI,支持临床推理和医学影像分析,加速医疗与人工智能的融合创新。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片