杨志明:人机交互,AI未来发展的新时代

杨志明:人机交互,AI未来发展的新时代
2023年09月15日 15:01 市场资讯

  “2023中国AIGC产业发展论坛”于9月4日在北京召开。深思考人工智能机器人创始人兼CEO杨志明出席并演讲。

  人机交互从单模态到多模态,从人“屈从”机器到机器理解人类、对话即系统

  AI技术的发展有三个阶段,从AI 1.0机器学习模型,到2.0深度学习模型,再到AGI目前的这个阶段,也就是深思考人工智能和业界共同在探索的基于生成式大模型来处理各种任务。

  杨志明表示:“在人机交互这个领域中,我认为:发展轨迹是从单模态的交互发展成多模态的交互,从人“屈从”于机器,到机器理解人类,再到现在的“对话即系统”,最明显的就是ChatGPT。典型的1.0时代是人“屈从”于机器,就像键盘一样,不知道它是怎么排列的,一定要屈从键盘的排列组合,输入我们的信息。关于单模态,大家可以看到微信最早期第一版只有文字。其实人与人的交互,人与机器的交互应该是多模态的,我们可以通过人的表情、姿态和声音还有字里行间的含义进行多模态交流。3.0阶段就是基于多模态大模型的跨模态、多模态的人机交互。目前,在一款最新的手机端上就实现了基于自然语言对相册图像的内容含义的搜索。比如,在传统的手机相册里找一个身份证可以找到,找一个人可以找到,但是找一下我和父母的合影就很难找到,但是将多模态大模型优化到智能手机端的应用后,基于跨模态,自然语言的理解,这种搜索完全可以实现。”

  大模型交互对话的痛点问题

  大模型交互对话的痛点包括生成内容的可控性、生成内容的可解释性和多模态、跨模态的理解问题。

  首先,是目前普遍意识到的生成内容的可控性。大模型容易生成幻象,幻象就是大模型好像都懂,但是生成的内容错了,生成的内容看似很合理,但是不对,就是通常人们所说的“一本正经的胡说八道”。由于这个问题,大模型会导致在比较严谨的应用场景里出现问题,比如在医疗场景下,如果出现可控性的问题,幻象的问题,会出现胡编乱造的诊断结果,这是致命的;再比如在政务场景中,因为会涉及到很多政府发布的政策,如果有幻象问题,大模型编造出一个政府的政策,这也是非常糟糕的。

  其次,是生成内容的可解释性,以及生成内容的实时性和安全性,可解释性这个痛点可以从模型层面和产品层面去解决。一般来说,由于“幻象”的出现,用户对大模型生成的内容天生缺乏信任感,且很多大模型都无法回答今天是几月几号的问题。 此外,现在很多的大模型的应用是需要可解释性,生成内容的安全性,以及隐私性。

  最后,是大模型需要能够做多模态跨模态的理解。例如在医疗场景中,诊断时需要考虑到的患者的病史、病历、年龄、症状等都是多模态跨模态的问题。目前,行业中也一直在做跨模态的研究,深思考人工智能也在跨模态领域有文生图、图生文、音生图、图生音等最新的研发进展。

  技术实力多年积累积淀,获得头部客户实力认可

  杨志明表示:“我们也不是一夜之间就做起来的。我们主要来自中科院计算所、软件所、自动化所,包括清华、耶鲁大学一线的AI科学家团队组成。最早在2015-2017年时,基于多模态深度学习的模型,已经实现了为最早的一批客户提供产品与服务。2017-2019年,自主研发了BMNET 多模态轻量级预训练模型。2020年开始,我们完全自研基于Transformer decode only的多模态大模型Dongni,在2020-2023年之间,在为3000多万人提供了癌症早筛服务的同时,手机完成了近4.3亿部的智能终端落地。人机交互领域,我们为华为、小米、上汽、奇瑞、九阳、京东等多家客户提供了产品服务,在智慧医疗领域,我们也拥有上百家医疗机构的客户和覆盖了70%的第三方医学实验室。”

  Dongni多模态、跨模态大模型特点:五大特性构筑行业壁垒

  深思考人工智能多模态大模型有两个愿景,一是在智能终端打造属于每个人个性化手机终端的大模型智慧助理;另一个是赋能千行百业,目前已经在手机、汽车、癌症早筛、智慧营销、游戏、智能制造等场景大规模落地。多模态、可解释性、实时性、可溯源性、输出结果可控性,是深思考人工智能Dongni多模态大模型的5大突出特点优势;除此之外,大模型有情感,个性化,也是该大模型区别于其他模型的突出优势。深思考人工智能Dongni多模态大模型,作为基底大模型,目前已在非常细分的垂直场景,如医疗癌症早筛、智能制造在工业质检等场景下做了非常好的基于基底大模型的快速适配。

  杨志明认为,基于多模态大模型的人机交互,需要符合场景化的落地,通过创新的技术,解决在大模型中普遍存在的痛点问题,实现多模态大模型的可解释性、实时性、可溯源性和输出结果的可控性,最终促进 AI 技术对垂直场景的高效赋能和内容生态的价值实现。  

海量资讯、精准解读,尽在新浪财经APP

责任编辑:梁斌 SF055

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 09-22 中集环科 301559 --
  • 09-21 浩辰软件 688657 --
  • 09-19 三态股份 301558 --
  • 09-18 爱科赛博 688719 69.98
  • 09-14 万邦医药 301520 67.88
  • 新浪首页 语音播报 相关新闻 返回顶部