爱数智慧创始人张晴晴:人工智能领域多模态标注平台推动AI数据服务发展

爱数智慧创始人张晴晴:人工智能领域多模态标注平台推动AI数据服务发展
2021年09月03日 16:44 市场资讯

股市瞬息万变,投资难以决策?来#A股参谋部#超话聊一聊,[点击进入]

  9月3日,2021中国智能产业论坛在北京首钢园举行,本次论坛为服贸会论坛活动之一,主题为“智能时代 引领未来”。北京爱数智慧创始人兼CEO,声学博士张晴晴出席并发表演讲。

张晴晴张晴晴

  张晴晴在演讲中表示,人工智能领域多模态标注平台推动AI数据服务发展。大家知道人工智能有三架马车。对于多模态的定义是什么,其实可以看到过去很多的数据是以结构化的方式存在的,而现在随着物联网的到来,有线下许多非结构化的数据,包括音频、视频还包括手写体等等要录入到系统,跟系统交互起来,有非常重要的环节,就是系统能对非结构化的数据进行结构化的处理和整合,最后才能够用于模型预测。

  爱数智慧就是针对这样的一些多模态的数据对现实生活中的一些音视频数据进行相应处理,帮助所有的人工智能正在进行研发的这些算法或者企业去不断优化他们的AI模型。

  张晴晴介绍称,爱数智慧成立于2016年,到现在五年时间,在这五时间里服务全球100多家AI头部企业。公司客户群体分七大类,首先有国内的互联网型公司,也是AI领头企业,同时还有海外客户,包括一些芯片厂商,包括像高通英韦达,还有社交客户,还有银行。家居也是互联网这个范畴里,也在服务头部企业。前三大产品是AI训练数据集,所有做AI领域的人都知道AI需要有数据集驱动,爱数智慧在一些场景特别是日常应用的情况下去帮助客户定向收集相应数据,快速迭代针对性优化模型,这是爱数智慧的产品。第二个是数据处理的工具,其实模型在不断演进和迭代的过程中,总是要靠线上数据不断滚动,而这些线上数据也是要靠数据的清洗和标签化的工具完成,而目前推出的Annotator是公司5年智能化标注平台。第三个,爱数智慧也提供相应的数据采集和标签化的服务。

  谈及爱数智慧的标签化系统,张晴晴表示,首先看到数据从物联网的时代到来,现实生活中有非常多的非结构化的数据需要去处理,所有处理的过程都定义为数据标注,数据标签化的过程,这个部分主要的构成有图象的数据处理、音频的数据处理以及自然语言文本的数据处理。在标签化过程中处理数据的时候发现有一些痛点,包括多模态的数据处理的复杂度,以及人员适配性,以及处理过程中希望通过技术降本增效,尽可能提高人处理效能的提升。今年爱数智慧发布落Annotator系统,首先支持多模态标注,音视频的标注,任务可以拆分,比如过程中会有数据的流水线的操作,以及数据标签质检验收环节都可以在平台上完成。过程中进行可视化管理,最后通过智能化辅助实现降本增效,快速完成标签的标注。

  这个是通过音频实现标签化的标注,包括工业的噪声检测,像噪声的数据也可以在平台上进行相应的标签化。这部分是针对文本的标签化的平台,在这个标签化的平台上可以用以处理像大家知道的知识图谱关联管理知识图谱,帮助大家自然语言快速的迭代。

  对于音视频多模态标注平台,张晴晴称,主要用算法理念帮助音视频做一个高维的标签化,甚至超过千维的标签,实现精准的分发。

  在这个过程中可以实现整个任务的拆解和流水,实现标注质监验收的步骤,而平台中也可以对于过程中的情况实现可视化的管理。这部分是底层技术,包括语音识别技术、声纹识别技术等等,可以帮助快速识别过程,帮助他们快速完成标签化的动作。目前看到使用爱数智慧标签化的系统Annotator比起同类型的标签化的系统来讲,爱数智慧的综合成本降低50%,效率提升百分之百,一键部署,也是易于运维的状态。

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

海量资讯、精准解读,尽在新浪财经APP

责任编辑:邓健

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 09-07 海锅股份 301063 --
  • 09-06 卓锦股份 688701 7.48
  • 09-06 显盈科技 301067 47.58
  • 09-06 中兰环保 300854 9.96
  • 09-03 上海艾录 301062 3.31
  • 股市直播

    • 图文直播间
    • 视频直播间
    新浪首页 语音播报 相关新闻 返回顶部