商汤科技赵峰:企业内容是数字化重要组成部分

商汤科技赵峰:企业内容是数字化重要组成部分
2020年09月11日 16:04 新浪财经

安装新浪财经客户端第一时间接收最全面的市场资讯→【下载地址

  9月11日,由商学院主办的“信仰的力量”——2020《商学院》商业领袖高峰论坛”暨“第四届寻找中国最具价值企业颁奖典礼”在北京举办。商汤科技企业业务事业部总经理赵峰出席并发表演讲。

  赵峰表示,企业的内容是很重要的数字化组成部分。大量的信息化已经把很多的信息完成了结构化录入。但还有一些内容,包括语音、文字、文本,这些其实是非结构化数据。那么在OCR的一个发展当中,其实卡阵类的、表单类的、票据类的、文本类的,需求纷繁复杂。在这个过程当中,普通的OCR技术的卡证其实已经和票据其实做的相对来说比较精准。

  以下为演讲实录摘编:

  在发展期当中,其实走向了几个应用的一个案例,我给大家做一个分享。

  第一点是企业的内容是很重要的数字化组成部分。大量的信息化已经把很多的信息完成了结构化录入。但还有一些内容,包括语音、文字、文本,这些其实是非结构化数据。那么在OCR的一个发展当中,其实卡阵类的、表单类的、票据类的、文本类的,需求纷繁复杂。在这个过程当中,普通的OCR技术的卡证其实已经和票据其实做的相对来说比较精准。

  但在接下来一个发展当中,当你能够更深层次的被不同的企业要应用到,其实你需要用深度学习技术去替代人工模板的编写,需要用自定义的模板的技术去适应更多的文档结构化。

  第二类的应用,诚如刚才第二张图片显示的检测类算法,在一张图片当中需要定义的物件如此之多,人脸、车辆、行人,道路……那么这些检测类和场景分割类的算法非常多,它不像人脸在单一场景下,在单一的算法下可以应用的场景,它的回报率非常之高,但是你切到每个独立的检测算法,整个的成本和回报,其实是比较难以去算清的。在此基础上,其实更多的模型生产部署平台,就为企业去拥有符合自己的培育场景的技术得到了支撑。

  这里面有两个典型的一个应用,一个是0-1的这样一个孵化的训练体系。比如说在单一场景之下,在没有任何基础模型的支持情况下,针对于垂于场景,获取数据进行私有化部署的一个训练。这在深圳的智慧城市当中,大家看到有这些场景都得到了应用。

  第二类,其实在有些检测场景下,比如车辆、垃圾、道路,其实已经有了一些基础算法。但是在每个细分的领域当中它都有特点,比如说你在小区的道路、高速的道路、在城市公共空间的道路,其实都会有差异。那么我们其实应用叫做模型、预训练模型去配合垂直场景的进一步的增强训练,来适应一个垂直场景的这样一个应用。

  在算法生产效率提升之后,非常多行业的长尾算法其实就得到了一个前面提到的人脸、人体、车辆这些,它的应用场景会偏多,有大量的长尾算法,算法多、应用场景相对来说比较窄,这一系列其实我们把它叫做长尾,这些长尾需求基于模型生产部署平台,其实可以得到进一步的一个应用。

  第三个垂直深化期,其实是人机交互。那么在计算机视觉和深度学习里面,其实 AR其实是非常重要的一个部分,就是增强现实技术。这里面其实有三个场景,第一块是AR数字人,相信大家在自己的导航的软件里面,其实经常已经可以用到一些明星的声音,来给你提供导航的一个服务。那么现在通过视觉,通过文字也完全可以驱动一个模拟的3D数字人,也可以驱动一个类似于真人的一个逼真的人物形象去给你提供服务。 在一些客服行业,不管是线下的还是线上,其实都可以完成后台的呼叫中心去驱动前方数字人服务客户。

扫二维码点击查看直播

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

海量资讯、精准解读,尽在新浪财经APP

责任编辑:邓健

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 09-15 中天火箭 003009 --
  • 09-15 铜牛信息 300895 --
  • 09-14 开普检测 003008 30.42
  • 09-14 直真科技 003007 23.4
  • 09-11 科前生物 688526 11.69
  • 股市直播

    • 图文直播间
    • 视频直播间