使用Python,让会话AI快速获得英伟达GPU加速,你需要认识这个工具

使用Python,让会话AI快速获得英伟达GPU加速,你需要认识这个工具
2022年01月07日 17:07 机器之心Pro

让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音已成为未来最被看好的人机交互方式,语音比其他的交互方式有更多的优势。目前,语音服务存在于各种场景中,包括实时会议记录、视频实时直播字幕、呼叫中心语音质检、实时会议记录等。想要实现不同的语音服务,这涉及到方方面面的技术,例如,在进行实时会议记录任务时,需要将会议中的音频实时转写为文字辅助会议记录工作,同时适用于电视会议等远距离场景,这涉及到自动语音识别(ASR)技术。除此以外,我们在日常生活中,也经常遇到需要将文本转化成语音的技术(TTS) ,该技术可以通过自然逼真的智能语音,让机器拥有「说话」的能力。那么,有没有一种技术,可以同时完成自动语音识别、语音合成技术的任务?今年,英伟达发布了 NVIDIA Riva,这是一种现成的语音服务,可以轻松部署在任何云或数据中心。NVIDIA Riva的设计旨在帮助用户轻松、快速地访问会话 AI 功能,实现开箱即用,通过一些简单的命令和 API 操作就可以快速构建高级别的语音识别服务。该服务可以处理数百至数千音频流作为输入,并以最小延迟返回文本;还能快速构建高级别的对话式 AI 服务。 NVIDIA Riva是一个使用了 GPU 加速,快速部署高性能会话式 AI 服务的 SDK,可用于快速开发语音 AI 的应用程序。Riva SDK 在 NVIDIA GPU 上运行,在高吞吐量水平下提供最快的推断响应。目前,NVIDIA Riva整合了 ASR 和 TTS 等智能算法引擎,用户可以使用这些功能进行科学研究。为了深入了解和快速上手 NVIDIA Riva 在构建语音方面的应用,英伟达联合机器之心推出「详解对话式AI应用服务框架NVIDIA Riva」三期线上分享,通过英伟达专家的理论解读和实战经验分享,向开发者展示如何使用 NVIDIA Riva 快速构建企业级 ASR 语音识别助手、快速构建企业级 TTS 语音合成助手、使用 Python 快速构建基于 NVIDIA Riva 的智能问答机器人。

2022年1月12日,系列分享第2期:

使用NVIDIA Riva快速构建企业级TTS语音合成助手

语音合成技术又称为文本转语音 (TTS) 技术,它可以将任何文字信息转换成标准流畅的语音且进行朗读,相当于给机器装了一张人工合成的「嘴巴」它是声学、语言学、数字信号处理和计算机科学的一个交叉学科。

本次分享面向有会话式人工智能开发需求的开发者,讲主要介绍以下内容:

语音合成简介

NVIDIA Riva 介绍与特性

启动 NVIDIA Riva 客户端快速实现文字转语音功能

使用 Python 快速搭建基于 Riva 的 TTS 语音合成服务应用

直播时间:北京时间1月12日19:30-21:00

直播间地址:

AINVIDIApythonTTSgpu
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片