近日,央视主持人朱广权和AI虚拟人手语主播的一条pk短视频引发了全网关注。大家都知道,朱广权一出声,那可谓金句频频,语速惊人。而一旁的虚拟人手语主播也是见招拆招,根据朱广权的话同步即时进行手语翻译,最后圆满成功完成了挑战。
根据全国第二次残疾人抽样调查数据,中国目前有2780万听障人士。为了让这些同样也在关注冬奥盛事的听障群体们,第一时间获取比赛动态和感受赛场上的激情,百度智能云团队花了2个月的时间打造了这个虚拟人AI手语主播,从北京冬奥会开始,全年无休用AI智慧为听障用户提供手语服务。
在过去,我们从荧幕上看到的手语翻译,大多是由真人完成。打造一个手语数字人并不简单,主要有三个难点:
1、不同地区的手语各不相同,需要一套类似普通话通用版的手语。
2、手语的语序与正常说话的语序并不相同,虚拟人大多需要先进行提炼和语序调整 ,再进行翻译。
3、手语不仅仅只是靠手部动作传递信息,表情、口型也是关键组成部分。虚拟人不仅要准确地用手语进行翻译,还需要准确地根据语境做出表情反馈。
普通翻译讲究信、达、雅,一个AI虚拟人手语翻译,要像真正实现替代真人,就必须足够智能。百度打造的虚拟人手语主播之所以能够拿下朱广权的挑战,离不开各种技术的加成。为了让虚拟人听得清主持人/解说员在讲什么,百度方面利用了ASR语音识别模型帮助虚拟人主播准确识别语音。据报道,这一系统的准确率高达98%,还能够准确识别方言、中英文混杂的情况。为了让虚拟人手语主播实现准确的翻译,百度在训练这一模型的时候,主要应用了自然手语语料。在我国,存在的手语种类超过百种,为了让更多的听障人士能够看懂,央视新闻AI手语主播掌握的手语词汇规范都来自《国家通用手语词典》标准,另外还添加了体育专有名词、时政新闻、常用短句等特殊训练。为了让虚拟人通过表情进行更加准确地表达句意。百度智能云方面建立了一个拥有近万个手语动作的动作库,推动精准手语表达实现。在口型与表情上,百度智能云通过4D扫描数据进行训练,为表情与口型进行精准矫正,总体上口型生成的准确度超过98.5%。
你们觉得虚拟主持人是否可以一定程度上协助主持人的工作呢?欢迎讨论。有虚拟人需求的朋友也可以联系在线客服,腾佑科技百度云服务中心将给您提供各种场景下虚拟人智能解决方案!
推荐阅读:百度业务转型已经进入“AI深水区”
热门活动
条形码ocr识别api可检测识别图片中的条形码(包括CODE_128、UPC_A、EAN_13、ITF、CODABAR等9类),且自动返回存储的内容。...
百度OCR增值税发票识别服务,已支持普票、专票、卷票、区块链发票、全电发票(即新版全国统一电子发票,专票/普票)的所有关键字段识别,“加料不加价”,单次调用低至0.017元;增值税发票验真服务,已覆盖全部12类增值税发票的信息核验,包括专票......
百度发票识别功能能自动对增值税发票、增值税普票、电子发票、卷票等多种发票进行结构化字段识别提取,一招解决人工手动录入效率低、工作繁琐的问题。广泛应用于财税报销、发票验真、账单记录等场景。...
百度智能写作平台是一款智能、高效、实用的内容创作工具。它既提高了内容创作的效率,也提升了内容质量,让用户可以更加轻松地创作出符合要求的高质量文案。...
济南轨道交通,是服务于山东省济南市的城市轨道交通系统,其第一条线路济南轨道交通1号线于2019年4月1日正式商业运营。...
“银月网络”全称上海银月网络科技有限公司,成立于2014年,是一家着眼于全球互动娱乐市场,以移动游戏开发、运营为核心的互联网新锐企业。公司创立之初便活动千万级别投资,并由一群热爱游戏,对游戏事业有着深厚兴趣的有志之士组成。...
芸彩科技(北京)有限公司旗下芸艺优品品牌,自主研发设计“芸艺识图智能终端”+“芸艺优品商城管理平台”,可提供AI智能识图解读国粹的解决方案。...
专题推荐
售前咨询热线:400-996-8756
备案提交:0371-89913068
售后客服:400-996-8756