近日,央视主持人朱广权和AI虚拟人手语主播的一条pk短视频引发了全网关注。大家都知道,朱广权一出声,那可谓金句频频,语速惊人。而一旁的虚拟人手语主播也是见招拆招,根据朱广权的话同步即时进行手语翻译,最后圆满成功完成了挑战。
根据全国第二次残疾人抽样调查数据,中国目前有2780万听障人士。为了让这些同样也在关注冬奥盛事的听障群体们,第一时间获取比赛动态和感受赛场上的激情,百度智能云团队花了2个月的时间打造了这个虚拟人AI手语主播,从北京冬奥会开始,全年无休用AI智慧为听障用户提供手语服务。
在过去,我们从荧幕上看到的手语翻译,大多是由真人完成。打造一个手语数字人并不简单,主要有三个难点:
1、不同地区的手语各不相同,需要一套类似普通话通用版的手语。
2、手语的语序与正常说话的语序并不相同,虚拟人大多需要先进行提炼和语序调整 ,再进行翻译。
3、手语不仅仅只是靠手部动作传递信息,表情、口型也是关键组成部分。虚拟人不仅要准确地用手语进行翻译,还需要准确地根据语境做出表情反馈。
普通翻译讲究信、达、雅,一个AI虚拟人手语翻译,要像真正实现替代真人,就必须足够智能。百度打造的虚拟人手语主播之所以能够拿下朱广权的挑战,离不开各种技术的加成。为了让虚拟人听得清主持人/解说员在讲什么,百度方面利用了ASR语音识别模型帮助虚拟人主播准确识别语音。据报道,这一系统的准确率高达98%,还能够准确识别方言、中英文混杂的情况。为了让虚拟人手语主播实现准确的翻译,百度在训练这一模型的时候,主要应用了自然手语语料。在我国,存在的手语种类超过百种,为了让更多的听障人士能够看懂,央视新闻AI手语主播掌握的手语词汇规范都来自《国家通用手语词典》标准,另外还添加了体育专有名词、时政新闻、常用短句等特殊训练。为了让虚拟人通过表情进行更加准确地表达句意。百度智能云方面建立了一个拥有近万个手语动作的动作库,推动精准手语表达实现。在口型与表情上,百度智能云通过4D扫描数据进行训练,为表情与口型进行精准矫正,总体上口型生成的准确度超过98.5%。
你们觉得虚拟主持人是否可以一定程度上协助主持人的工作呢?欢迎讨论。有虚拟人需求的朋友也可以联系在线客服,腾佑科技百度云服务中心将给您提供各种场景下虚拟人智能解决方案!
推荐阅读:百度业务转型已经进入“AI深水区”
热门活动
条形码ocr识别api可检测识别图片中的条形码(包括CODE_128、UPC_A、EAN_13、ITF、CODABAR等9类),且自动返回存储的内容。...
百度OCR增值税发票识别服务,已支持普票、专票、卷票、区块链发票、全电发票(即新版全国统一电子发票,专票/普票)的所有关键字段识别,“加料不加价”,单次调用低至0.017元;增值税发票验真服务,已覆盖全部12类增值税发票的信息核验,包括专票......
百度发票识别功能能自动对增值税发票、增值税普票、电子发票、卷票等多种发票进行结构化字段识别提取,一招解决人工手动录入效率低、工作繁琐的问题。广泛应用于财税报销、发票验真、账单记录等场景。...
百度智能写作平台是一款智能、高效、实用的内容创作工具。它既提高了内容创作的效率,也提升了内容质量,让用户可以更加轻松地创作出符合要求的高质量文案。...
百度智能云的人工智能技术规模化的应用可以帮助解决问题,用人工智能技术替代人工,提高电网安全管理水平。我们帮助国家电网构建了两库一平台(模型库、样本库+人工智能平台),目前已覆盖90%的省网公司,使用者可以基于这套底座构建更多应用。...
高校宿舍楼的管理现状是依托门卫、宿管人员,完全靠“肉眼”和“脸熟”来管理,效率低,且未知性太高。高校宿舍楼的一大特点是一个半封闭空间,每一栋宿舍楼都只采取一个大门来进出,另外的消防通道、楼梯常年处于闭锁状态。另外一个特点是在宿舍楼中居住的学...
“十年磨剑为一搏,六月试锋现真我!”高考在即,大部分学校都不再进行紧张的模拟考,而是帮助考生们缓解压力,老师们也不再纠错改错,而是反复强调影响评分的一项重要因素:卷面书写。“电脑阅卷、不留情面...
专题推荐
售前咨询热线:400-996-8756
备案提交:0371-89913068
售后客服:400-996-8756