近日,央视主持人朱广权和AI虚拟人手语主播的一条pk短视频引发了全网关注。大家都知道,朱广权一出声,那可谓金句频频,语速惊人。而一旁的虚拟人手语主播也是见招拆招,根据朱广权的话同步即时进行手语翻译,最后圆满成功完成了挑战。
根据全国第二次残疾人抽样调查数据,中国目前有2780万听障人士。为了让这些同样也在关注冬奥盛事的听障群体们,第一时间获取比赛动态和感受赛场上的激情,百度智能云团队花了2个月的时间打造了这个虚拟人AI手语主播,从北京冬奥会开始,全年无休用AI智慧为听障用户提供手语服务。
在过去,我们从荧幕上看到的手语翻译,大多是由真人完成。打造一个手语数字人并不简单,主要有三个难点:
1、不同地区的手语各不相同,需要一套类似普通话通用版的手语。
2、手语的语序与正常说话的语序并不相同,虚拟人大多需要先进行提炼和语序调整 ,再进行翻译。
3、手语不仅仅只是靠手部动作传递信息,表情、口型也是关键组成部分。虚拟人不仅要准确地用手语进行翻译,还需要准确地根据语境做出表情反馈。
普通翻译讲究信、达、雅,一个AI虚拟人手语翻译,要像真正实现替代真人,就必须足够智能。百度打造的虚拟人手语主播之所以能够拿下朱广权的挑战,离不开各种技术的加成。为了让虚拟人听得清主持人/解说员在讲什么,百度方面利用了ASR语音识别模型帮助虚拟人主播准确识别语音。据报道,这一系统的准确率高达98%,还能够准确识别方言、中英文混杂的情况。为了让虚拟人手语主播实现准确的翻译,百度在训练这一模型的时候,主要应用了自然手语语料。在我国,存在的手语种类超过百种,为了让更多的听障人士能够看懂,央视新闻AI手语主播掌握的手语词汇规范都来自《国家通用手语词典》标准,另外还添加了体育专有名词、时政新闻、常用短句等特殊训练。为了让虚拟人通过表情进行更加准确地表达句意。百度智能云方面建立了一个拥有近万个手语动作的动作库,推动精准手语表达实现。在口型与表情上,百度智能云通过4D扫描数据进行训练,为表情与口型进行精准矫正,总体上口型生成的准确度超过98.5%。
你们觉得虚拟主持人是否可以一定程度上协助主持人的工作呢?欢迎讨论。有虚拟人需求的朋友也可以联系在线客服,腾佑科技百度云服务中心将给您提供各种场景下虚拟人智能解决方案!
推荐阅读:百度业务转型已经进入“AI深水区”
热门活动
条形码ocr识别api可检测识别图片中的条形码(包括CODE_128、UPC_A、EAN_13、ITF、CODABAR等9类),且自动返回存储的内容。...
百度OCR增值税发票识别服务,已支持普票、专票、卷票、区块链发票、全电发票(即新版全国统一电子发票,专票/普票)的所有关键字段识别,“加料不加价”,单次调用低至0.017元;增值税发票验真服务,已覆盖全部12类增值税发票的信息核验,包括专票......
百度发票识别功能能自动对增值税发票、增值税普票、电子发票、卷票等多种发票进行结构化字段识别提取,一招解决人工手动录入效率低、工作繁琐的问题。广泛应用于财税报销、发票验真、账单记录等场景。...
百度智能写作平台是一款智能、高效、实用的内容创作工具。它既提高了内容创作的效率,也提升了内容质量,让用户可以更加轻松地创作出符合要求的高质量文案。...
天行车享是天行用车科技(深圳)有限公司推出的电动汽车分时租赁平台,专注于新能源汽车共享经济领域,定位城市新能源出行运营商,为用户提供环保、便捷、舒适的都市智能出行服务。...
深圳市海恒智能科技有限公司是全球领先的图书管理核心技术及行业产业化的国家高新技术企业,集科技、智能、教育、公益于一体的图书馆RFID应用系统最佳方案服务商。...
2022临近年终,盘点公司年度大事记同大家分享;同时向一直以来支持我们发展的社会各界人士、领导、合作伙伴及亲朋好友们致敬!感谢您的支持、信任与陪伴!2023让我们携手同行再出发,共创共享共赢!...
票据离线识别SDK可支持Android、iOS、Java、PHP、Python、C++、C#等多语音形式。票据离线识别SDK是在完全无网的环境下运行,所有数据都可在设备本地运行处理,用户根据设备数量进行SDK的购买(即一个设备需对应一个SD......
随缘漂流瓶是一款线上交友App,能够让你每分每秒遇到不同的那个TA,全新的方式相遇,简单、心动、惊喜。打捞漂流瓶寻找那个TA,相遇如此美好。...
专题推荐
售前咨询热线:400-996-8756
备案提交:0371-89913068
售后客服:400-996-8756