技术领先识别准确
采用领先国际的流式端到端语音语言一体化建模方法,融合百度自然语言处理技术,近场中文普通话识别准确率达98%
多语种和多方言识别
支持普通话和略带口音的中文识别;支持粤语、四川话方言识别;支持英文识别
深度语义解析
支持50多个领域的语义理解,如:天气,交通,娱乐等。还可接入智能对话定制与服务平台UNIT自定义语义理解和对话服务,让您更准确地理解用户意图
中文标点智能断句
使用大规模数据集训练语言模型,根据语音的内容理解和停顿智能匹配合适的标点符号(包括,。!?),使识别结果的表现方式贴合表述,更加可懂
数字格式智能转换
根据语音内容理解可以将数字序列、小数、时间、分数、基础运算符正确转换为数字格式,使得识别的数字结果更符合使用习惯,直观自然
支持自助训练专属模型
支持在语音自训练平台上自助训练模型,上传词汇文本即可零代码完成训练,精准提升业务领域词汇识别率5-25%,并可专属使用
语音输入
摆脱生僻字和拼音障碍,使用语音即时输入。略带口音的普通话、粤语四川话方言、英文,均可有效识别,并可根据句意自动纠错、自动断句添加标点,让输入更快捷,沟通交流更顺畅
语音搜索
搜索内容直接以语音的方式输入,应用于网页搜索、车载搜索、手机搜索等各种搜索场景,解放双手让搜索更加高效,适用于视频网站、智能硬件、手机厂商等多个行业
语音指令
无需手动操作,可以通过语音直接对设备或者软件发布指令,控制操作,适用于智能硬件、车载系统、机器人、手机APP、游戏等多个领域
社交聊天
社交聊天时直接用语音输入的方式转成文字,让输入更加便捷;或者在收到语音消息不适合播放时可以转为文字进行查看,满足更多的聊天场景
游戏娱乐
游戏中聊天必不可少,双手无法打字,语音输入可以将语音聊天转为文字,让用户在操作的同时也可直观看到聊天内容,多样化满足用户聊天需求
技术世界领先
采用领先国际的流式端到端语音语言一体化建模方法,近场中文普通话识别准确率达98%
服务稳定高效
企业级稳定服务保障,专有集群承载大流量并发高效灵活,以及99.9%服务稳定性保障
模型自助优化
中文输入法模型可在语音自训练平台上零代码自助训练,上传文本语料即可有效提升业务词汇的识别准确率5-25%