中国财富网讯 8月5日,科大讯飞翻译机新品发布会正式举行,科大讯飞联合创始人、高级副总裁、讯飞研究院院长胡国平和科大讯飞消费者事业群副总裁翟吉博围绕“世界聊得来”为主题做技术分享和新品介绍,讯飞翻译机4.0正式发布上市。
AI让世界聊得来
在本次发布会上,胡国平带来了科大讯飞最新的智能语音和翻译技术分享。作为人工智能“国家队”,科大讯飞一直以“让机器能听会说,能理解会思考,用人工智能建设美好世界”为初心使命,在语音识别、机器翻译、语音合成以及图文识别等诸多让“世界聊得来”的关键技术上达到了国际领先水平。
为解决小语种数据稀缺难题,科大讯飞创新性提出了基于语音和文本统一空间表达的半监督语音识别技术,使得构建一个全新语种的语音识别系统所需要的语音数据量整整下降了100倍。帮助我们快速实现了超过60个语种的语音识别能力,覆盖了全球90%以上的人群。在2021年度的OpenASR国际低资源语音识别挑战赛中,科大讯飞一举夺得了15个语种的受限赛道和7个语种的非受限赛道,共计22个赛道的世界冠军。
科大讯飞也率先在业界实现了前后端一体化的语音识别技术,充分地利用前端多个麦克风组成麦克风阵列和后端复杂模型的精细建模能力,大幅提升复杂场景下的语音识别率。我们目前在大型国际会议场景,语音识别率从67%提升到90%;在多人讨论场景,识别率从54% 提升到86%。科大讯飞也在被称为史上最难的国际多通道语音分离和识别大赛CHiME比赛上,连续获得最近三届比赛的世界冠军。
早在2018年左右,科大讯飞中英文机器翻译的效果就已经达到大学六级的水平,在中英翻译国际领先的基础上,我们又进一步提出了“基于语言特征强化的多语种机器翻译统一建模技术”,使得机器翻译模型训练 所需要的平行语料下降了10倍以上,也使得我们快速实现了168个语种的机器自动翻译能力。并通过多模态混合编码的高精准语音翻译技术,提取语音中停顿、重音、语调等副语言特征,融入机器翻译模型,显著提升算法对口语化表达、语音识别错误等的鲁棒性。因此我们也连续两年在IWSLT 国际口语机器翻译评测中,英德、英日、英中等口语翻译任务上获得世界冠军。
此外,科大讯飞提出了基于听感量化编码的多语种统一建模和迁移学习方法,通过将语音中的 内容/语种/音色/风格等特征解耦和重新组合,实现了小数据量下高自然度语音合成,目前我们已经支持了 61个语种的语音合成,都处于国际领跑或并跑的水平。从2006年到2019年 连续14年获得了国际语音合成大赛的第一名。
在多语种的图文自动识别技术上,我们也创新性地提出了基于场景风格迁移的数据自动合成技术和跨语种编码统一建模技术,有效地实现了包括歪歪扭扭的阿拉伯语、多语种混排 以及手写数学公式在内等 复杂文本的高精度识别。
胡国平表示“从技术中来,到产品中去”是讯飞研究院一直坚持的理念,为了使得语音翻译技术能更好地服务遍布世界的用户,科大讯飞进一步攻关了云端服务、离线翻译、语种识别、行业翻译等能力,持续地将最新技术突破更新到讯飞翻译机相关产品中去,为用户带去更好的语音翻译体验。
从2010年起科大讯飞就通过讯飞语音云对外提供各种AI技术的云端在线服务。在全球任何一个地方访问我们的AI服务都可以实现200毫秒左右的这样一个极快响应时间。其次,我们在工程上设计实现了复杂的毫秒级别的语音识别解码策略,以及不等到一句话结束就开始对中间识别结果进行机器翻译的“句不成句”翻译调度算法,确保了我们可以在延迟不高于5秒就能够及时地看到AI字幕同传级的效果。即使在没有网络的情况,我们也实现了完全无网络条件下的离线翻译技术。另外,讯飞研发了基于知识蒸馏的轻量化语种识别技术,能实现只需三秒左右的语音 就能够准确地进行语种识别,识别率超过95%。
为了让我们的语音翻译能够胜任更多的专业领域,针对金融、医疗、体育、司法、化工等16个主流行业,我们额外完成了超过120万的行业术语、6000万句对的定制语料,并推出了 相应的 行业翻译版本,相比通用翻译平均提升超过40%,进一步满足了针对这些行业的跨语种翻译需求。
AI翻译机标准再升级
基于科大讯飞在关键技术上的突破和应用,讯飞翻译机持续革新翻译体验,并在2018年就于业内率先提出“听得清、听得懂、译得准、发音美”AI翻译四大标准,即:听得清——无惧嘈杂环境,轻松连续对谈;听得懂——语种覆盖全球,更懂专业词汇;译得准——端到端精准翻译,表达地道;发音美——摆脱机械发音,拉近沟通距离。
而在不断的产品迭代与用户调研的过程中,讯飞翻译机团队发现除了快速、准确、专业的必要翻译能力外,用户同样追求翻译设备可以有更简洁的操作、更便捷的交互。在本次讯飞翻译机新品发布会上翟吉博称,此次讯飞翻译机在四大标准基础上再次升级,增加的AI翻译机新标准:够自然,旨在让跨语言交流更加顺畅、自然、高效。
两种创新方案,高效各有办法
在“够自然”的新标准下,针对不同的跨语言沟通场景特点,讯飞翻译机提出了两种创新解决方案:讯飞双屏翻译机主要针对商务交流等正式沟通场景,满足用户交流过程中长时、连续、重礼仪的需求。讯飞双屏翻译机的“主客双屏显示会话”方案,能够兼顾沟通效率和商务礼仪,让长时间的商务交流从容、自然、流畅。讯飞翻译机4.0主要面向的是日常跨语言交流场景,为用户提供即时、便捷沟通服务,通过全新的软硬件设计,实现了“拿起说、放下译”的免按键交互,让沟通更自然高效。
全新软硬件设计,交流够自然
讯飞翻译机4.0在软硬件上均带来了全新设计。借助高精度传感器,加入免按键翻译模式,实现“拿起说放下译”的快速信息传递;5.05英寸的定制翻译屏幕方便快速浏览译文,还可实现分屏显示,拥有面对面同传级翻译体验;新增双语自动识别,无需担心交流过程中的按键误操作,让你更加专注于对话;创新性融入灯光语言,通过灯光呼吸闪烁直观展现翻译机收音状态,让双方都能更好掌控说话时机,让交流节奏更自然。
此外讯飞翻译机4.0与讯飞双屏翻译机拥有同样优秀的翻译实力,支持83种语言在线翻译,16种语言离线翻译,16大领域行业翻译,32种语言拍照翻译。为用户提供更全面的翻译语种、更准确可靠的翻译效果和更专业地道的表达。
持续引领行业发展,不断革新翻译体验
早在2016年,科大讯飞发布了讯飞晓译翻译机,开创了AI翻译机品类,随后推出讯飞翻译机2.0,首发行业翻译和离线翻译。讯飞翻译机3.0的到来,推出了“同声字幕”功能,解决了线上远程跨语言交流的场景痛点,有效降低了跨语言沟通成本。随着讯飞双屏翻译机开启跨屏翻译时代,以及讯飞翻译机4.0的发布,面对面交流效率和体验将会大幅提升,讯飞翻译机始终引领行业发展新方向。
凭借出众的技术实力,科大讯飞成为2022年北京冬奥会和冬残奥会官方自动语音转换和翻译独家供应商,讯飞翻译机也一直成为各大高端会议和重要场合的官方指定翻译机,助力国内、国际盛会跨语言无障碍沟通。其在刚刚结束的第二届消博会上,以官方指定翻译用机身份,为大会提供跨语言无障碍沟通服务,成为大会亮点,也赢得了媒体的广泛赞誉。
全新发布的讯飞翻译机4.0将与讯飞双屏翻译机为自然高效地跨语言交流提供两种解决方案组合,为不同人群多种场景提供优质的翻译服务,助力用户在工作生活中面对外语交流更加得心应手,真正实现“世界聊得来”。(于是)
(图片来源:科大讯飞)