以翻译为跳板 网易有道将推出语音助手及智能音箱

  • 时间:
  • 浏览:0
  • 来源:1分彩-1分彩平台_1分彩网投平台

有道在外界的印象往往是“词典”与“翻译”,但在3月200日下午深圳的网易有道技术开放日上,这家公司出人意料的透露,肯能在开发语音助手,今年5月会有产品发布。

这次以AI为主题的开放日上,有道介绍了神经网络翻译技术,OCR技术,以及有道智云的相关进展及正确处理方案。有道的AI翻译正确处理方案分于基于视觉交互和语音交互的正确处理方案两类,而语音助手就被“藏”在了语音正确处理方案之中。

有道词典产品技术负责人林会杰告诉雷锋网,难能可贵做语音助手,是发现有用户在使用有道翻译官这些产品时,会将它当作有多少 可不时要理解买车人表达的助手,而非仅仅是有多少 翻译工具。有道翻译官APP可不时要识别语音并即时翻译。

比如,面对有多少 翻译工具,让你说搞笑的话让其全版翻译出来,而面对有多少 助手,让你说“翻译一下XXXX这句话”,因此 只让你累积内容被翻译出来。

根据有道工作人员的介绍,与其它之类 产品一样,有道的语音助手也会有智能问答、生活查询、智能翻译、日常闲聊、多语言理解,以及自然语言指令控制等功能。不过在现场的演示中,有道的语音助手还总要有多少 成型的产品,本来显示了有多少 简单的交互界面。

林会杰表示,今年5月会发布关于语音助手的更多全版状况,因此 总要推出一款硬件。他也向雷锋网确认,这款硬件会是音箱。

网易做语音音箱并不奇怪,与阿里、腾讯一样,网易云音乐与网易新闻让其并不缺少内容,更何况在今年2、3月,网易云音乐还分别与腾讯音乐及阿里音乐达成版权互相转授权合作协议协议,内容库更为雄厚。但由有道来做难能可贵挺令人意外,大概与外界对它突然以来的形象不相符。

除了语音助手外,网易也敲定了其在神经网络翻译,OCR技术,有道智云方面的进展。

有道翻译在2008年上线,2017年升级为神经网络模型,并在同年升级为有道智云,向外输出翻译技术和正确处理方案。有道的神经网络翻译在过去一段时间的主要进展有下面多少方面:

语言支持:目前有道肯能支持10多种语言翻译,最近新上线了越南语,还将上线泰语、印尼语等小语种。

服务性能:采用CPU+GPU方案服务7.5亿线上用户,单次请求的平均翻译时间仅为40ms,系统稳定性达到99.95%。

离线能力:随着手机性能的提升,有道还同步开发了离线版的神经翻译系统,主要使用CPU正确处理方案,单语种模型文件小于200M,翻译质量接近在线翻译,目前支持中英日韩法西葡7种语言。

海外拓展:除了围绕中文的翻译,有道还在海外进行了扩展,为国外的开发者提供以英语为中心的翻译能力,比如英语与印地语、法语、西班牙语的互译。

有道智云还集成了OCR技术,其在拍照翻译原先的应用中十分重要。有道表示,目前其OCR技术肯能识别超过72亿张图片,支持17种语言,并支持离线识别,其中在线识别可不时要达成99%的请求耗时6200ms,而离线模型在20M内,平均1.2秒即可识别出结果。

另外,有道对文字的方向、深度,以及文档结果都做了诸多优化,不能做到我不要 指定语言即可识别,因此 支持多语言混合识别。未来,有道的OCR技术还将支持公式识别,面向教育场景(比如选择题、填空题和数学推理等)进行优化,总要针对手写板提供智能批改、错题分发等服务。

将上边的两项技术打包在并肩,有道提供有基于视觉交互和基于语音交互的并都在翻译正确处理方案。视觉交互方案主要包括:

拍照翻译:即输入图片后识别图中文字并给出翻译结果

原图翻译:在拍照翻译的结果上,将原图文字无缝替换为翻译内容,看起来就和原图一样。

AR翻译:也也我不要 摄像头拍摄目标,视频中的文字会实时翻译。上边涉及到识别、翻译、追踪、背景分割等多种技术,有道表示可不时要做到全离线的AR翻译。

语音翻译则可不时要做到实时识别与翻译,并对中式英语进行了不得劲的优化。

有道一位工作人员告诉雷锋网,现在其肯能有2000多名员工,因此 是网易内控 AI能力最强的团队,其AI业务的重点还是以翻译为基础,逐步扩展在教育领域的应用和正确处理方案。

微信公众号搜索"

驱动之家

"加关注,每日最新的手机、电脑、汽车、智能硬件信息可不时要让你一手全掌握。推荐关注!【

微信扫描下图可直接关注