专业的信息化与通信融合产品选型平台及垂直门户
注册 登陆 设为首页 加入收藏
首页 企业新闻 招标信息 行业应用 厂商专区 活动 商城 中标信息

资讯
中心

新闻中心 人物观点
厂商专区 市场分析
行业
应用
政府机构 能源产业 金融机构
教育科研 医疗卫生 交通运输
应用
分类
统一协作 呼叫客服 IP语音 视频会议 智能管理 数据库
数字监控 信息安全 IP储存 移动应用 云计算 物联网

TOP

捷通华声发布三项HCI新技术 语音识别准确率达90%以上
2012-11-29 09:18:12 来源:C114中国通信网 作者:【
关键词:捷通华声 HCI 语音识别
 
11月28日晚间消息,北京捷通华声语音技术有限公司(简称“捷通华声”)今日在北京中关村举行“2012灵云发布会”。会上,捷通华声发布了语音识别、语义理解和光学字符识别三项HCI技术,其中语音识别准确率已达到90%以上。

  11月28日晚间消息,北京捷通华声语音技术有限公司(简称“捷通华声”)今日在北京中关村举行“2012灵云发布会”。会上,捷通华声发布了语音识别、语义理解和光学字符识别三项HCI技术,其中语音识别准确率已达到90%以上。

  此前,捷通华声一直以语音合成技术和手写技术闻名于业界。而如今其语音合成技术依然保持领先,有超过50%的市占率。而手写识别也占据了约35%的市场份额,且支持42种语言及手写/叠写识别,突破了用户叠写字迹无法识别的局限。

图1:参会嘉宾通过手写识别获取签到资料

  除了已有HCI技术,捷通华声在发布会上又发布了语音识别、语义理解和光学字符识别三项新技术。语音识别是指机器对人声的识别,主要有“所说即所点”、“智能意图控制”、“语音输入”三种应用场景。语义理解是机器对人类语言的理解,目前大多应用在智能问答场景中。光学字符识别,则是对印刷体文本资料中的文字和版面信息识别的过程。

  在语音识别方面,捷通华声针对三种不同场景做了专门优化。“所说即所点”是用人声来代替点击操作,解决了车载等无法便捷实现点击的场景局限。目前这方面的识别正确率已超过95%,识别响应时间从原来的2.7秒降到了0.3秒。

  而“智能意图控制”是人通过语音控制周围环境,执行一系列命令操作的过程,比如人与智能手机客户端小唐龙的互动,成功实现了人机互动的便捷生活。第三大场景“语音输入”则是将人的声音转换成文字,目前捷通华声这一技术在微博短信中的语音输入正确率已超过90%。

图2:灵云输入法与小唐龙下载区

  至今,灵云已拥有语音合成(TTS)、语音识别(ASR)、手写识别(HWR)、光学字符识别(OCR)、人工智能(AI)等多项HCI核心技术。通过捷通华声工程师团队的努力,这些技术被成功放置到灵云平台上,且其客户端程序被大大缩减至3M。通过这3M大小的应用程序,客户可以调用所有的灵云能力,从而为不同领域、行业企业提供了多种HCI解决方案,包括无纸化办公方案、电子签批方案、电子表单处理方案、语音技术方案、智能客服系统方案等。

  除了支持多项HCI技术,灵云还可以挂接第三方的HCI能力,力求将多样化的HCI技术加载到灵云平台上,服务服务广大的用户。而“云+端”的方式,使得灵云性能更优化,响应速度更快,极大地方便了用户的使用。而作为一个开放性平台,灵云定制化的目标更加明确,满足各种场景应用和需求。捷通华声董事长张连毅表示,通过灵云以及各项HCI技术的不断创新,捷通华声希望能达成“让人与机器的交流像人与人一样自然”的愿景。

      

责任编辑:admin
免责声明:以上内容转载互联网平台或企业单位自行提供,对内容的真实性、准确性和合法性不负责,Voipchina网对此不承担任何法律责任。

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部

上一篇震有科技NuBiz® OPC8000 获..
下一篇西门子企业通信(SBCS)2013年度..

热门文章

图片主题

最新文章

相关文章

广告位

Copyright@2003-2009 网络通信中国(原VoIP中国) 版权所有
联系方式:503927495@qq.com
  京ICP备05067673号-1 京公网安1101111101259