专业的信息化与通信融合产品选型平台及垂直门户
注册 登陆 设为首页 加入收藏
首页 企业新闻 招标信息 行业应用 厂商专区 活动 商城 中标信息

资讯
中心

新闻中心 人物观点
厂商专区 市场分析
行业
应用
政府机构 能源产业 金融机构
教育科研 医疗卫生 交通运输
应用
分类
统一协作 呼叫客服 IP语音 视频会议 智能管理 数据库
数字监控 信息安全 IP储存 移动应用 云计算 物联网

TOP

华为云摘得信息检索领域国际权威比赛WSDM Cup金牌
2020-03-02 10:36:33 来源:网络通信中国 作者:【
关键词:华为云
 
近日,在美国休斯敦闭幕的第13届网络搜索与数据挖掘国际会议(WSDM 2020)上,华为云语音语义创新Lab带领四所高校学生组成的联合团队摘得WSDM Cup大赛2020“论文引用意图识别任务”金牌。

   近日,在美国休斯敦闭幕的第13届网络搜索与数据挖掘国际会议(WSDM 2020)上,华为云语音语义创新Lab带领四所高校学生组成的联合团队摘得WSDM Cup大赛2020“论文引用意图识别任务”金牌。
  WSDM被誉为全球信息检索领域最有影响力也最权威的会议之一,会议关注社交网络上的搜索与数据挖掘,尤其关注搜索与数据挖掘模型、算法设计与分析、产业应用和提升准确性与效果的实验分析。今年已经是WSDM的第十三届会议。

  本次WSDM Cup共有三个赛题任务,华为云夺金赛题内容为“论文引用意图识别”:比赛提供一个论文库(约含80万篇论文),同时提供对被引用论文的引用文本描述,参赛选手需要根据论文引用描述从论文库中匹配三篇最相关的论文。
  论文是人类最前沿知识的媒介,如果可以理解论文中的数据,可以极大地扩充计算机理解知识的能力和范围。在论文中,作者经常会引用其他论文,并对被引论文做出对应描述。如果通过计算机可以自动地理解、识别描述对应的被引论文,不仅可以加深我们对科研脉络的理解,还能在科研知识图谱、科研自动问答系统和自动摘要系统等领域有所进步。
  华为云语音语义创新Lab带领华南理工大学、华中科技大学、武汉大学、江南大学学生组成的联合团队,针对该问题制定了“整体召回+重排+集成”的方案。在整体召回阶段,通过轻量化的文本相似度计算方法(如BM25、TFIDF、Word2Vec等),以较少的计算代价从大规模论文库中检索出给定查询的可能相关的论文集合。在重排阶段,通过计算量大但更准确的方法对这些候选论文中的每一篇论文计算和引用描述的相似度值并重新排序,例如采用基于深度学习的预训练语言模型BERT等。华为云团队观察到,赛题中所给语料都是生物医学领域,因此采用了基于生物医药和科学领域语料进行预训练的BioBERT和SciBERT语言模型对论文进行重排。通过对所有模型的结果进行集成,最终得到三篇最相关的论文。
  华为云在本次比赛中运用的文本匹配技术,可广泛用于搜索、对话机器人、知识图谱构建等领域。
  凭借在自然语言处理领域的全栈技术积累,华为云连续斩获了多个相关领域权威比赛冠军。2019年10月华为云语音语义创新Lab在DigSci科学数据挖掘大赛(学术论文搜索匹配大赛)上夺冠,精准率超过第二名5个百分点。在2019 CCF大数据与计算智能大赛决赛中,华为云语音语义创新Lab获得金融实体级情感分析大赛冠军,体现了在文本情感分析和知识图谱领域的实力。
  目前,华为云语音语义相关服务已经成功应用于政务、金融、油气、医疗、汽车、物流、保险、电商、税务、媒体等具有语音识别、语言理解、知识管理等需求的业务领域。

      

责任编辑:admin
免责声明:以上内容转载互联网平台或企业单位自行提供,对内容的真实性、准确性和合法性不负责,Voipchina网对此不承担任何法律责任。

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部

上一篇华为设立欧洲5G工厂:选址法国 预..
下一篇太原移动携手华为成功商用全国首..

热门文章

图片主题

最新文章

相关文章

广告位

Copyright@2003-2009 网络通信中国(原VoIP中国) 版权所有
联系方式:503927495@qq.com
  京ICP备05067673号-1 京公网安1101111101259