百度PaddlePaddle常规赛NLP赛道火热开启-白红宇

百度PaddlePaddle常规赛NLP赛道火热开启

阅读量：5837 次

发布时间：2019-06-18

本文共 1245 字，大约阅读时间需要 4 分钟。

作为人工智能时代的基础，深度学习一直是人工智能最热门、企业投入最多的研究领域之一，百度PaddlePaddle深度学习框架应运而生，这是国内唯一一家拥有自主知识产权的开源深度学习框架。在此框架中，汇聚了更多的AI科学家、架构师、AI爱好者，设置常规赛，提供丰富的真实数据，多样的算法赛题，显示百度对深度学习框架战略地位的重视，让AI爱好者能够得到更多真实场景的练习机会和更多PaddlePaddle的实际训练经验，这势必推动PaddlePaddle更广泛、更深入地用于人工智能研发及落地应用。

目前已推出2个赛题，从最常见的文档提取归纳总结出发，涉及汽车以及中文阅读领域，无论是从赛事的设计理念，还是对技术能力的把握，此次常规赛都将对PaddlePaddle的推广和使用产生深远的影响。之后PaddlePaddle将会持续推出更多主题的常规赛，让我们拭目以待。

赛题一：汽车大师问答模型赛

【赛题简介】

汽车大师是一款通过在线咨询问答为车主解决用车问题的APP，致力于做车主身边靠谱的用车顾问，车主通过汽车大师用语音、文字或图片发布汽车问题，系统为其匹配专业技师提供及时有效的咨询服务。由于平台用户基数众多，重复回答和持续时间长的多轮问询花去汽修技师大量时间，也使用户获取解决方案的时间变长，对双方来说都存在资源浪费的情况。为了节省更多人工时间，提高用户获取回答和解决方案的效率，要求选手们使用汽车大师提供的11万条技师与用户的多轮对话与诊断建议报告数据建立模型，从而可基于对话文本、用户问题、车型与车系，输出包含摘要与推断的报告文本，考验模型的归纳总结与推断能力。

汽车大师比赛样例项目:

汽车大师比赛数据集:

赛题二：NLP智能问答赛

【赛题简介】

BROAD中包含着迄今为止规模最大的中文公开领域阅读理解数据集，DuReader。该数据集基于真实应用需求，所有问题均来源于百度搜索用户的真实问题，文档来自全网真实采样的网页文档和百度知道 UGC 文档，答案基于问题与文档由人工撰写生成。数据集标注了问题类型、实体和观点等丰富信息，弥补了现有主流数据集对于观点类问题覆盖不足的问题。要求选手们依据BROAD开放数据集中全球最大中文阅读理解数据集建立基于文本与问题，输出正确答案的模型，考验模型的归纳总结与改述能力。

机器阅读理解样例项目：

数据集:

赛程及奖项设置

比赛从2018年9月28日开始，直到赛题下线。常规赛不设初赛复赛，以当月每位参赛选手提交的最优成绩排名。这期间选手每天可提交5次作品，当评分优于baseline Model成绩，则认定挑战成功，即可停止提交。选手可同时参加多场比赛。

具体详情请看官网：

（点击AI Studio官网-比赛-比赛列表-选取要参加的比赛）

PaddlePaddle期待与全球AI爱好者们一起打造世界顶级深度学习框架，共同推动AI技术的进步。

转载于:https://my.oschina.net/u/3968773/blog/2222230

你可能感兴趣的文章