海丰| 嘉义县| 慈利| 大港| 乌达| 嘉善| 始兴| 泗阳| 东光| 河曲| 凯里| 晋宁| 涞源| 尼勒克| 广德| 蓬溪| 邯郸| 诏安| 盘山| 贵溪| 西畴| 江苏| 瓦房店| 马边| 察哈尔右翼后旗| 景东| 神木| 兴国| 班戈| 黎川| 吉林| 合阳| 涟源| 建昌| 博野| 阿拉善右旗| 石拐| 景县| 高要| 沧源| 台南市| 囊谦| 中宁| 全椒| 奉贤| 陆丰| 万全| 开化| 尼玛| 新宾| 长寿| 凤县| 定南| 资兴| 铁岭市| 紫阳| 瑞丽| 莱州| 井陉矿| 连云港| 怀宁| 永兴| 南部| 荥经| 娄烦| 涠洲岛| 彭阳| 鄂尔多斯| 北海| 江都| 马关| 宾县| 黄陂| 金秀| 江津| 辉县| 邻水| 集安| 德惠| 乌兰浩特| 巴林右旗| 承德县| 永胜| 南部| 广西| 天长| 甘德| 那坡| 下花园| 临高| 平原| 大方| 交口| 江源| 隆回| 临夏县| 亚东| 下陆| 二道江| 南漳| 鄂托克前旗| 苏州| 红河| 新密| 宁明| 常州| 上思| 靖宇| 深泽| 大方| 积石山| 长泰| 乃东| 色达| 吐鲁番| 峨边| 鄂温克族自治旗| 阿荣旗| 马山| 勉县| 河南| 古交| 阿荣旗| 苍梧| 卓尼| 民和| 道孚| 石景山| 开封市| 布尔津| 同心| 东宁| 临高| 秦安| 思茅| 荣县| 望江| 万宁| 太和| 邳州| 行唐| 舟曲| 神农架林区| 永昌| 普宁| 进贤| 丹棱| 周至| 麻栗坡| 吕梁| 改则| 嵩县| 崇州| 丽水| 肃南| 邕宁| 成县| 鲁甸| 饶阳| 宁乡| 乌拉特前旗| 略阳| 江口| 岢岚| 旌德| 察哈尔右翼后旗| 陵县| 鄂托克前旗| 昂仁| 双阳| 封开| 神农架林区| 眉山| 循化| 朝阳市| 西峡| 芷江| 贵港| 芒康| 头屯河| 宝兴| 抚远| 奉新| 竹山| 邹城| 索县| 台儿庄| 安西| 通道| 宁波| 洪洞| 托里| 惠农| 托里| 会宁| 武平| 防城港| 太湖| 香河| 合作| 金湾| 吴川| 全椒| 台北市| 张家界| 贵定| 长阳| 巴中| 长治市| 班戈| 云林| 石台| 行唐| 随州| 庆安| 漳州| 祁阳| 岳阳县| 山东| 阳原| 株洲市| 开江| 磐石| 南汇| 金塔| 奎屯| 嘉善| 湖口| 珙县| 沾化| 绍兴市| 灵山| 定边| 庆云| 高港| 泰兴| 道县| 青神| 杭锦旗| 霞浦| 东莞| 临潼| 无棣| 正定| 定襄| 贵定| 高雄县| 开化| 呼伦贝尔| 金佛山| 蓬莱| 嘉荫| 弓长岭| 从江| 湾里| 建始| 班戈| 冕宁| 崇礼| 龙泉| 永新| 龙泉驿| 清远| 图木舒克| 皇冠娱乐
首页| 滚动| 国内| 国际| 军事| 社会| 财经| 产经| 房产| 金融| 证券| 汽车| I T| 能源| 港澳| 台湾| 华人| 侨网| 经纬
English| 图片| 视频| 直播| 娱乐| 体育| 文化| 健康| 生活| 葡萄酒| 微视界| 演出| 专题| 理论| 新媒体| 供稿

AI Challenger大赛开设双赛道 企业级数据集助力AI技术研究

2018-12-11 10:26 来源:中国新闻网 参与互动 
标签:鸾飞凤舞 赌博网站 北玲珑巷社区

  中新网10月23日电 近日,“AI Challenger 走进传智汇•搜狗专场”在上海举行。AI Challenger是面向全球人工智能人才开放的数据集和编程竞赛平台,致力于打造大型、全面的科研数据集与世界级竞赛平台。作为发起方之一,继去年开设翻译赛道后,此次搜狗新增问答领域赛道,开放口语领域、机器阅读理解领域全球规模最大、难度最大的数据集。

搜狗公司专家研究员翟飞飞在会上发表演讲
搜狗公司专家研究员翟飞飞在会上发表演讲

  分享会上,搜狗公司专家研究员翟飞飞、搜狗杭州研究院首席研究员张奇分别分享了搜狗在翻译及问答领域的技术研究及成果。翟飞飞表示,“目前的翻译常见于基于一个句子进行,但实际生活中的应用范围却是场景和篇章,希望通过我们的分享,能够帮助大家在翻译上做更多探索。”张奇则对机器问答技术进行了介绍,“整个问答就是搜索加上阅读理解,搜索引擎已从‘搜关键词得链接’发展到‘搜问句得答案’的时代。”

搜狗杭州研究院首席研究员张奇在会上发表演讲
搜狗杭州研究院首席研究员张奇在会上发表演讲

  拥有庞大用户量的搜狗,积累了海量数据集,此次为大赛开放企业级数据集,一方面,有效解决了AI技术落地中数据集缺失的问题,让AI技术更加实用化地应对真实世界的问题。另一方面,为人工智能产业发掘并培养优秀人才,促进行业发展创新。

  全球规模最大数据集,助力翻译体验更加人性化

  2017年,搜狗作为主办方之一,在第一届AI Challenger中主持翻译赛道,开放1000万规模的中英双语数据集,吸引超2000个团队的6000名左右选手参赛。今年,搜狗再次开设翻译领域赛道——英中文本机器翻译,在去年1000万级中英双语数据的基础上,新增300万带有上下文情景的双语数据,开放1300万全球规模最大的口语领域英中双语对照数据集,在开放的中英语料里,搜狗超过千万级的语料规模,仅次于联合国平行语料库(亿级)。真实有价值的企业级数据为机器翻译的研究提供更多探索空间,推动翻译产品使用体验更加人性化。

  企业级的数据来自于搜狗在机器翻译领域的多年积累,翻译是搜狗AI战略中的重要一环,且搜狗已取得阶段性成果突破,不仅在国际学术赛事WMT 2017中层获得中英和英中机器翻译双向冠军,并且发布了全球首次商用基于深度神经网络的同传翻译技术,在领先技术的支持下,搜狗推出英文搜索、翻译宝pro等软硬件产品,率先推动AI翻译技术走向实用化,将技术真正落到实处。

  全球难度最大数据集,为提供更精准的答案积蓄力量

  机器的使命之一是和人做沟通,如何让人和机器能够更自然地沟通交互是当前发展人工智能技术的前沿议题。随着人工智能的发展,问答技术成为推动人与机器自然沟通的下一个发力点,问答相当于搜索加阅读理解,即让机器先理解问题,然后从海量网页中寻找问题的答案。

  今年的AI Challenger上,除翻译赛道外,搜狗增设问答领域赛道:观点型问题机器阅读理解,开放总共30万规模的数据集,数据中包括问题及对应短文本和答案。此次开放的问答数据,不仅是全球难度最大的中文阅读理解开源数据集,同时也是全球最大的观点型机器阅读理解公开数据集。

  事实上,在很多问答比赛中,使用的数据并不是真实问题,而是人为构建,与现实存在很大差距。而搜狗搜索拥有超5亿用户规模,积累了大量丰富且真实的数据。此次AI challenger大赛,搜狗在问答赛道中针对阅读理解中较为复杂的,但是十分典型的观点型问题构建了大规模语料,语料均来自于用户的真实问题和真实需求,帮助参赛团队实现实用化程度高的研究,提升阅读理解的研究水平,推动问答技术研究向更高阶段发展。

  用AI应对真实世界的问题,让技术真正走向生活

  在2018 AI Chanllenger开幕式上,搜狗CEO王小川表示,“数据是AI研发的核心,如果没有真实的数据,应用场景就会走偏,技术研究的方向具体的算法就会走向错误。”

  真实的互联网数据是展开前沿技术研究最重要的依靠,早在2006年,搜狗就与清华大学联合成立“清华搜狗搜索技术联合实验室”,将积累的大数据资产开放给高校,共同推动前沿技术研究与进步。

  此次挑战赛上,搜狗不仅给出题目和赛道,并在赛道中开放企业级数据集,其重量级、真实的数据集为人工智能的实际需求研究提供助力,为技术的应用场景保驾护航。同时,搜狗也将与优秀人才进一步沟通交流,共同提升研究的实用性价值,让人工智能更加实用化。

  王小川认为,“人工智能与人不是取代的关系,而是配合的关系,最终将成为人类能力的延伸。”作为人工智能领域的开拓者,搜狗用开放的力量整合创新能力,为人工智能行业培养并输送人才,为行业进步和发展提供内驱力,推动中国人工智能领域科研创新。

【编辑:叶攀】
本网站所刊载信息,不代表中新社和中新网观点。 刊用本网站稿件,务经书面授权。
未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任。
[京ICP证040655号] [京公网安备:110102003042-1] [京ICP备05004340号-1] 总机:86-10-87826688

Copyright ©1999- 2018 chinanews.com. All Rights Reserved

山货回族乡 凤翔村 木荫档 香花镇 澄潭江镇
昆东居委会 塔水镇 总堡乡 柜木溪村 南天花园
小四餐厅做的不错 春晖路街道 经一路 狮子林大街阳春胡同 中港乡
观音窝 南田雅园 五罗徐村村委会 北京东站 江南青年城
澳门赌场排名 葡京网址 九五至尊娱乐场 战神赌博官网平台 澳门太阳城赌场
澳门赌场开户 博彩公司评级 威尼斯人线上注册 澳门银河娱乐场注册 永利网址