学术动态

学术动态

副标题

IMLIP资源

IMLIP资源

副标题

IMLIP@百度 | 自然语言处理技术

时间:2021年11月05日 15:00-16:50

腾讯会议:121 627 434

B站直播链接:http://live.bilibili.com/21702393

主办方:中国人工智能学会多语种智能信息处理专委会(CAAI-IMLIP)

承办方:百度公司


活动流程

15:00-15:10 【致辞】百度技术委员会主席 吴华

15:10-15:20 【致辞】北理工NLPIR实验室主任、中国人工智能学会多语种智能信息处理专委会 秘书长 张华平

15:20-15:50   百度人工智能技术委员会主席 何中军

分享主题:机器同声传译的挑战与进展

15:50-16:20 中国科学院计算技术研究所自然语言处理团队负责人   冯洋

分享主题:非自回归式生成会成为机器翻译的主流范式吗?

16:20-16:50 百度杰出架构师、百度文心(ERNIE)负责人 孙宇

分享主题:百度文心ERNIE预训练技术和平台



致辞嘉宾 吴华

吴华,百度技术委员会主席,主要从事自然语言处理领域的研究,其主持研发的多项核心技术被广泛应用于翻译、搜索、智能音箱、地图等产品,并赋能各行各业。曾获国家科技进步奖二等奖、中国专利金奖;被评为杰出工程师、青年北京学者等。



致辞嘉宾 张华平

张华平,北京理工大学副教授,中国人工智能学会多语种智能信息处理专委会秘书长,知名汉语分词系统ICTCLAS创始人,大数据搜索与挖掘实验室主任。主持国家自然科学基金、863等国家级课题十余项,曾先后获得2016年度新疆自治区科技进步奖二等奖,2010年度钱伟长中文信息处理科学技术奖一等奖。发表《大数据智能分析》等专著5部。



演讲议题与嘉宾介绍


分享嘉宾1 何中军


何中军,百度人工智能技术委员会主席。从事机器翻译研究与开发近二十年,研发了全球首个互联网神经网络翻译系统及语义单元驱动的机器同传系统。曾获国家科技进步二等奖、中国电子学会科技进步一等奖、北京市科技进步一等奖等多项奖励。

分享主题:机器同声传译的挑战与进展

演讲摘要:

    同声传译是指在不打断讲话者的条件下,将讲话内容实时地翻译给听众的一种翻译方式,广泛应用于国际会议、商务会谈、新闻发布会等场景。利用机器进行自动同传,具有巨大的应用需求和重要的科学价值。机器同传涉及语音处理、机器翻译等多项技术,近年来成为人工智能领域的前沿方向。随着技术持续进步,机器同传系统得到广泛应用。本报告首先介绍机器同传面临的挑战,然后介绍主流模型和当前进展,最后介绍产品形式和应用。



分享嘉宾2 冯洋

冯洋,研究员,博士生导师,中国科学院计算技术研究所自然语言处理团队负责人,中国人工智能学会首批杰出会员(共70人),主要研究方向为自然语言处理、机器翻译和人机对话。多次担任ACL/EMNLP/COLING等国内外会议高级领域主席/领域主席、ARR首批Action Editor,机器翻译方面的工作获得ACL 2019最佳长文奖,为ACL开办50多年来国内首次获奖,并获CCF自然语言处理专委会“青年新锐奖”、“钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖等。

分享主题:非自回归式生成会成为机器翻译的主流范式吗?

演讲摘要:

    非自回归机器翻译模型以其快速解码的特点收到了越来越多的关注,但是由于其是以牺牲序列性来提升速度,因此面临着诸多挑战,其中最大的挑战就是多峰问题。多峰问题是非自回归模型缺少序列性所必然带来的问题,本报告将介绍我们为解决多峰问题进行的探索,并探讨非自回归模型是否可以替代自回归模型,成为机器翻译的主流范式。



分享嘉宾3 孙宇

孙宇,百度杰出架构师、百度文心(ERNIE)负责人。主要研究领域包括语言理解、深度学习、信息检索等。领导研发了百度语义理解技术与平台文心(ERNIE)、百度搜索引擎关键核心技术等世界领先技术,相关成果广泛应用于搜索引擎、信息流、智能音箱等产品,显著改善亿万网民用户体验。取得包括全球规模最大语义评测SemEval等世界冠军十余项,在ACL、NAACL、EMNLP等会议发表论文十余篇,发表国内外相关专利七十余项,相关论文被Paper Digest评为AAAI 2020最具影响力的学术论文之一。荣获世界人工智能大会最高奖项 SAIL 奖、中国人工智能学会优秀科技成果奖、中国电子学会科技进步一等奖等奖项、百度最高奖和百度最佳团队奖。

分享主题:百度文心ERNIE预训练技术和平台

演讲摘要:

    近年来,预训练语言模型在自然语言处理领域发展迅速,并获得广泛应用。2019年,百度提出了基于知识增强的语义理解技术ERNIE,在语义理解领域取得世界级突破,在国际权威的通用语言理解评估基准GLUE上,以超过人类水平3个百分点的成绩获得全球第一。2020年,ERNIE又在语言生成、跨模态理解、多语言理解等方向取得突破,先后提出了ERNIE-GEN、ERNIE-VIL、ERNIE-M等模型,取得几十项SOTA,登顶各方向权威评测的榜首。ERNIE 2.0论文被Paper Digest团队评为国际人工智能顶级学术会议AAAI 2020最具影响力的学术论文。目前,ERNIE已广泛应用于百度搜索引擎、信息流、智能音箱等几十个产品。ERNIE也面向开发者和企业进行开放,已应用于金融、通信、教育、互联网等行业。本次报告主要包含百度ERNIE最新进展、应用实践以及产品化探索。



分享到:
ABUIABACGAAg6tCwgwYo1JH-0AUwggI4ggI

扫一扫关注微信公众号