|
语料共享与评测工作计划(一) 技术评测及相关活动组织1. 工作目标构建面向多语种智能信息处理研究和应用的综合性、多层级技术评测和资源汇聚交流平台,通过面向全球范围公开征集和发布评测任务及评测数据集,推进高等院校、科研院所和政府、企业界基于人工智能应用的多语种智能信息处理的研究进展和技术转化、国际学术交流与合作,鼓励针对原创性的评测方法研究,建构具有国际影响力的多语种智能信息领域技术评测与资源汇聚平台,打造国际化学术高地,共同推动多语种智能信息处理的技术进步与转化应用。 2. 工作任务(1) 搭建面向多语种智能信息处理任务的评测任务平台,平台的功能包括评测任务的征集、发布和运行; (2) 打造具有国际影响力、联通学术界和企业界的学术交流平台,为IMLIP专业委员提供学术交流和沟通的服务; (3) 建立具有创新能力和协作能力的评测工作小组,形成稳定的评测任务征集、发布、运行工作团队; (4) 制定评测任务征集、发布、运行制度。 (二) 资源库建设及共享1. 工作目标面向全球科研工作者,建设人工智能领域数据资源汇聚和开放共享的国际化专业平台;打造具有国际影响力的人工智能多语种资源库;推动人工智能多语种优质数据资源的持续汇聚、传播共享、评测服务、技术交流、国际合作与可持续发展。 2. 建设任务(1) 建设人工智能多语种资源汇聚共享服务国际化专业平台 遵循国际标准规范,建设专业易用、安全稳定的人工智能领域多语种数据资源库平台,支持全球多语种人工智能科研工作者提交数据、管理数据、发布共享数据、访问使用数据、引用评价数据等。 (2) 打造具有国际影响力的人工智能多语种权威资源库 面向多语种人工智能领域科研人员、科技期刊等,加强宣传推广与应用,持续汇聚全球优质人工智能领域多语种语料库等数据资源。通过技术手段自动获取国际开放共享多语种语料库等数据集,逐步建成资源覆盖范围全、数据质量高的权威人工智能多语种领域资源池。 (3) 开展增值服务,多维度推动平台可持续发展 加强与国际第三方平台的合作,提供数据推荐、融合检索服务,加速数据资源的国际化传播和利用。持续追踪数据的影响力情况。通过画像技术、科研社区发现等进行科研同行圈构建,推动科技信息交流共享,提供细粒度科研协同服务,推动技术交流与国际合作,多维度推动人工智能多语种权威资源平台的可持续发展。 (三) 学术影响力建设与宣传工作1. 《中国科学数据》多语种方向数据专刊建设与中科院计算机网络信息中心合作,建立《中国科学数据》(中国科学院主管)“多语种评测与数据”专刊,致力于国内多语种数据资源与技术评测相关的数据论文的开放、共享和引用,并作为多语种资源库建设的基础支撑。 2. 《全球自然语言处理技术评测及共享语料库建设》年度报告发布拟定于每年年底对外发布《全球自然语言处理技术评测及共享语料库建设》年度报告,报告内容主要包括本年度国内外自然语言处理领域(包括由专委会建设及组织的)相关技术评测活动及共享语料库建设情况、发展特征、发展趋势等内容。通过年度报告的发布,增强工作组及专委会权威性,扩大影响力。 3. 配合官方媒体宣传工作配合官方网站、微信公众号、微博、抖音等媒体建设,遵守相关规范,及时发布和推送各类新闻、日常活动、学习资源等。 (四) 其他1. 积极配合专委会其他各项活动开展。 2. 积极沟通联络专委会其他工作组,以期资源共享、互联互通。 3. 积极争取国家、行业评测相关基金项目,推动联合攻关的国家重大研发计划、相关基金项目的立项。 4. 根据工作组的技术评测、资源构建和转化应用等职责,工作组将陆续建构一些专题工作组,其工作模式和相关政策、制度等内容,将在充分征求意见后陆续形成发布。 5. 工作组正在搭建评测和资源工作网站,网址将在内容完善后发布。 |