2023 01-03 项目介绍NLPIR_UGWS(Natural Language Processing & Information Retrieval Sharing Platform Uyghur Word Segmentation Corpus )是由NLPIR实验室构建的维吾尔语分词语料。原始语料为从CWMT往届语料中选取的共5000条句子。语料库构建的步骤为:语料搜集、聚类、随机抽取、自动分词、人工分... 2021 08-31 (一) 技术评测及相关活动组织 1. 工作目标构建面向多语种智能信息处理研究和应用的综合性、多层级技术评测和资源汇聚交流平台,通过面向全球范围公开征集和发布评测任务及评测数据集,推进高等院校、科研院所和政府、企业界基于人工智能应用的多语种智能信息处理的研究进展和技术转化、国际学术交流与合作,鼓励针对原创性的评测方法研究,建构具有国际影响力的多语种智能信息领域技术评测与资源汇聚平... |