|
【评测通知】IMLIP2023多语种图像描述生成评测为促进多语种智能信息处理研究,加强产学研交流与合作,中国人工智能学会多语种智能信息处理专委会发布“多语种图像描述生成评测任务”。 图像描述生成任务(Image Captioning)旨在生成描述图像的自然语言,该任务涉及到自然语言处理和计算机视觉两个领域多方面的研究问题。近年来受到学术界和工业界的广泛关注,也出现了一些有价值的应用。随着深度学习技术的发展,端到端图像描述生成系统的表现有了大幅度提升。目前图像描述生成任务的公开数据集多为英语和汉语,为了推动多语种图像描述生成研究的发展,我们汇集整理了蒙语、藏语和维语三个语种的图像描述生成数据集,开展本次多语种图像描述生成评测任务,聚焦该任务涉及到的前沿问题,进一步推动多语种智能信息处理研究的发展。 评测官网:http://mleval.cn/pic2text/ 1 任务介绍 图像描述生成任务的目的是为给定图像自动生成高质量的描述文本。本评测任务分为三个子任务,分别为蒙古语、藏语和维吾尔语的图像描述任务。
参赛者可以根据自己的研究兴趣,参与一个或多个子任务。本评测任务要求各位参赛者在现有评测系统基础上针对给定的测试集,研发新的自动评测算法,该评测算法要求在测试集上所得评测结果尽可能地与人工评测结果一致。我们将为参与者提供任务所需数据集和评价方法,并采用客观的评价指标结果作为提交算法的最终成绩。 本次评测任务所用数据集来自图像描述生成任务的公开数据集Flickr8k,采用机器翻译结合人工校对的方式,我们开发了蒙语、藏语和维吾尔语的Flickr8k数据集。数据集发布后请各位参赛者自行登陆官网下载并查阅。 2 报名方式 以机构、团体或个人名义均可报名参加,有意向的参赛者可通过评测官网填写相关信息进行报名。 3 奖励设置 本次评测将评选出一、二、三等奖,奖池共计 30000元人民币。
另外,中国人工智能学会将为本次评测所有获奖队伍提供荣誉证书。 赞助商:上海蜜度信息技术有限公司 4 评测赛程 2022.11.10-2023.5 报名阶段,报名入口见官网。 2022.11.15 发布所有赛道的训练集和开发集。PS:目前数据集已发布,请各位参赛者自行登陆官网下载并查阅。 2023.3.20 发布测试集。 2023.3.20 参赛系统结果提交入口开放(将结果发送21400169@muc.edu.cn)。 2023.6.10 参赛系统结果提交入口关闭。 2023.6.15 公布评测结果。 2023.7 评测研讨会(2023中国人工智能大会) 5 评测组织 组织结构 – 中国人工智能学会 – 中国人工智能学会多语种智能信息处理专业委员会 – 多语种智能信息处理专业委员会语料共享和评测工作组 – 国家语言资源监测与研究少数民族语言中心 – 中央民族大学国家安全研究院语言信息安全中心 – 省部共建藏语智能信息处理及应用国家重点实验室 – 百度 – 国家基础学科公共科学数据中心 – NLPIR大数据搜索与挖掘实验室 组织者 – 赵小兵(中央民族大学) – 李 琳(青海师范大学) – 陈 波(中央民族大学) – 孙 媛(中央民族大学) – 何中军(百度) – 周园春(中国科学院计算机网络信息中心) – 张华平(北京理工大学) 联系人 – 高 璐(中央民族大学) – 崔璐明(青海师范大学) – 高 歌(中央民族大学) 21400169@muc.edu.cn ![]() 关于我们 ![]() 微信公众号 新浪微博 ![]() ![]() |