Современные языковые модели, такие как BERT, ELMo, XLNet, RoBERTa и другие — нуждаются в сравнении и оценке.
Мы предлагаем методологию тестирования, основанную на тестах для сильного ИИ — логике, здравом смысле, целеполагании в приложении к языковым данным. Придерживаясь методологии GLUE и SuperGLUE, мы представляем набор тестовых заданий на General Language Understanding и лидерборд моделей.
Впервые полный тест, аналогичный англоязычному бенчмарку, разработан для русского языка, многие датасеты составлены с нуля. Также впервые представлен лидерборд моделей для русского языка с сопоставимыми результатами.
@article{shavrina2020russiansuperglue,
title={RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark},
author={Shavrina, Tatiana and Fenogenova, Alena and Emelyanov, Anton and Shevelev, Denis and Artemova, Ekaterina and Malykh, Valentin and Mikhailov, Vladislav and Tikhonova, Maria and Chertok, Andrey and Evlampiev, Andrey},
journal={arXiv preprint arXiv:2010.15925},
year={2020}
}
rybolos@gmail.com
Татьяна является аспирантом ВШЭ и является главой R&D подразделения NLP при Сбербанке.Основные работы в сфере создания корпусов и универсальных трансформеров. Татьяна также является организатором соревнований по оценке систем (морфологии, исправления опечаток и т.д.)
valentin.malykh@huawei.com
Научный сотрудник и аспирант Лаборатории нейронных систем и глубокого обучения МФТИ. Валентин написал более 20 работ в области NLP, в том числе он является автором публикаций на таких конференциях, как NeurIPS, ACL, WSDM. Сейчас Валентин работает старшим научным сотрудником в компании Huawei лаборатории Noah`s Ark.
m_tikhonova94@mail.ru
Мария Тихонова – аспирантка факультета компьютерных наук Высшей Школы экономики. Она закончила механико-математический факультет Московского Государственного Университета. Мария работает в Сбербанке в подразделении R&D в NLP. К ее научным интересам относятся NLP и тематическое моделирование.
reddraner@gmail.com
Денис Шевелев получил два высших образования в области филологии и журналистики в МГГУ. С 2005 года занимается копирайтингом и редактурой. Работает в подразделении RnD Сбербанка, Москва. Интересуется вопросами общего интеллекта и машинного распознавания естественного языка и эмоций. Сценарист, автор двух графических романов.