Russian SuperGLUE

Задача RUSSE

Название	Идентификатор	Тип задания	Метрика	Лицензия	Скачать	Результат HB	Результат бейзлайна
Russian WiC - RUSSE	RUSSE	Бинарная классификация	Accuracy	MIT License		0.805

Описание

Russe. WiC: The Word-in-Context Dataset Золотой набор данных для оценки контекстно-зависимых значений слов.

В зависимости от контекста, неоднозначное слово может относиться к множеству потенциально несвязанных значений. Основные вложения статических слов, такие как Word2vec и GloVe, не могут отразить эту динамическую семантическую природу. Контекстуальное вложение слов - это попытка устранить это ограничение путем вычисления динамических представлений для слов, которые могут адаптироваться на основе контекста.

Задача WiC Russian SuperGLUE заимствует исходные данные из [проекта Russe] (https://russe.nlpub.org/), из [дорожки] (https://russe.nlpub.org/2018/wsi/) по индукции и снятию неоднозначности у многозначых слов (2018)

Тип задачи¶

Reading Comprehension. Бинарная классификация: true/false

Пример¶


{
  "idx" : 8,
  "word" : "дорожка",
  "sentence1" : "Бурые ковровые дорожки заглушали шаги",
  "sentence2" : "Приятели решили выпить на дорожку в местном баре",
  "start1" : 15,
  "end1" : 23,
  "start2" : 26,
  "end2" : 34,
  "label" : false,
  "gold_sense1" : 1,
  "gold_sense2" : 2
}

Как мы собирали данные? ¶

Все текстовые примеры были получены из исходного набора данных на русском языке, который был собран проектом [Russian Semantic Evaluation] (https://russe.nlpub.org/2018/wsi/) в ACL SIGSLAV

В версии 2 мы сделали новый тестсет, вручную на новых данных.

State of the Art

Английский WiC - Точность: 76.9%

Статьи по теме

Original Russe paper: Panchenko, A., Lopukhina, A., Ustalov, D., Lopukhin, K., Arefyev, N., Leontyev, A., Loukachevitch, N.: RUSSE’2018: A Shared Task on Word Sense Induction for the Russian Language. In: Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue”. pp. 547–564. RSUH, Moscow, Russia (2018)
Original WiC paper: WiC: the Word-in-Context Dataset for Evaluating Context-Sensitive Meaning Representations M.T. Pilehvar and J. Camacho-Collados, NAACL 2019 (Minneapolis, USA). Note: Results slightly differ between NAACL and Arxiv versions of the paper. Please take results in the Arxiv version, which is more up to date, as baseline for your evaluations.
Wang A. et al. Superglue: A stickier benchmark for general-purpose language understanding systems //Advances in Neural Information Processing Systems. – 2019. – С. 3261-3275.