Название | Идентификатор | Тип задания | Метрика | Лицензия | Скачать | Результат HB | Результат бейзлайна |
---|---|---|---|---|---|---|---|
Russian WiC - RUSSE | RUSSE | Бинарная классификация | Accuracy | MIT License | 0.805 |
Russe. WiC: The Word-in-Context Dataset Золотой набор данных для оценки контекстно-зависимых значений слов.
В зависимости от контекста, неоднозначное слово может относиться к множеству потенциально несвязанных значений. Основные вложения статических слов, такие как Word2vec и GloVe, не могут отразить эту динамическую семантическую природу. Контекстуальное вложение слов - это попытка устранить это ограничение путем вычисления динамических представлений для слов, которые могут адаптироваться на основе контекста.
Задача WiC Russian SuperGLUE заимствует исходные данные из [проекта Russe] (https://russe.nlpub.org/), из [дорожки] (https://russe.nlpub.org/2018/wsi/) по индукции и снятию неоднозначности у многозначых слов (2018)
Reading Comprehension. Бинарная классификация: true/false
{
"idx" : 8,
"word" : "дорожка",
"sentence1" : "Бурые ковровые дорожки заглушали шаги",
"sentence2" : "Приятели решили выпить на дорожку в местном баре",
"start1" : 15,
"end1" : 23,
"start2" : 26,
"end2" : 34,
"label" : false,
"gold_sense1" : 1,
"gold_sense2" : 2
}
Все текстовые примеры были получены из исходного набора данных на русском языке, который был собран проектом [Russian Semantic Evaluation] (https://russe.nlpub.org/2018/wsi/) в ACL SIGSLAV
В версии 2 мы сделали новый тестсет, вручную на новых данных.
Английский WiC - Точность: 76.9%