Название | Идентификатор | Тип задания | Метрика | Лицензия | Скачать | Результат HB |
---|---|---|---|---|---|---|
Russian Winograd Schema Challenge | RWSD | Бинарная классификация | Accuracy | MIT License | 0.84 |
Russian Winograd Schema Dataset (RWSD или схема Винограда) - это задание, в котором в предложении выделено два текстовых фрагмента. Задача состоит в том, чтобы определить, употреблены ли они в одном смысле или в разных. Схема берет свое имя из известного примера Терри Винограда.
Корпус заданий составлен как вызов для ИИ в соответствии с тестом Тьюринга. Одним из плюсов такой постановки задания является простая форма машинного ответа, и ответы системы делают даже для неспециалистов очевидным недостаток в знаниях проблемы в понимании задания машиной.
Логика и аргументация, знания о мире. Бинарная классификация: true/false
{
"text": "Кубок не помещается в коричневый чемодан, потому что он слишком большой."
"label": false,
"idx": 5,
"target": {
"span1_text": "чемодан",
"span2_text": "он слишком большой",
"span1_index": 5,
"span2_index": 8
},
}
Все текстовые примеры были собраны вручную, с соответствующим переводом и адаптацией оригинальных данных Winograd для русского языка. Оценка уровня человека проводилась на Яндекс.Толоке.
Английский результат Схемы Винограда - точность 93.8%