Задача RWSD

Название Идентификатор Тип задания Метрика Лицензия Скачать Результат HB
Russian Winograd Schema Challenge RWSD Бинарная классификация Accuracy MIT License 0.84

Описание

Russian Winograd Schema Dataset (RWSD или схема Винограда) - это задание, в котором в предложении выделено два текстовых фрагмента. Задача состоит в том, чтобы определить, употреблены ли они в одном смысле или в разных. Схема берет свое имя из известного примера Терри Винограда.

Корпус заданий составлен как вызов для ИИ в соответствии с тестом Тьюринга. Одним из плюсов такой постановки задания является простая форма машинного ответа, и ответы системы делают даже для неспециалистов очевидным недостаток в знаниях проблемы в понимании задания машиной.

Тип задачи

Логика и аргументация, знания о мире. Бинарная классификация: true/false

Пример


{
  "text": "Кубок не помещается в коричневый чемодан, потому что он слишком большой."
  "label": false,
  "idx": 5,
  "target": {
    "span1_text": "чемодан",
    "span2_text": "он слишком большой",
    "span1_index": 5,
    "span2_index": 8
  },
}

Как мы собирали данные?

Все текстовые примеры были собраны вручную, с соответствующим переводом и адаптацией оригинальных данных Winograd для русского языка. Оценка уровня человека проводилась на Яндекс.Толоке.

State of the Art

Английский результат Схемы Винограда - точность 93.8%

Статьи по теме