Несмотря на то, что научить компьютер читать и понимать текст является крайне трудной задачей, канадским разработчикам из Maluuba удалось достичь реального прогресса.

Нейронная сеть смогла ответить на вопрос о тайне семьи Дурслей
Фото: POPSUGAR

Как сообщает MIT Technology Review, в отчете о своей работе исследователи из Maluuba описали алгоритм, который способен считывать сотни детских историй и отвечать на вопросы по ним. После тренировки нейросети удалось ответить на вопросы с множеством вариантов ответов с точностью выше 70%.

 

Для тестирования своего алгоритма канадские исследователи выбрали первую книгу из саги Джоан Роулинг о юном волшебнике Гарри Поттере. Прочитав короткие фрагменты текста из этой фантастической истории, компьютерная программа рассказала о том, что за тайну хранят члены семьи Дурслей. Среди вариантов ответа были «их маленький сын», «Поттеры» и «кошки умеющие читать». Машина выбрать правильный третий ответ «Поттеры». Но это не самое удивительное: алгоритм справился с вопросом «На какой факультет попал Гарри Поттер?», несмотря на то, что финальной фразы Распределяющей шляпы в прочитанном компьютером отрывке не было.

 

Для обучения нейронной сети команда Maluuba выбрала наиболее известный ныне способ – глубокое обучение. В результате нейросеть не только смогла разобрать текст на различных уровнях абстракции (от слов к фразам и предложениям), но и улучшила свою способность отвечать на вопросы по тексту на 15% (по сравнению с простой нейронной сетью).

 

По словам профессора Монреальского университета и по совместительству научного советника Maluuba Иошуа Бенгио, полученные результаты – это значительный скачок в процессе обучения машин. Однако Бенгио, который также является одним из гуру глубокого обучения нейронных сетей, отмечает, что экспертам понадобится некоторое время, чтобы оценить значимость достижения канадских исследователей.

 

Идея обучения машин чтению и впоследствии способности к эффективной коммуникации с помощью речи, безусловно, захватывает умы ученых по всему миру. Реализация этой задачи может открыть совершенно новые и мощные способы взаимодействия человека с компьютером. Однако осмысливание текста – это одна из самых сложных проблем, стоящих перед разработчиками искусственного интеллекта: компьютеры, как правило, сбиты с толку необходимостью глубоко понимать текст.

 

 

Напомним, что ранее шведскому программисту Эрику Бернхардсонну удалось научить нейронную сеть создавать шрифты.