Прорыв в области компьютерного зрения

20 декабря 2018, 06:00

2450

Компьютерное зрение (либо техническое зрение) – это технология создания машин, которые могут обнаруживать, отслеживать и классифицировать объекты. Его применение невероятно широко: от систем видеонаблюдения до анализа медицинских изображений.

Новый подход к технологии предлагают инженеры из Стэндфордского и Калифорнийского университетов. Он основан на человеческой идентификации и визуализации объектов. Статья об этом вышла в Proceedings of the National Academy of Sciences.

Система искусственного интеллекта, представленная американскими инженерами, представляет собой настоящий провыв в области компьютерного зрения. Разработка может стать важным шагом на пути к созданию компьютеров, которые будут самостоятельнее и "интуитивнее", т.е. способными к более "человеческому" взаимодействию с нами. Ведь хотя современные системы компьютерного зрения – достаточно мощные, они все равно зависят от конкретной задачи, поставленной программистами. Что в свою очередь ограничивает их способность определять то, что они видят.

Чтобы разработать новую систему искусственного интеллекта, исследователи изучали когнитивную психологию и нейробиологию
Фото: internapcdn.net

Даже лучшие на сегодняшний день технологии не могут воссоздать полную картину объекта, увидев только определенные его части. Также их легко обмануть, если представить тот же предмет в незнакомой обстановке. Конечно, это на порядок ниже человеческих возможностей. Ведь мы без труда можем понять, что перед нами собака, даже если она прячется за стулом и видны только ее лапы и хвост. При этом люди могут также легко интуитивно понять, где находится голова животного и остальная часть его тела. Именно такими возможностями захотели наделить свою ИИ-систему американские инженеры.

Еще один недостаток современных технологий компьютерного зрения – неспособность к самостоятельному обучению. Для того, чтобы идентифицировать объект, машине нужно просмотреть тысячи подобных изображений. Также стоит отметить, что это будет поверхностным распознаванием.

Новая ИИ-система способна идентифицировать объекты, основываясь только на частичных "проблесках" объекта. Например, с помощью таких фрагментов фотографии мотоцикла
Фото: internapcdn.net

Новый подход состоит из трех этапов. На первом – система разбивает изображение на маленькие кусочки. На втором – компьютер узнает, как они сочетаются друг с другом, образуя рассматриваемый объект. И наконец, на третьем этапе, он смотрит на то, что находится вокруг, и имеет ли эта информация отношение к описанию и идентификации первичного объекта. А чтобы помочь новой системе "учиться", как это делают люди, инженеры решили погрузить ее в интернет-копию человеческой среды.

"К счастью, Интернет дает возможность ИИ-системам обучаться, как это обычно делаем мы. Во-первых, потому что тут есть множество изображений и видео, на которых изображены объекты одного и того же типа. Во-вторых, эти самые объекты показаны с разных точек зрения – частично, с высоты птичьего полета, с близкого расстояния и т. д.", – рассказывает Ввани Ройховдхери, главный автор разработки.

Система понимает, что такое человеческое тело, просматривая тысячи изображений с людьми, а затем игнорируя несущественные фоновые объекты
Фото: pnas.org

Кроме того, в изображениях и видео в Интернете существует огромное количество вариаций фона. По словам Ройховдхери, мы с младенчества видим объекты в различных обстоятельствах. И именно контекстное обучение является особенностью нашего мозга. Оно помогает людям создавать надежные модели объектов, которые являются частью интегрированного мировоззрения, где все функционально связано.

Исследователи протестировали новую ИИ-систему на 9000 картинках с людьми в окружении других объектов. Технология смогла построить детальную модель человеческого тела без телеуправления и маркировки изображений. Американские инженеры провели аналогичные испытания, используя фотографии мотоциклов, автомобилей и самолетов. Во всех случаях их разработка работала лучше или, по крайней мере, так же, как традиционные системы компьютерного зрения.

Напоминаем Вам, что в нашем журнале "Наука и техника" Вы найдете много интересных оригинальных статей о развитии авиации, кораблестроения, бронетехники, средств связи, космонавтики, точных, естественных и социальных наук. На сайте Вы можете приобрести электронную версию журнала за символические 60 р/15 грн.

В нашем интернет-магазине Вы найдете также книги, постеры, магниты, календари с авиацией, кораблями, танками.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.

Теги: Информационные технологии

Предыдущая статья

Ученые Microsoft установили новый рекорд по объему данных, записанных в ДНК - 200 мегабайт

Следующая статья

SPEQS - крошечные спутники, являющиеся первым шагом на пути создания глобальной квантовой сети

Предоставлено SendPulse

Нравится 0

Комментариев 0