Новый подход к технологии предлагают инженеры из Стэндфордского и Калифорнийского университетов. Он основан на человеческой идентификации и визуализации объектов. Статья об этом вышла в Proceedings of the National Academy of Sciences.
Система искусственного интеллекта, представленная американскими инженерами, представляет собой настоящий провыв в области компьютерного зрения. Разработка может стать важным шагом на пути к созданию компьютеров, которые будут самостоятельнее и "интуитивнее", т.е. способными к более "человеческому" взаимодействию с нами. Ведь хотя современные системы компьютерного зрения – достаточно мощные, они все равно зависят от конкретной задачи, поставленной программистами. Что в свою очередь ограничивает их способность определять то, что они видят.
Даже лучшие на сегодняшний день технологии не могут воссоздать полную картину объекта, увидев только определенные его части. Также их легко обмануть, если представить тот же предмет в незнакомой обстановке. Конечно, это на порядок ниже человеческих возможностей. Ведь мы без труда можем понять, что перед нами собака, даже если она прячется за стулом и видны только ее лапы и хвост. При этом люди могут также легко интуитивно понять, где находится голова животного и остальная часть его тела. Именно такими возможностями захотели наделить свою ИИ-систему американские инженеры.
Еще один недостаток современных технологий компьютерного зрения – неспособность к самостоятельному обучению. Для того, чтобы идентифицировать объект, машине нужно просмотреть тысячи подобных изображений. Также стоит отметить, что это будет поверхностным распознаванием.
Новый подход состоит из трех этапов. На первом – система разбивает изображение на маленькие кусочки. На втором – компьютер узнает, как они сочетаются друг с другом, образуя рассматриваемый объект. И наконец, на третьем этапе, он смотрит на то, что находится вокруг, и имеет ли эта информация отношение к описанию и идентификации первичного объекта. А чтобы помочь новой системе "учиться", как это делают люди, инженеры решили погрузить ее в интернет-копию человеческой среды.
"К счастью, Интернет дает возможность ИИ-системам обучаться, как это обычно делаем мы. Во-первых, потому что тут есть множество изображений и видео, на которых изображены объекты одного и того же типа. Во-вторых, эти самые объекты показаны с разных точек зрения – частично, с высоты птичьего полета, с близкого расстояния и т. д.", – рассказывает Ввани Ройховдхери, главный автор разработки.
Кроме того, в изображениях и видео в Интернете существует огромное количество вариаций фона. По словам Ройховдхери, мы с младенчества видим объекты в различных обстоятельствах. И именно контекстное обучение является особенностью нашего мозга. Оно помогает людям создавать надежные модели объектов, которые являются частью интегрированного мировоззрения, где все функционально связано.
Исследователи протестировали новую ИИ-систему на 9000 картинках с людьми в окружении других объектов. Технология смогла построить детальную модель человеческого тела без телеуправления и маркировки изображений. Американские инженеры провели аналогичные испытания, используя фотографии мотоциклов, автомобилей и самолетов. Во всех случаях их разработка работала лучше или, по крайней мере, так же, как традиционные системы компьютерного зрения.
Напоминаем Вам, что в нашем журнале "Наука и техника" Вы найдете много интересных оригинальных статей о развитии авиации, кораблестроения, бронетехники, средств связи, космонавтики, точных, естественных и социальных наук. На сайте Вы можете приобрести электронную версию журнала за символические 60 р/15 грн.
В нашем интернет-магазине Вы найдете также книги, постеры, магниты, календари с авиацией, кораблями, танками.