Зачем Facebook роботы?

Facebook проводит исследования в области робототехники,  а TechCrunch объясняет, зачем это нужно. Намек: это не про роботов.


Немного странно, что ведущая мировая соцсеть мира проводит исследования в области робототехники вместо, допустим, улучшения своей поисковой строки, но Facebook — это большая организация, сосредоточенная на разных (и конкурирующих между собой) приоритетах. И хотя роботы не будут напрямую влиять на то, как вы используете Facebook, информация, которую компания получит при работе с ними, может быть катализатором самых неожиданных перемен.

Робототехника — новая область исследований для компании, зато про передовую деятельность Facebook в сфере искусственного интеллекта все уже знают. Технологии, которые можно включить в понятие ИИ (пока их определение довольно туманное), обеспечивают множество функций начиная от эффектов для камеры и заканчивая автоматизированной модерацией контента.

ИИ и робототехника — связанные дисциплины, и достижения в одной области часто применяются или способствуют развитию новых открытий в другой.


👾Если вы еще не подписаны на наш телеграм-канал, то очень зря. Мы делимся там крутыми диджитал-статьями, цифрами, мнениями и новостями.


Короче, не удивительно, что с интересом Facebook к технологиям в области ИИ, компания хочет заниматься робототехникой, чтобы черпать там идеи для своих инноваций.

Как можно расширить применение робототехники и связанных с ней проектов, которые существуют сегодня? 


Учиться ходить

Ходьба — удивительно сложное действие (или серия действий), особенно когда у вас шесть ног, как у робота, задействованного в одном эксперименте. Конечно, робота можно было бы просто запрограммировать, чтобы он двигался вперед, поворачивался и т. д., но разве это не похоже на обман? В конце концов, нам всем пришлось учиться самим, без инструкции или предварительных настроек. Поэтому команда попыталась научить робота ходить самостоятельно.

Это не новый тип исследований — многие инженеры робототехники и разработчики ИИ занимаются подобным. Эволюционные алгоритмы (они разные, но соотносимы) появились давно, и мы уже видели интересных работов, подобных роботу-жуку.

Команда исследователей дала своему роботу некоторые базовые ориентиры (которые есть у людей), например, «вознаграждение» за движение. При этом у робота не было алгоритма, как работать ногами. Команда позволила ему экспериментировать и пробовать разное, медленно изучая и совершенствуя модель, по которой он движется. Цель состояла в том, чтобы сократить время, необходимое роботу для обучения, от нескольких недель до нескольких часов.

Для чего это можно использовать? Facebook — это обширный массив данных, сложных и плохо структурированных. Обучение навигации по сети данных, конечно, сильно отличается от обучения навигации по офису, но система, которая может развивать у себя подобные навыки в короткие сроки, может быть использована всюду.

Анализ того, как ИИ обучает себя, как устраняет препятствия на своем пути (например, такие как неверные приоритеты, странные привычки накопления данных и т.п.), важен для исследователей — ведь они должны создавать системы для работы как в реальном, так и в виртуальном мире. 


Опора на «любопытство»

Исследователь Акшара Рай настраивает руку робота в лаборатории ИИ в Менло-Парке (Facebook)

В этой работе меньше наглядности, но она более понятна: каждый из нас испытывает любопытство, и хотя мы знаем, что иногда оно губит кошку, в большинстве случаев любопытство помогает нам учиться эффективнее. Facebook применил концепцию любопытства к роботу, которого просили выполнять различные задачи.

Не правда ли, это немного странно, что исследователи пытались вселить в руку робота «любопытство», но под этим термином в данном случае подразумевается просто то, что ИИ сам определяет, как использовать руку — как захватывать, как быстро двигаться и т.п. Мотивация робота может уменьшить неопределенность в отношении какого-либо действия.

Такая способность может использоваться в разных ситуациях. Возможно, решение немного повернуть камеру в процессе идентификации объекта позволит немного улучшить обзор и повысить качество распознавания. Возможно, робот сначала посмотрит на цель, чтобы дважды проверить расстояние и убедиться, что нет никаких препятствий. В любом случае, когда ИИ предоставляют полную свободу действий и дают возможность находить решения, которые повышают его уверенность, а в конечном итоге позволят ему быстрее решать задачи (даже если в самом начале робот может работать медленнее, «любопытствуя»).

Для чего это можно использовать? Facebook очень хорошо разбирается в технологиях компьютерного зрения, это видно и по возможностям работы с камерой и с изображениями в самой социальной сети, и по приложениям вроде Portal. Изучение окружающей среды имеет решающее значение для приложений, которым для функционирования требуется контекст (информация о том, что они видят или ощущают).

Видеокамеры, работающие в приложениях типа Portal, постоянно анализируют изображения, чтобы получать полезную информацию. Когда в кадре появляется лицо, оно дает сигнал для запуска десятков новых алгоритмов. Если пользователь держит некий объект, написан ли на нем какой-то текст? Нужно ли его переводить? Есть ли QR-код? А что происходит за спиной у пользователя? Если пользователь применяет AR-эффекты или фильтры, где заканчивается граница его лица или волос и начинаются дереьвя, что стоят позади?

Если камера, гаджет или робот будут выполнять все эти задачи ровно «тогда, когда нужно», это приведет к всплеску активности процессора, даст видимую задержку изображения и другие сбои, которые не нужны ни пользователю, ни системному инженеру. Но выполнять подобные задачи непрерывно тоже плохо. А вот если агент ИИ проявляет «любопытство» и проверяет что-либо только когда чувствует большую неопределенность, получается золотая середина. Это всего лишь один из способов использования «любопытства», но, учитывая приоритеты Facebook, он кажется важным.


Смотреть с помощью касания

Хотя зрение важно, это не единственный способ, посредством которого мы или роботы воспринимаем мир. Многие роботы оснащены датчиками движения, звука и т.п., но реальная технология прикосновения встречается относительно редко. Можно списать это на отсутствие хороших тактильных интерфейсов (хотя мы и движемся в этом направлении). Тем не менее инженеры из Facebook хотели изучить возможность использования тактильных данных в качестве «суррогата» для визуальных данных.

Если задуматься, то это нормально — люди с нарушениями зрения используют прикосновения для навигации по окружающей среде или для получения представления об объектах. Они не совсем «видят» через прикосновение, но это работает похожим на зрение образом. Исследователи из Facebook использовали модель ИИ, которая решает, какие действия предпринять, основываясь на видео. Но вместо реальных видеоданных ученые «скормили» ей сенсорные данные высокого разрешения.

Оказывается, алгоритму на самом деле не важно, смотрит ли он на картинку мира так, как мы бы ее увидели, или нет — если данные представлены визуально (например, это карта давления, которая представлена на тактильном датчике), они могут быть проанализированы так же, как фотография.

Для чего это можно использовать? Сомнительно, что в Facebook хотели создать технологию, которая поможет трогать пользователей. Но это не только про касания — это о том, как можно применять это в обучении.

Мы можем различить два объекта с закрытыми глазами с помощью касания. Почему для нас это возможно? Потому что когда мы видим что-то, мы не просто понимаем, как это выглядит, мы разрабатываем внутреннюю модель, составленную из целого набора чувственных данных.

Точно так же агенту ИИ может понадобиться перенести свой процесс обучения из одного домена в другой — аудиоданные могут указывать датчику захвата, насколько трудно удерживать какой-то объект, или визуальные данные, по которым микрофон может определить, как разделять голоса. Реальный мир — сложное место, данные в нем смешаны, но они объемные. Возможность использовать эти данные независимо от их типа важна для того, чтобы точно понимать реальность и взаимодействовать с ней.

Хотя это исследование и интересно само по себе и может быть действительно объяснено на простых примерах выше, важно также осознавать контекст, в котором оно происходит. В блоге, описывающем исследование, делается вывод:

«Мы сосредоточены на робототехнике, которая не только приведет к появлению более способных роботов, но и расширит границы искусственного интеллекта в последующие годы и десятилетия. Если мы хотим приблизиться к машинам, которые могут мыслить, планировать и рассуждать так, как это делают люди, то нам нужно создавать системы искусственного интеллекта, которые могут учиться самостоятельно, используя разнообразные сценарии, и делать это в том числе за пределами цифрового мира».

Поскольку Facebook постоянно работает над расширением своего влияния за пределами соцсетей, его технологии ИИ должны становиться все больше изощренными. Конечно, в ближайшем будущем вы не увидите «робота Facebook»… конечно, если не считаете таковым штуку, которая сейчас лежит у вас в кармане.

Другие хорошие статьи