ИИ научился описывать предметы и сопоставлять их характеристики - МИКРОН-ДИЛЕР-СЕРВИС

САНКТ-ПЕТЕРБУРГ:

тел.: +7(812) 701-02-32 факс: +7(812) 701-02-82 email: [email protected], [email protected] адрес: ул. Курчатова д.10, лит. М

ИЖЕВСК:

тел.: +7(3412) 467-100 факс: +7(3412) 933-163 email: [email protected], [email protected] адрес: ул. Автозаводская, д. 7
Курс валют ЦБРФ: 62.8083 RUB. 1 USD | 71.3816 RUB. 1 EUR на: 27.06.2019
{"effect":"slide-v","fontstyle":"normal","autoplay":"true","timer":"4000"}

ЭЛЕКТРОННЫЕ

КОМПОНЕНТЫ

ДЛЯ ВАШЕГО УСПЕХА

ПОСТАВЩИК ЭКБ РЕГИСТР ИСО 9001 ПОСТАВЩИК ЭКБ ВВТ

МИКРОН-ДИЛЕР-СЕРВИС

ISO 9001

ПОСТАВКА ЭЛЕКТРОННЫХ КОМПОНЕНТОВ

С ПРИЁМКОЙ ОТК,ВП,ОС,ОСМ

РАБОТАЕМ СОГЛАСНО

275-ФЗ*, 44-ФЗ и 223-ФЗ

*с изменениями согласно 159-ФЗ

ИИ научился описывать предметы и сопоставлять их характеристики

Ребенок, который никогда не видел розового слона, может описать его, в отличие от компьютера. «Компьютер учится на данных», – говорит Цзяцзюнь Ву, доктор философии. студент в Массачусетском технологическом университете. «Способность обобщать и распознавать то, что вы никогда не видели раньше, как тот же розовый слон, – очень трудна для машин».

ИИ научился описывать предметы и сопоставлять их характеристики

Исследователи обучили гибридную модель искусственного интеллекта, отвечать на вопросы типа «Имеет ли красный объект слева от зеленого куба ту же форму, что и фиолетовая матовая вещь?», Предоставляя ей примеры цветов и форм объектов, за которыми следуют более сложные сценарии, включающие сравнения нескольких объектов. Подобную модель обучения можно перенести в новые сценарии, а также использовать для улучшения существующих, используя часть обучающих данных.

Системы глубокого обучения интерпретируют мир, выбирая статистические закономерности в данных. Эта форма машинного обучения теперь везде, автоматически помечает друзей на Facebook, рассказывает о последнем прогнозе погоды в Alexa и предоставляет интересные факты с помощью поиска Google. Но статистическое обучение имеет свои пределы. ИИ требует тонны данных, не может объяснить свои решения и ужасно применяет прошлые знания в новых ситуациях. Он не может понять, как слон может быть розовым вместо серого.

Чтобы дать компьютерам возможность рассуждать так же, как мы, исследователи искусственного интеллекта (ИИ) возвращаются к абстрактному или символическому программированию. Популярный в 1950-х и 1960-х годах символический ИИ связывает правила и логику, которые позволяют машинам сравнивать и интерпретировать отношения объектов и сущностей. Символьный ИИ использует меньше данных, записывает цепочку шагов, необходимых для принятия решения, и в сочетании с огромной вычислительной мощью статистических нейронных сетей он может даже побить людей в сложном тесте на понимание изображений.

Новое исследование, проведенное группой исследователей из MIT, MIT-IBM Watson AI Lab и DeepMind, показывает перспективу объединения статистического и символического ИИ. Команда во главе с Ву и Джошуа Тененбаумом, профессором факультета мозга и когнитивных наук Массачусетского технологического института(MIT) и Лаборатории информатики и искусственного интеллекта, показывает, что ее гибридная модель может изучать связанные с объектами понятия, такие как цвет и форма, и использовать эти знания для интерпретации сложных объектных связей в сцене. Благодаря минимальным обучающим данным и отсутствию явного программирования их модель может переносить концепции в большие сцены и отвечать на все более сложные вопросы, чем его современные коллеги. Команда представит свои результаты на Международной конференции по обучению представлениям в мае.

«Один из способов обучения представлениям – это соединение слов с изображениями», – говорит ведущий автор исследования Цзяюань Мао, студент Университета Цинхуа, который работал над проектом в качестве приглашенного сотрудника в MIT. «Машина, которая может учиться таким же образом, нуждается в гораздо меньшем количестве данных и лучше переносит свои знания в новые сценарии».

По словам Джейкоба Андреаса, недавнего выпускника Калифорнийского университета в Беркли, который этой осенью начал работать в MIT в качестве доцента и не принимал участия в работе – “это серьезный аргумент для возвращения к подходам абстрактных программ”. «Хитрость, оказывается, заключается в том, чтобы добавить больше символической структуры и дать нейронным сетям представление о мире, который разделен на объекты и свойства, а не в виде необработанных изображений», – говорит он. «Эта работа дает нам понимание того, что машины должны понимать, прежде чем изучение языка станет возможным».

Команда обучала свою модель на изображениях в сочетании со связанными вопросами и ответами, частью теста на понимание изображений CLEVR, разработанного в Стэнфордском университете. Когда модель учится, вопросы постепенно усложняются, начиная с – «Какого цвета объект?», и заканчивая – “Сколько объектов находятся справа от зеленого цилиндра и имеют тот же материал, что и маленький синий шарик?” Как только объектный уровень концептов освоен, модель переходит к изучению того, как связать объекты и их свойства друг с другом.

Как и другие гибридные модели искусственного интеллекта, модель сотрудников MIT работает, разделяя задачу. Модуль восприятия нейронных сетей разбивает пиксели на каждом изображении и отображает объекты. Языковой модуль, также из нейронных сетей, извлекает значение из слов в каждом предложении и создает символические программы или инструкции, которые сообщают машине, как ответить на вопрос. Третий модуль рассуждения запускает символические программы на сцене и дает ответ, обновляя модель, когда она допускает ошибки.

Ключом к подходу команды является модуль восприятия, который переводит изображение в объектное представление, облегчая выполнение программ. Также уникальным является то, что они называют изучением учебных программ, или выборочное обучение модели на концепциях и сценах, которые становятся все сложнее и сложнее. Оказывается, что подача машинных данных логичным способом, а не случайным образом, помогает модели учиться быстрее при одновременном повышении точности.

Как только модель имеет прочную основу, она может почти идеально интерпретировать новые сцены и концепции, а также все более сложные вопросы. Отвечая на незнакомый вопрос типа “Какова форма большой желтой вещи?”, он опередил своих коллег в Стэнфорде и близлежащей лаборатории MIT Lincoln Laboratory с небольшим количеством данных.

В то время как другие модели прошли обучение по полному набору данных CLEVR из 70000 изображений и 700000 вопросов, модель MIT-IBM использовала 5000 изображений и 100000 вопросов. Поскольку модель построена на ранее изученных концепциях, она вобрала в себя программы, лежащие в основе каждого вопроса, ускоряя процесс обучения.

Хотя статистические модели глубокого обучения в настоящее время внедрены в повседневную жизнь, большая часть их процесса принятия решений остается скрытой от глаз. Такое отсутствие прозрачности затрудняет прогнозирование того, где система подвержена манипуляциям, ошибкам или отклонениям. Добавление символического слоя может открыть черный ящик, объясняя растущий интерес к гибридным системам искусственного интеллекта.

«Разделение задачи и предоставление программам возможности выполнять часть работы – ключ к построению интерпретируемости в модели глубокого обучения», – говорит исследователь лаборатории Линкольна Дэвид Машарка, чья гибридная модель, Transparency by Design Network, была оценена в исследовании MIT-IBM.

В настоящее время команда MIT-IBM работает над улучшением производительности модели на реальных фотографиях и распространением ее на понимание видео и роботизированные манипуляции. Другими авторами исследования являются Чуан Ган и Пушмит Кохли, исследователи из MIT-IBM Watson AI Lab и DeepMind соответственно.

ПОДЕЛИТЬСЯ:
  •  
  • 1
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
    1
    Share

Вступайте в группу ВКОНТАКТЕ

Виртуальный помощник Эмдис
ВВЕРХ