Понять эмоции друг друга: сможет ли компьютер прочитать язык тела?

Понять эмоции друг друга: сможет ли компьютер прочитать язык тела?

Общеизвестно, что люди наделены способностью «читать» язык тела своего собеседника для понимания его эмоционального состояния. Команда исследователей из Пенсильванского университета изучает возможность обучения  этому навыку…. компьютера.

Ученых заинтересовало: могут ли современные методы компьютерного зрения соответствовать когнитивным способностям человека распознавать экспрессию тела в реальном мире. Исследователи считают, что эта возможность может стать базой для множества инновационных приложений в таких областях, как управление и поиск информации, общественная безопасность, уход за пациентами и социальные сети.

«Компьютеры и роботы в будущем будут взаимодействовать с большим количеством людей. Современные компьютеры в значительной степени просто следуют приказам. В будущем роботы и компьютеры будут больше походить на партнеров и работать вместе. Для этого им нужно будет понимать эмоции друг друга», – подчеркнул член исследовательской группы Джеймс Ван (James Wang), профессор Колледжа информационных наук и технологий (IST).

Кандидат в докторантуру колледжа IST Ю Ло (Yu Luo) обработал большое количество видеоклипов и создал набор данных из более чем 13 тысяч человеческих персонажей с почти десятью тысячами движений тела. Исследования показали, что в распознавании эмоций человеческое тело может быть более четким, чем лицо.

Исследователи  использовали методы компьютерного зрения, чтобы найти и отследить каждого человека в разных кадрах, отметив каждого из них в клипе уникальным идентификационным номером. Затем ученые  использовали краудсорсинг аннотаторы для просмотра видеоклипов и выявления эмоций каждого человека, представленных в одной из 25 категориальных эмоций: мир, привязанность, уважение, ожидание, участие, уверенность, счастье, удовольствие, волнение, удивление, сочувствие, растерянность, усталость, смущение, тоска, неодобрение, отвращение, раздражение, гнев, чувствительность, грусть, беспокойство, страх, боль и страдание. Эмоции также были распределены в трех измерениях: валентности, возбуждении и доминировании.

«Мы обнаружили, что интерпретация эмоций на основе языка тела является сложной. Есть много тонкостей, которые  пытаемся понять. Даже для людей существует множество несоответствий. Люди не соглашаются друг с другом, когда дело доходит до интерпретации. Вы можете думать, что человек счастлив. Я могу думать, что он взволнован. Возможно, мы оба правы. Зачастую истина не очевидна, что делает моделирование на основе данных очень сложным», – отметил Ван.

После того, как исследователи создали набор данных и применили воспринимаемые человеком эмоциональные аннотации для каждого, они использовали современные статистические методы для проверки механизмов контроля качества и тщательно проанализировали уровень консенсуса их проверенных меток данных. Кроме того,  создали автоматизированные системы распознавания эмоций из человеческих скелетов и последовательностей изображений. В частности, методы глубокого обучения и созданные вручную особенности, основанные на анализе движений Лабана, продемонстрировали эффективность этой задачи.

Ученые установили, что компьютерная модель может идентифицировать возбуждение с высокой точностью. Тем не менее, исследователи также обнаружили, что люди лучше, чем компьютеры, идентифицируют валентность – насколько отрицательной или положительной является эмоция.

«Входной барьер для этого направления исследований довольно высок. Вы должны использовать знания из психологии, разрабатывать и интегрировать методы науки о данных, использовать статистическое моделирование для правильного сбора эффективных данных. Это показывает, что мы находимся на границе науки и техники в этом важном сегменте»,- подчеркнул Ван.

Оставьте свой комментарий