Автор: Дарья Колмина
"Питерские заметки", 08.11.2023:
Депрессия – острая проблема, затрагивающая более 264 миллионов людей по всему миру, согласно данным Всемирной организации здравоохранения (ВОЗ). Но раннее выявление этого состояния представляет серьезные трудности.
С развитием социальных медиа, количество видеороликов также растет, предоставляя возможность использовать аудио- и видеоданные для более эффективной и своевременной идентификации людей с депрессией.
Ученые факультета прикладного искусственного интеллекта Университета Сонгюнгван Сеул, Корея разработали инновационную модель выявления депрессии, которая использует аудиовизуальные функции из видеоблогов YouTube.
Исследование проводилось на основе видеоблогов, опубликованных с 2010 по 2021 год. Ученые использовали ключевые слова, предоставленные профессионалами в области психического здоровья, чтобы отделить контент, связанный с депрессией, от обычных видеоблогов. Затем было проанализировано 12000 видеороликов на английском языке с помощью инструмента YouTube-dl.
Пять аннотаторов классифицировали видеоролики как демонстрирующие признаки депрессии или нет, достигнув значительного согласия. Извлеченные аудио- и визуальные особенности использовались для создания модели выявления депрессии с помощью алгоритма XGBoost, который превзошел другие методы машинного обучения.
Анализ аудио показал, что видеоблоги, связанные с депрессией, имели более низкую громкость и основную частоту (F0). Это также указывает на более шумный голосовой сигнал и более высокий уровень тревожности.
На уровне визуальных особенностей, видеоблоги о депрессии отражали более низкий уровень счастья и более высокие уровни грусти и тревоги в выражениях лица, что соответствует обычному эмоциональному профилю депрессии.
Дополнительный анализ по гендерным особенностям показал, что модели, адаптированные для женских видеоблогеров, превосходят модели для мужских видеоблогеров, что свидетельствует о том, что гендер может влиять на проявление депрессии в речи и выражении лица. Это открывает потенциал гендерно-специфичных моделей ИИ для повышения точности обнаружения депрессии.
С развитием социальных медиа, количество видеороликов также растет, предоставляя возможность использовать аудио- и видеоданные для более эффективной и своевременной идентификации людей с депрессией.
Ученые факультета прикладного искусственного интеллекта Университета Сонгюнгван Сеул, Корея разработали инновационную модель выявления депрессии, которая использует аудиовизуальные функции из видеоблогов YouTube.
Исследование проводилось на основе видеоблогов, опубликованных с 2010 по 2021 год. Ученые использовали ключевые слова, предоставленные профессионалами в области психического здоровья, чтобы отделить контент, связанный с депрессией, от обычных видеоблогов. Затем было проанализировано 12000 видеороликов на английском языке с помощью инструмента YouTube-dl.
Пять аннотаторов классифицировали видеоролики как демонстрирующие признаки депрессии или нет, достигнув значительного согласия. Извлеченные аудио- и визуальные особенности использовались для создания модели выявления депрессии с помощью алгоритма XGBoost, который превзошел другие методы машинного обучения.
Анализ аудио показал, что видеоблоги, связанные с депрессией, имели более низкую громкость и основную частоту (F0). Это также указывает на более шумный голосовой сигнал и более высокий уровень тревожности.
На уровне визуальных особенностей, видеоблоги о депрессии отражали более низкий уровень счастья и более высокие уровни грусти и тревоги в выражениях лица, что соответствует обычному эмоциональному профилю депрессии.
Дополнительный анализ по гендерным особенностям показал, что модели, адаптированные для женских видеоблогеров, превосходят модели для мужских видеоблогеров, что свидетельствует о том, что гендер может влиять на проявление депрессии в речи и выражении лица. Это открывает потенциал гендерно-специфичных моделей ИИ для повышения точности обнаружения депрессии.