Вірусний тренд, у якому люди повторюють одну й ту саму фразу з різними інтонаціями, може несподівано принести користь великим технологічним компаніям. Експерти вважають, що такі ролики можуть допомогти навчати системи штучного інтелекту краще розпізнавати людські емоції.
Тренд, у якому користувачі вимовляють одну й ту саму фразу з різними інтонаціями, швидко набрав популярність у соціальних мережах. Одні й ті самі слова можуть звучати доброзичливо, саркастично, роздратовано або агресивно залежно від емоційної подачі.
Експерти вважають, що такі відео можуть допомогти у навчанні систем розпізнавання емоцій. Для моделей штучного інтелекту це можливість краще зрозуміти різницю між змістом сказаного та способом, у який це було сказано.
Водночас дослідники зазначають, що подібні дані мають обмеження. Через гумористичний формат і перебільшені емоції такі ролики не завжди відображають реальну поведінку людей, тому їхня цінність для навчання ШІ залишається відносною.
Учасники тренду вимовляють одну й ту саму коротку фразу з різними емоціями: від підтримки та захоплення до сарказму, роздратування чи гніву. Саме контраст між словами та інтонацією зробив цей формат популярним і привернув увагу мільйонів користувачів.
Однак, як зазначає фахівчиня з цифрової етики та генеральна директорка North Star Strategies Клара Фулкс, за цією розвагою може ховатися й практична цінність для технологічних компаній.
«Це стає вірусним, тому що великим технологічним компаніям потрібні дані для навчання моделей розпізнавання емоцій».
За словами Фулкс, подібний контент можна розглядати як своєрідну перемогу для компаній, які розробляють або продають технології емоційного аналізу.
Засновниця та генеральна директорка компанії Tinkogroup Ольга Кохан пояснює, що тренд демонструє одну з найбільших складностей у сфері розпізнавання емоцій. Одні й ті самі слова можуть нести зовсім різний зміст залежно від тону голосу, темпу мовлення, акценту та контексту.
«Тисячі користувачів, які вимовляють одну й ту саму фразу з різними емоційними відтінками, фактично створюють набір даних, який допомагає системам ШІ розрізняти не лише те, що сказано, а й те, як саме це сказано».
Такі матеріали можуть використовуватися для вдосконалення систем аналізу мовлення, оцінки настроїв, сервісів підтримки клієнтів та інструментів доступності. Наприклад, уже сьогодні деякі рішення на базі ШІ для кол-центрів аналізують емоційний стан клієнта та пропонують оператору найбільш доречні варіанти відповіді. Втім, Кохан та інші експерти наголошують, що дані з подібних трендів мають серйозні обмеження. Контент у соцмережах часто створюється заради гумору, переглядів або вірусності, тому не завжди відображає реальні життєві ситуації.
Доцент Коледжу штучного інтелекту, кібербезпеки та обчислювальних технологій Bellini Джон Лікато зазначає, що люди в межах вірусних трендів часто навмисно перебільшують свої емоції.
«Це не завжди найкращі дані для навчання моделей».
Лікато також зазначає, що сучасні великі мовні моделі вже непогано визначають базові категорії емоцій, але все ще суттєво поступаються людині у розумінні складних емоційних станів.
«Коли ми намагаємося використовувати їх для більш детального аналізу емоцій, результати стають значно менш точними. Людські емоції надзвичайно складні та можуть сильно відрізнятися від людини до людини».
Кохан додає, що на емоції впливають культура, особистий досвід, ситуація та контекст. Через це навіть сучасні моделі можуть помилятися при розпізнаванні сарказму, змішаних почуттів або тонких емоційних реакцій.
Попри обмеження технології, експерти вже бачать ризики її використання. У дослідженні британського Institute for the Future of Work за 2025 рік зазначається, що емоційний ШІ поступово зміщує фокус спостереження з дій людини на її внутрішній стан. Зокрема, роботодавці можуть використовувати такі системи для оцінки залученості, настрою або лояльності співробітників.
«З часом такий тип спостереження може змушувати людей демонструвати емоції, яких очікує система: посміхатися, коли цього не хочеться, приховувати роздратування або змінювати вираз обличчя, щоб уникнути попереджень».
Тренд із повторенням однакових фраз далеко не перший приклад того, як контент користувачів може використовуватися для навчання моделей штучного інтелекту. Наприкінці 2025 року популярності набув тренд «Обійми своє молодше я», де користувачі за допомогою ШІ створювали зображення себе поруч із дитячою версією.
Тоді експерти попереджали, що учасники фактично передають біометричні дані, які можуть використовуватися для створення діпфейків або навчання алгоритмів розпізнавання облич. Схожі застереження стосувалися й тренду «Знову 2016 рік», коли користувачі масово публікували свої старі фотографії. Засновник консалтингової компанії Steele Fortress LLC Джонатан Дрейк Стіл назвав такі флешмоби «золотою жилою даних» для розробників ШІ.
За його словами, для навчання систем розпізнавання облич особливо цінними є фотографії однієї людини, зроблені в різні роки. Зазвичай отримання таких наборів даних коштує дорого, але соціальні мережі фактично надають їх безкоштовно.