У статті розглядаються базові підходи, робота генератора та дискримінатора, а також виклики, пов’язані з виявленням таких методів. Це корисний матеріал для дослідників у галузі кібербезпеки, ІТ-фахівців і всіх, хто цікавиться майбутнім штучного інтелекту у сфері приховування інформації.
Стеганографія визначається як наука про приховану передачу даних, де головна мета полягає у маскуванні самого факту обміну інформацією. Сам термін походить від грецьких слів στεγανός – «прихований» і γράφω – «пишу», що дослівно перекладається як «таємне письмо». У сучасному розвитку цієї дисципліни дедалі важливішу роль відіграють технології машинного навчання, зокрема генеративно-змагальні мережі (GAN), які відкривають нові підходи до приховування повідомлень.
Класична стеганографія здавна служила засобом таємного спілкування – прикладами можуть бути невидиме чорнило чи приховані повідомлення у поезії. У сучасних умовах цю роль виконують електронні комунікації та цифрові технології. Будь-яка сучасна стегосистема складається з двох ключових елементів: алгоритмів вбудовування та вилучення. Алгоритм вбудовування отримує на вхід секретне повідомлення, ключ і контейнер, у який буде інтегровано дані. Результатом стає стегоповідомлення.
Прихованим повідомленням може бути будь-який тип інформації – текст, графіка, звук тощо. Для кожного формату існують власні методи приховування. Наприклад, у текстовій стеганографії застосовуються правила, що стосуються позиції та кількості символів, непомітні для звичайного читача. Один із методів полягає у форматуванні: розширенні проміжків між словами, де один пробіл позначає біт «0», а подвійний – біт «1». У мережевій стеганографії приховані дані можуть передаватися через комп’ютерні мережі, використовуючи особливості протоколів. Типові підходи передбачають модифікацію властивостей окремих мережевих пакетів.
У межах цього розгляду увага зосереджується на стеганографії зображень. У цій сфері виділяють три фундаментальні архітектури, що визначають способи отримання стегозображень.
В основному існує два типи підходів до стеганографії шляхом модифікації. Перший тип пов’язаний з підтримкою статистичної моделі, а другий – реалізує вбудовування в результаті мінімізації конкретної функції спотворення.
Селекція зображення передбачає вибір відповідного контейнера для приховування інформації та базується на двох основних підходах. Перший полягає у виборі зображення-кандидата для подальшої модифікації. У цьому випадку спочатку визначається контейнер із бази даних, після чого в нього вбудовується повідомлення. Попри те, що методи цього класу відносяться до категорії «вибору зображення», фактично вони є модифікацією з додатковим етапом, і тому не розглядаються як самостійний напрям.
Другий підхід – це використання контейнера як готового стегозображення без будь-яких змін. У такому випадку ключовим завданням стає визначення чітких правил відповідності між переданим повідомленням і обраним стегозображенням.
Третій підхід у стеганографії пов’язаний із синтезом зображень. Оскільки створення реалістичних графічних об’єктів є складним завданням, класичні методи реалізовували цю стратегію шляхом генерування «неприродних» зображень. До таких прикладів належать штучно створені текстури або зображення, що імітують відбитки пальців.
Генеративно-змагальна мережа (Generative adversarial network, скорочено GAN) – алгоритм машинного навчання без вчителя, побудований на комбінації з двох нейронних мереж. 2014 року її вперше представили Google. У системі GAN одна із мереж генерує зразки, а інша намагається відрізнити «справжні» зразки від неправильних.
Генеративна мережа, використовуючи набір змінних латентного простору, завжди намагається зліпити новий зразок, змішавши кілька вихідних зразків. Дискримінаційна мережа D навчається розрізняти справжні та підроблені зразки. При цьому її результати подаються на вхід генеративної мережі G так, щоб вона змогла підібрати найкращий набір латентних параметрів і дискримінативна мережа вже не змогла б відрізнити справжні зразки від підроблених. Як бачимо, метою мережі G є підвищити відсоток помилок мережі D, а метою мережі D є, навпаки, покращення точності розпізнавання.
GAN знайшли чудове застосування у комп’ютерному зорі та в обробці природної мови (у генерації зображень та текстів). Але при цьому й стеганографію не оминули.
Можливості GAN можна розглядати з різних боків: гра, генератор або функція відображення. Вони узгоджуються з класифікацією основних стратегій у стеганографії, тобто модифікації, синтезу та селекції.
GAN-підходи будуються на «грі» між стеганографом і стеганалізатором. Виділяють три ключові стратегії:
Створення стегозображення – генератор формує зображення, яке містить приховане повідомлення і водночас важко виявляється. У схемі використовується три мережі: генератор G, дискримінатор D і класифікатор S.
Ймовірнісна матриця модифікацій – прикладом є ASDL-GAN, що мінімізує функцію спотворення і визначає ймовірність зміни кожного пікселя.
Змагальна гра – метод ADV-EMB, де зображення змінюється так, щоб заплутати аналізатор. Частина пікселів використовується для приховування даних, інша – для створення перешкод.
Тут GAN встановлює відповідність між повідомленням і вже готовим зображенням. Контейнер сам перетворюється на стегозображення без прямої модифікації, тому класичний статистичний аналіз майже не працює.
Застосовується заздалегідь навчений генератор, який створює нові зображення. Один із підходів – навчання з учителем, де роль Аліси, Боба та Єви виконують нейронні мережі, відтворюючи процес обміну повідомленнями та їх приховування.
У цьому підході повідомлення не вбудовується безпосередньо в існуюче зображення, а перетворюється на вектор шуму, який подається генератору. Генератор попередньо навчається на великій вибірці, після чого здатен створювати реалістичні зображення. На наступному етапі використовується екстрактор, який спеціально навчається відновлювати повідомлення з уже синтезованих стегозображень. Таким чином, з’являється додатковий рівень захисту: замість внесення змін у вже готові картинки створюється абсолютно нове зображення, у яке «зашито» повідомлення. Це робить виявлення прихованого каналу значно складнішим.
Метод заснований на водно-градієнтних GAN (Wasserstein GAN with Gradient Penalty), які славляться стабільністю навчання та якістю синтезованих даних. У цьому випадку одночасно навчаються генератор і екстрактор повідомлень. Вони працюють у форматі змагальної гри: генератор прагне створювати максимально реалістичні стегозображення, а екстрактор навчається витягувати приховані повідомлення, незважаючи на складність умов. Додатково підключається дискримінатор, що контролює правдоподібність отриманих зображень. У результаті досягається баланс між якістю картинки й точністю передачі даних, що дозволяє підвищити приховану пропускну здатність каналу.
ACGAN (Auxiliary Classifier GAN) модифікує класичну GAN, додаючи допоміжний класифікатор. Ідея полягає в тому, щоб не лише створювати реалістичні зображення, але й навчати систему встановлювати зв’язок між класовими мітками і секретною інформацією. Генератор отримує на вхід не тільки шум, але й відповідну мітку класу, що дозволяє вбудовувати повідомлення безпосередньо в логіку побудови картинки. Дискримінатор, крім визначення автентичності зображення, виконує додаткове завдання – відновлює частини прихованого повідомлення. Такий підхід підвищує точність відтворення даних і робить систему більш керованою.
Цей метод зосереджений на мінімізації змін між вихідним зображенням і створеним стегозображенням. По суті, приховування повідомлення перетворюється на задачу пошуку найбільш придатного контейнера. Система генерує велику кількість кандидатів, після чого обирає той варіант, у якому вбудоване повідомлення змінює початкове зображення найменше. Таким чином, зменшується ймовірність виявлення прихованого каналу, оскільки відмінності статистично близькі до шуму, який є природним для будь-якого цифрового файлу.
У цьому підході використовується відома модель CycleGAN, розроблена для трансформацій «image-to-image» без парних прикладів. Вона навчається перетворювати зображення з одного класу (X) у зображення іншого класу (Y), зберігаючи узгодженість зворотного перетворення (циклічність). У контексті стеганографії це дозволяє розглядати трансформацію як процес кодування повідомлення. Наприклад, звичайне зображення може перетворюватися у стилізоване або модифіковане, але водночас у ньому приховано додаткові дані. Цей підхід відзначається високою гнучкістю і складністю для стеганалізу, оскільки зображення виглядає правдоподібним і відповідає природним закономірностям цільового класу.
Методи на основі GAN сьогодні розглядаються як найбільш перспективний напрям розвитку стеганографії. Вони дають змогу створювати стегозображення, майже невідмінні від реальних, проте мають низку обмежень і відкритих питань. Подальший розвиток цієї технології зосереджується на трьох головних напрямах:
Сучасні реалізації на кшталт GAN-CSY стикаються з проблемою нестабільності пікселів, що призводить до низької точності вилучення повідомлень. У багатьох випадках дані не зберігаються в класичному вигляді, а перетворюються на атрибути категорії чи вектори шуму. Це обмежує обсяг інформації, яку реально можна приховати.
У майбутньому важливим напрямом стане:
стабілізація генерації зображень;
розробка механізмів підвищення пропускної здатності каналів;
пошук балансів між якістю зображення та кількістю даних, що передаються.
Проблемою залишається відсутність об’єктивних метрик. Зараз активно застосовуються IS (Inception Score) та FID (Frechet Inception Distance), які вимірюють правдоподібність і якість. Але цих показників недостатньо, адже вони не враховують приховане навантаження і специфіку стегозображень.
У перспективі слід очікувати:
створення нових метрик, які поєднуватимуть оцінку якості зображення з надійністю передачі повідомлення;
застосування комбінованих підходів – автоматизованих і з елементами людської експертизи;
розробку стандартизованих інструментів оцінки для наукових і прикладних досліджень.
Сьогодні GAN здатні створювати зображення, невідмінні для людського ока. У класичній стеганографії застосовуються численні методи аналізу, що дозволяють виявляти приховані зміни, але зі зростанням потужності генеративних моделей ці методи стають дедалі менш ефективними.
Подальші дослідження спрямовані на:
розвиток інструментів, здатних розрізняти реальні та синтетичні зображення;
удосконалення систем розпізнавання прихованих повідомлень у згенерованих контейнерах;
поєднання класичного стеганалізу з глибинними нейромережами для підвищення точності.
Майбутнє стеганографії на основі GAN пов’язане з вирішенням трьох великих задач: підвищення місткості, розробка нових метрик оцінки та посилення стеганалізу. Баланс між можливостями приховування та здатністю виявляти приховані дані визначатиме розвиток всієї галузі у найближчі роки.