Генеративні змагальні мережі й стеганографія

03.10.2025 (Оновлено 19.05.2026) 1 хвилин Автор: Lady Liberty

У статті розглядаються базові підходи, робота генератора та дискримінатора, а також виклики, пов’язані з виявленням таких методів. Це корисний матеріал для дослідників у галузі кібербезпеки, ІТ-фахівців і всіх, хто цікавиться майбутнім штучного інтелекту у сфері приховування інформації.

Як GAN змінюють приховування даних

Стеганографія визначається як наука про приховану передачу даних, де головна мета полягає у маскуванні самого факту обміну інформацією. Сам термін походить від грецьких слів στεγανός – «прихований» і γράφω – «пишу», що дослівно перекладається як «таємне письмо». У сучасному розвитку цієї дисципліни дедалі важливішу роль відіграють технології машинного навчання, зокрема генеративно-змагальні мережі (GAN), які відкривають нові підходи до приховування повідомлень.

Традиційна стеганографія для чайників

Класична стеганографія здавна служила засобом таємного спілкування – прикладами можуть бути невидиме чорнило чи приховані повідомлення у поезії. У сучасних умовах цю роль виконують електронні комунікації та цифрові технології. Будь-яка сучасна стегосистема складається з двох ключових елементів: алгоритмів вбудовування та вилучення. Алгоритм вбудовування отримує на вхід секретне повідомлення, ключ і контейнер, у який буде інтегровано дані. Результатом стає стегоповідомлення.

Прихованим повідомленням може бути будь-який тип інформації – текст, графіка, звук тощо. Для кожного формату існують власні методи приховування. Наприклад, у текстовій стеганографії застосовуються правила, що стосуються позиції та кількості символів, непомітні для звичайного читача. Один із методів полягає у форматуванні: розширенні проміжків між словами, де один пробіл позначає біт «0», а подвійний – біт «1». У мережевій стеганографії приховані дані можуть передаватися через комп’ютерні мережі, використовуючи особливості протоколів. Типові підходи передбачають модифікацію властивостей окремих мережевих пакетів.

У межах цього розгляду увага зосереджується на стеганографії зображень. У цій сфері виділяють три фундаментальні архітектури, що визначають способи отримання стегозображень.

1) Модифікація зображення

В основному існує два типи підходів до стеганографії шляхом модифікації. Перший тип пов’язаний з підтримкою статистичної моделі, а другий – реалізує вбудовування в результаті мінімізації конкретної функції спотворення.

2) Селекція зображення

Селекція зображення передбачає вибір відповідного контейнера для приховування інформації та базується на двох основних підходах. Перший полягає у виборі зображення-кандидата для подальшої модифікації. У цьому випадку спочатку визначається контейнер із бази даних, після чого в нього вбудовується повідомлення. Попри те, що методи цього класу відносяться до категорії «вибору зображення», фактично вони є модифікацією з додатковим етапом, і тому не розглядаються як самостійний напрям.

Другий підхід – це використання контейнера як готового стегозображення без будь-яких змін. У такому випадку ключовим завданням стає визначення чітких правил відповідності між переданим повідомленням і обраним стегозображенням.

3) Синтезування зображення

Третій підхід у стеганографії пов’язаний із синтезом зображень. Оскільки створення реалістичних графічних об’єктів є складним завданням, класичні методи реалізовували цю стратегію шляхом генерування «неприродних» зображень. До таких прикладів належать штучно створені текстури або зображення, що імітують відбитки пальців.

Що таке GAN та з чим їх їдять?

Генеративно-змагальна мережа (Generative adversarial network, скорочено GAN) – алгоритм машинного навчання без вчителя, побудований на комбінації з двох нейронних мереж. 2014 року її вперше представили Google. У системі GAN одна із мереж генерує зразки, а інша намагається відрізнити «справжні» зразки від неправильних.

Генеративна мережа, використовуючи набір змінних латентного простору, завжди намагається зліпити новий зразок, змішавши кілька вихідних зразків. Дискримінаційна мережа D навчається розрізняти справжні та підроблені зразки. При цьому її результати подаються на вхід генеративної мережі G так, щоб вона змогла підібрати найкращий набір латентних параметрів і дискримінативна мережа вже не змогла б відрізнити справжні зразки від підроблених. Як бачимо, метою мережі G є підвищити відсоток помилок мережі D, а метою мережі D є, навпаки, покращення точності розпізнавання.

GAN знайшли чудове застосування у комп’ютерному зорі та в обробці природної мови (у генерації зображень та текстів). Але при цьому й стеганографію не оминули.

То як застосовуються GAN?

Можливості GAN можна розглядати з різних боків: гра, генератор або функція відображення. Вони узгоджуються з класифікацією основних стратегій у стеганографії, тобто модифікації, синтезу та селекції.

1) Модифікація зображення

GAN-підходи будуються на «грі» між стеганографом і стеганалізатором. Виділяють три ключові стратегії:

Створення стегозображення – генератор формує зображення, яке містить приховане повідомлення і водночас важко виявляється. У схемі використовується три мережі: генератор G, дискримінатор D і класифікатор S.
Ймовірнісна матриця модифікацій – прикладом є ASDL-GAN, що мінімізує функцію спотворення і визначає ймовірність зміни кожного пікселя.
Змагальна гра – метод ADV-EMB, де зображення змінюється так, щоб заплутати аналізатор. Частина пікселів використовується для приховування даних, інша – для створення перешкод.

2) Селекція зображення

Тут GAN встановлює відповідність між повідомленням і вже готовим зображенням. Контейнер сам перетворюється на стегозображення без прямої модифікації, тому класичний статистичний аналіз майже не працює.

3) Синтезування зображення

Застосовується заздалегідь навчений генератор, який створює нові зображення. Один із підходів – навчання з учителем, де роль Аліси, Боба та Єви виконують нейронні мережі, відтворюючи процес обміну повідомленнями та їх приховування.

Стеганографія без ембеддинга

У цьому підході повідомлення не вбудовується безпосередньо в існуюче зображення, а перетворюється на вектор шуму, який подається генератору. Генератор попередньо навчається на великій вибірці, після чого здатен створювати реалістичні зображення. На наступному етапі використовується екстрактор, який спеціально навчається відновлювати повідомлення з уже синтезованих стегозображень. Таким чином, з’являється додатковий рівень захисту: замість внесення змін у вже готові картинки створюється абсолютно нове зображення, у яке «зашито» повідомлення. Це робить виявлення прихованого каналу значно складнішим.

Стеганографія WGAN-GP

Метод заснований на водно-градієнтних GAN (Wasserstein GAN with Gradient Penalty), які славляться стабільністю навчання та якістю синтезованих даних. У цьому випадку одночасно навчаються генератор і екстрактор повідомлень. Вони працюють у форматі змагальної гри: генератор прагне створювати максимально реалістичні стегозображення, а екстрактор навчається витягувати приховані повідомлення, незважаючи на складність умов. Додатково підключається дискримінатор, що контролює правдоподібність отриманих зображень. У результаті досягається баланс між якістю картинки й точністю передачі даних, що дозволяє підвищити приховану пропускну здатність каналу.

Стеганографія ACGAN (часткове навчання з учителем)

ACGAN (Auxiliary Classifier GAN) модифікує класичну GAN, додаючи допоміжний класифікатор. Ідея полягає в тому, щоб не лише створювати реалістичні зображення, але й навчати систему встановлювати зв’язок між класовими мітками і секретною інформацією. Генератор отримує на вхід не тільки шум, але й відповідну мітку класу, що дозволяє вбудовувати повідомлення безпосередньо в логіку побудови картинки. Дискримінатор, крім визначення автентичності зображення, виконує додаткове завдання – відновлює частини прихованого повідомлення. Такий підхід підвищує точність відтворення даних і робить систему більш керованою.

Стеганографія з обмеженим семплюванням

Цей метод зосереджений на мінімізації змін між вихідним зображенням і створеним стегозображенням. По суті, приховування повідомлення перетворюється на задачу пошуку найбільш придатного контейнера. Система генерує велику кількість кандидатів, після чого обирає той варіант, у якому вбудоване повідомлення змінює початкове зображення найменше. Таким чином, зменшується ймовірність виявлення прихованого каналу, оскільки відмінності статистично близькі до шуму, який є природним для будь-якого цифрового файлу.

Стеганографія на основі CycleGAN

У цьому підході використовується відома модель CycleGAN, розроблена для трансформацій «image-to-image» без парних прикладів. Вона навчається перетворювати зображення з одного класу (X) у зображення іншого класу (Y), зберігаючи узгодженість зворотного перетворення (циклічність). У контексті стеганографії це дозволяє розглядати трансформацію як процес кодування повідомлення. Наприклад, звичайне зображення може перетворюватися у стилізоване або модифіковане, але водночас у ньому приховано додаткові дані. Цей підхід відзначається високою гнучкістю і складністю для стеганалізу, оскільки зображення виглядає правдоподібним і відповідає природним закономірностям цільового класу.

Майбутнє GAN у стеганографії: ключові виклики та напрями

Методи на основі GAN сьогодні розглядаються як найбільш перспективний напрям розвитку стеганографії. Вони дають змогу створювати стегозображення, майже невідмінні від реальних, проте мають низку обмежень і відкритих питань. Подальший розвиток цієї технології зосереджується на трьох головних напрямах:

1. Місткість

Сучасні реалізації на кшталт GAN-CSY стикаються з проблемою нестабільності пікселів, що призводить до низької точності вилучення повідомлень. У багатьох випадках дані не зберігаються в класичному вигляді, а перетворюються на атрибути категорії чи вектори шуму. Це обмежує обсяг інформації, яку реально можна приховати.

У майбутньому важливим напрямом стане:

стабілізація генерації зображень;
розробка механізмів підвищення пропускної здатності каналів;
пошук балансів між якістю зображення та кількістю даних, що передаються.

2. Оцінка якості зображення

Проблемою залишається відсутність об’єктивних метрик. Зараз активно застосовуються IS (Inception Score) та FID (Frechet Inception Distance), які вимірюють правдоподібність і якість. Але цих показників недостатньо, адже вони не враховують приховане навантаження і специфіку стегозображень.

У перспективі слід очікувати:

створення нових метрик, які поєднуватимуть оцінку якості зображення з надійністю передачі повідомлення;
застосування комбінованих підходів – автоматизованих і з елементами людської експертизи;
розробку стандартизованих інструментів оцінки для наукових і прикладних досліджень.

3. Стеганаліз

Сьогодні GAN здатні створювати зображення, невідмінні для людського ока. У класичній стеганографії застосовуються численні методи аналізу, що дозволяють виявляти приховані зміни, але зі зростанням потужності генеративних моделей ці методи стають дедалі менш ефективними.

Подальші дослідження спрямовані на:

розвиток інструментів, здатних розрізняти реальні та синтетичні зображення;
удосконалення систем розпізнавання прихованих повідомлень у згенерованих контейнерах;
поєднання класичного стеганалізу з глибинними нейромережами для підвищення точності.

Висновок

Майбутнє стеганографії на основі GAN пов’язане з вирішенням трьох великих задач: підвищення місткості, розробка нових метрик оцінки та посилення стеганалізу. Баланс між можливостями приховування та здатністю виявляти приховані дані визначатиме розвиток всієї галузі у найближчі роки.