OpenAI представила Aardvark — автономного агента на базі GPT-5, який працює як цифровий security-researcher: читає код, знаходить уразливості, перевіряє експлойти в пісочниці та пропонує готові патчі. Інструмент уже виявив десятки реальних багів і 10 CVE у проєктах з відкритим кодом. Поки — private beta.

Aardvark — це новий підхід у кіберзахисті: не просто аналіз коду, а поведінка як у живого спеціаліста з AppSec. Агент під’єднується до репозиторію, аналізує коміти, будує threat-model, знаходить ризики, підтверджує експлуатацію в sandbox та надсилає pull-request із фіксом через Codex.
Його ключові можливості:
аналіз повної кодової бази
відстеження комітів і змін
оцінка експлойтабельності
запуск атаки у безпечному середовищі
автогенерація патчів + review агентом
інтеграція з GitHub
Aardvark показує високі результати: 92% виявлених уразливостей у тестових репозиторіях. Подібні рішення зараз розробляють й інші гіганти — Google вже тестує CodeMender. Але OpenAI першою запускає інструмент у вигляді автономного агента для команд безпеки.
40 000+ CVE було зареєстровано у 2024 році. Близько 1,2% комітів у проєктах містять уразливості, що робить автоматичний безперервний код-аудит критично важливим. OpenAI вже використовує Aardvark у власних репозиторіях і планує безкоштовно перевіряти select open-source проєкти.
Aardvark — це крок у нову еру безпеки, де ШІ стає постійним членом Blue Team і ловить уразливості до того, як ними скористаються хакери. Якщо система вийде у публічний доступ та підтвердить стабільність — це може перевернути підхід до AppSec і зробити code-auditing доступним кожній команді, а не лише корпораціям.