Reddit заблокував можливість Internet Archive зберігати цілі сторінки та коментарі, після того як з’ясувалося, що деякі AI-компанії обхідним шляхом здобувають дані платформи через Wayback Machine, порушуючи політику використання контенту та принципи конфіденційності користувачів.

Тепер Internet Archive зможе архівувати лише знімки головної сторінки Reddit, без коментарів і повних тредів. Це значно зменшує його роль як джерела для збереження видаленого контенту чи дослідження активності користувачів.
За словами представника Reddit Тіма Ратшмідта, виявлено випадки, коли AI-компанії, яким заборонено прямий збір даних з Reddit, використовували архівні копії з Wayback Machine для тренування своїх моделей. Reddit вимагає, щоб Internet Archive вжив додаткових технічних заходів проти такого збору, що може стати умовою для зняття обмежень у майбутньому.
Ще однією причиною стала конфіденційність: Wayback Machine зберігає навіть видалений користувачами контент, що суперечить політиці платформи.
Internet Archive та його інструмент Wayback Machine багато років були корисними для збереження історії Reddit, зокрема під час масових видалень постів або змін у політиці. Наприклад, у 2023 році архів допоміг зберегти контент після обмеження доступу до Reddit API, яке призвело до закриття частини популярних сабреддітів.
Існують припущення, що обмеження мають і фінансовий мотив: скорочуючи безкоштовний доступ, Reddit може стимулювати AI-компанії до укладення ліцензійних угод. Подібні контракти вже підписані з OpenAI та Google, при цьому угода з Google оцінюється у 60 млн $, а загалом Reddit очікує понад 200 млн $ доходу від таких партнерств протягом кількох років.
Блокування Internet Archive для збереження контенту Reddit демонструє новий етап боротьби платформ із несанкціонованим збором даних, особливо у контексті розвитку штучного інтелекту. Це рішення водночас піднімає питання про баланс між захистом приватності користувачів, збереженням цифрової історії та монетизацією даних.