Reddit обмежив доступ Internet Archive для боротьби з несанкціонованим збором даних AI-компаніями

13.08.2025 1 хвилин Автор: Newsman

Reddit заблокував можливість Internet Archive зберігати цілі сторінки та коментарі, після того як з’ясувалося, що деякі AI-компанії обхідним шляхом здобувають дані платформи через Wayback Machine, порушуючи політику використання контенту та принципи конфіденційності користувачів.

Тепер Internet Archive зможе архівувати лише знімки головної сторінки Reddit, без коментарів і повних тредів. Це значно зменшує його роль як джерела для збереження видаленого контенту чи дослідження активності користувачів.

За словами представника Reddit Тіма Ратшмідта, виявлено випадки, коли AI-компанії, яким заборонено прямий збір даних з Reddit, використовували архівні копії з Wayback Machine для тренування своїх моделей. Reddit вимагає, щоб Internet Archive вжив додаткових технічних заходів проти такого збору, що може стати умовою для зняття обмежень у майбутньому.

Ще однією причиною стала конфіденційність: Wayback Machine зберігає навіть видалений користувачами контент, що суперечить політиці платформи.

  • Internet Archive та його інструмент Wayback Machine багато років були корисними для збереження історії Reddit, зокрема під час масових видалень постів або змін у політиці. Наприклад, у 2023 році архів допоміг зберегти контент після обмеження доступу до Reddit API, яке призвело до закриття частини популярних сабреддітів.

  • Існують припущення, що обмеження мають і фінансовий мотив: скорочуючи безкоштовний доступ, Reddit може стимулювати AI-компанії до укладення ліцензійних угод. Подібні контракти вже підписані з OpenAI та Google, при цьому угода з Google оцінюється у 60 млн $, а загалом Reddit очікує понад 200 млн $ доходу від таких партнерств протягом кількох років.

Блокування Internet Archive для збереження контенту Reddit демонструє новий етап боротьби платформ із несанкціонованим збором даних, особливо у контексті розвитку штучного інтелекту. Це рішення водночас піднімає питання про баланс між захистом приватності користувачів, збереженням цифрової історії та монетизацією даних.

Підписатися
Сповістити про
0 Коментарі
Найстаріші
Найновіше Найбільше голосів
Знайшли помилку?
Якщо ви знайшли помилку, зробіть скріншот і надішліть його боту.