(English)
Веб-архіви стосуються колекції історичних знімків веб-сайтів або веб-сторінок, які збереглися з часом. Архівні копії зберігаються у веб-архівах або цифрових онлайн-бібліотеках, де до них можуть отримати доступ дослідники, історики чи будь-хто, хто зацікавлений у перегляді історії веб-сайту чи еволюції з часом. Веб-архіви використовують веб-сканери або ботів для захоплення та зберігання інформації про веб-сторінки, включаючи текст, зображення, відео та інші медіафайли, що містяться на сторінці, разом із метаданими сторінки. Ці архіви відіграють важливу роль у збереженні цифрової культурної спадщини та забезпеченні того, щоб важлива інформація та знання залишалися доступними для майбутніх поколінь. Веб-архіви — це цифрові сховища, які збирають і зберігають веб-вміст, включаючи веб-сайти, веб-сторінки, зображення та мультимедійні файли. Вони дозволяють користувачам отримувати доступ до історичного веб-вмісту, який може більше не бути доступним у живій мережі або був змінений чи видалений. Веб-архіви працюють шляхом періодичного сканування та створення знімків веб-вмісту.
Cтворюючи історичні записи Інтернету, доступ до яких мають дослідники, історики та інші. Інтернет-архів є одним із найбільших і найвідоміших веб-архівів, але доступні й інші веб-архіви. Веб-архіви відіграють важливу роль при проведенні розслідувань та пошуку інформації про мету. Сьогодні поділюся невеликою добіркою ресурсів та інструментів на цю тему.
Trove — це інструмент керування базами даних для OpenStack. Він надає простий і легкий у використанні API для керування екземплярами бази даних і конфігураціями, включаючи функції резервного копіювання та відновлення. Trove підтримує широкий спектр механізмів баз даних, включаючи MySQL, MongoDB і PostgreSQL, і може бути інтегрований з іншими службами OpenStack, такими як Keystone і Horizon.
UKWA означає веб-архів Сполученого Королівства. Це некомерційна організація, яка зберігає веб-сайти та веб-вміст, пов’язані зі Сполученим Королівством. UKWA має на меті забезпечити постійний доступ до веб-матеріалів Великобританії для майбутніх поколінь, дослідників та організацій культурної спадщини. Він архівує мільйони веб-сайтів, блогів та іншого цифрового вмісту, зберігаючи їх на майбутнє та роблячи загальнодоступними.
Vefsafn.is — це цифровий архів, який зберігає і надає доступ до ісландської мережі. Він підтримується Національною та університетською бібліотекою Ісландії та містить веб-сайти, сторінки в соціальних мережах та інший цифровий вміст, пов’язаний з ісландською культурою, історією та суспільством. Архів є цінним ресурсом для дослідників, студентів і всіх, хто цікавиться ісландською історією та культурою.
Arquivo.pt — це ініціатива Національної бібліотеки Португалії зі збереження цифрових даних, яка спрямована на збереження та надання доступності культурної та історичної спадщини португальської мережі. Платформа архівує веб-сайти, веб-сторінки, зображення, відео та аудіофайли, дозволяючи користувачам переглядати минулі версії веб-сайтів і отримувати доступ до вмісту, який може більше не бути доступним у мережі. Ініціатива також пропонує API та інструменти для дослідників, розробників та інших користувачів для вивчення архівного вмісту.
Archive.vn – це веб-архів, який зберігає копії веб-сторінок і дозволяє користувачам ділитися збереженими версіями соціальних медіа-посилань. Сайт був запущений у 2013 році та надає безкоштовний доступ до збережених копій сторінок, які користувачі можуть використовувати для посилань на джерела, збереження інформації та доказів. Однак деякі уряди та інтернет-провайдери блокують доступ до цього сайту через проблеми зі збереженням особистої інформації та захисту авторських прав.
Проксі-сервер TheOldNet дозволяє вказати порт підключення між 1996 і 2012 роками, що представляє рік, в якому необхідно відображати всі відвідувані веб-сторінки. Проксі-сервер повертає архівні копії будь-якого сайту із ресурсу Archive.org. Після налаштування веб-браузер буде відображати кожен веб-сайт так, як він був у зазначеному році. Наприклад, використовуючи сервіс можна побачити, як виглядала перша популярна пошукова система Yahoo.com у 1996 році, ще до появи Google, сайт Apple або Electronic Arts у 2007-му.
Stanford Web Archive Портал – є веб-архівом Stanford University Libraries, які забезпечує доступ до архівованих версій веб-сайтів, онлайнових публікацій, і веб-базованих цифрових матеріалів, що стосуються історії та діяльності Stanford University і Silicon Valley. В архіві входять понад 8000 веб-сайтів, і містять різні типи матеріалів, таких як зображення, аудіо-і відео-файли, документи, і datasets, і всі, які є доступними для досліджень, вивчають, і вивчають ресурси.
Libraby web archives — це колекція веб-вмісту, починаючи з 2000 року, яка документує культурну та політичну історію Сполучених Штатів. Він містить мільйони елементів, таких як веб-сайти, соціальні мережі, блоги, відео тощо. Метою веб-архіву є збереження цих матеріалів для майбутніх поколінь і надання доступу дослідникам і вченим.
Carbon Dating The Web – це інструмент, який використовується для визначення дати створення веб-сторінки шляхом аналізу вмісту сторінки та інших відповідних факторів. Мета полягає в тому, щоб забезпечити більш точний і надійний спосіб датування веб-сторінок для дослідницьких цілей.