Webarchív

Webarchív České republiky

Jako ocenění kvality mých webových stránek mě Národní knihovna České republiky požádala, zda-li může můj web archivovat pro příští generace. Národní knihovna uchovává český web
A já jsem souhlasil.

Co je to Webarchív

Cituji: V prostředí internetu průběžně narůstá obrovské množství publikovaných dokumentů, které se postupně mění nebo zcela mizí. Pokud nebudou průběžně archivovány, tato významná součást národního kulturního dědictví bude nenávratně ztracena.
Úlohou Webarchivu je řešení problematiky archivace národního webu, tj. bohemikálních dokumentů zveřejněných v prostředí sítě Internet – shromažďování webových zdrojů, jejich archivace a ochrana a zajištění dlouhodobého přístupu k těmto archivovaným dokumentům. Provádí se jednak kompletní archivace, tj. automatický sběr „celého“ českého webu.

Webarchív

Webarchív České republiky

Souběžně probíhá výběrová archivace (na základě URL nejzajímavějších webových zdrojů vybraných na základě selekčních kritérií) a tématické archivace (zaměřené na určité aktuální téma, např. volby, povodně apod.).
Webarchiv je od roku 2007 členem mezinárodního konzorcia pro archivaci webu IIPC.

Získávání dokumentů z webu je po technické stránce převážně automatický proces, kdy se na základě zadaných parametrů ve speciálním SW nástroji stahují data, indexují a ukládají do digitálního archivu. V současné době se používají a přizpůsobují volně dostupné SW nástroje s otevřeným zdrojovým kódem (Heritrix).

Zdroje pro celoplošné sklizně jsou sklízeny na základě seznamu URL adres s doménou .cz poskytovaného správcem domény, sdružením CZ.NIC.

Nejvýznamnějším kritériem pro výběr zdrojů do výběrových sklizní Webarchivu je bohemikální charakter zdroje. Toto kritérium se řídí pravidlem výběru dokumentů registrovaných v národní bibliografii, které zahrnuje:

  • Území – všechny dokumenty (zdroje) publikované na území České republiky
  • Jazyk – všechny zdroje v češtině (bez ohledu na místo vydání)
  • Autorství – všechny zdroje českých autorů (bez ohledu na místo vydání)
  • Předmět/obsah – všechny zdroje, jejichž obsah se týká České republiky nebo českého národa (bez ohledu na místo vydání)

Zdroje jsou do výběrových sklizní zařazovány zejména na základě jejich obsahu. Preferovány jsou zdroje s kulturní, vědeckou či historickou hodnotou, které mají originální a unikátní obsah a dlouhodobou badatelskou hodnotu.

Archivaci webu v České republice, zejména zpřístupnění archivovaných elektronických zdrojů vymezuje Autorský zákon (č. 121/2000 Sb.).

Více o Webarchívu na jejich webových stránkách.