Konzultace |
Problematice dlouhodobého uchovávání dokumentů v digitální podobě bylo na stránkách časopisu Veřejná správa věnováno již několik článků. V tomto příspěvku se jeho autoři, pracující na odboru archivní správy a spisové služby Ministerstva vnitra, pokusí zodpovědět některé dotazy, které jsou se stále větší intenzitou vznášeny na pracovníky, kteří se zabývají problémy dlouhodobého uchovávání digitálních dokumentů a přípravou zřízení Národního digitálního archivu. Příspěvek se zaměřuje především na základní kontury digitálního archivu a formáty vhodné pro dlouhodobé uložení dokumentů v digitální podobě.
Podmínky dlouhodobého uchování dokumentů
V úvodu je nutné zrekapitulovat některé základní teze týkající se problematiky digitálních dokumentů. V podstatě můžeme dokumenty vytvářené prostřednictvím výpočetní techniky rozdělit podle dvou základních kritérií. První z nich dělí dokumenty podle toho, zda jsou převeditelné do klasické (papírové) podoby, včetně dodatečného opatření autentizačními znaky, nebo nikoli. Druhým kriteriem je zachování autenticity. Podle prvního kriteria lze dokumenty rozdělit do tří skupin:
Jde o dokumenty, které,
Z pohledu potřeby zachování jejich autenticity můžeme dokumenty rozdělit do dvou skupin:
Pokud je požadována autenticita dokumentů pouze po dobu jejich zúřadování, lze pro její zabezpečení použít zaručený elektronický podpis. V opačném případě, kdy je požadována autenticita dokumentu i po jeho předání do archivu k trvalému uložení, existuje v současné době pro její zabezpečení pouze jediná cesta, a tou je uchování dokumentu v materiální (například listinné) podobě. Lze říci, že jakákoli dematerializace dokumentu z pohledu dlouhodobého uložení znamená vždy ztrátu jeho autenticity.
Je mylné se domnívat, že elektronický podpis řeší problém autenticity, protože dlouhodobě uchovávat elektronický podpis je nemožné. Vytvoření elektronického podpisu není žádný problém, ale problém nastane při migraci dokumentů chráněných podpisem. Smyslem elektronického podpisu je ochrana dokumentů v živých registraturách. V žádném případě jej nelze použít při dlouhodobém uložení. Náklady na zachování a udržování elektronického podpisu přesahují jeho význam.
Z výše uvedeného vyplývá i možný postup. U příslušného typu dokumentů se zváží, jak důležité je zachování autenticity. Tam, kde je požadováno zachování autenticity i po předání dokumentu do archivu nebo k dlouhodobému uložení, je do archivu předáván dokument jak v digitální, tak i v klasické papírové podobě. V případech, kdy autenticita není již po předání do archivu důležitá, je dokument předáván pouze v digitální podobě, a to v předepsaných archivních formátech.
Co se rozumí předepsaným archivním formátem? Obecně se archivní formáty liší podle druhu dokumentů. Pro text, zvuk, data z databází, obraz (jak statický, tak dynamický) se používají různé formáty. Všechny použité formáty však musejí splňovat jednu základní podmínku, a tou je otevřenost a nezávislost na konkrétním technickém zařízení, na autorovi nebo vlastníkovi konkrétního formátu. U dokumentů v digitální podobě je požadována dlouhodobá stálost a pochopitelně jednoduchost. Vzhledem k nutnosti vytvářet čtecí a vyhledávací nástroje, je požadováno uložení do tzv. archivních formátů, které splňují výše uvedená kriteria.
Stanovení archivních formátů
O jaké konkrétní formáty tedy jde? Stanovení archivních formátů vhodných pro aplikaci v České republice musí být součástí projektu Národního digitálního archivu. Předpokládá se, že tyto formáty budou stanoveny do konce roku 2007. Nejprve budou pravděpodobně prezentovány jako doporučené a teprve následně budou vydány prostřednictvím novelizované vyhlášky o spisové službě a budou tedy závazné.
Všechny ICT systémy používané u původců povinných vést spisovou službu a u původců, kteří jsou podle archivního zákona povinni předkládat dokumenty k výběru, budou muset být vybaveny exportem dat do těchto formátů. Tak je tomu ostatně ve všech vyspělých zemích.
Jaké formáty přicházejí v úvahu? Pro dlouhodobé uložení klasických textových dokumentů se používá otevřený a veřejně popsaný formát TIFF. V současné době se ve světě přechází na specielní archivační formát PDF/A, který je též popsán ISO normou. Pro digitální nebo digitalizované statické objekty se používá převážně formát TIFF. Pro zvukové dokumenty je nejčastěji používán formát WAV, pro filmy v digitální podobě se používá formát MPEG 2. Data z databází jsou obecně převáděna do tzv. flat files neboli plochých souborů, čímž se rozumí prostá sekvenčně řazená data uložená v ASCII formátu s předem definovanými oddělovači, bez použití složitých vazeb. Lze konstatovat, že situace ohledně formátů vhodných pro dlouhodobé uložení se postupně celosvětově stabilizuje.
V současnosti již mnozí původci dokumentů trvalé hodnoty pociťují určitou netrpělivost a žádají co nejbližší stanovení formátů vhodných pro dlouhodobé uložení dokumentů v digitální podobě. Ministerstvo vnitra však nechce vydat závazné doporučení dříve, než budou formáty rozšířené ve světě verifikovány jako vhodné i pro použití v českých podmínkách. Je proto nutno vyčkat předání projektové dokumentace Národního digitálního archivu, která bude rovněž obsahovat vybrané archivní formáty. Dodržení tohoto postupu je nutné, protože jde o velmi důležitý a v určitém smyslu nevratný krok.
Pokud by byly standardy vydány formou obecně závazného právního předpisu příliš brzy, hrozí několik nebezpečí. Zavedení standardů bude v celorepublikovém měřítku znamenat vynaložení nemalých nákladů na úpravu již používaných informačních systémů pro vedení spisové služby a dalších evidencí. Jakákoli změna standardu by přinesla další významné náklady na další úpravu informačních systémů. Popsaný jev by byl nepříjemný z ekonomického hlediska, při vynaložení finančních prostředků by byl nicméně řešitelný. Mnohem horším jevem by byla situace, kdy by přechod na nový formát neumožňoval transformaci dat ze starších formátů. Tyto dokumenty by se staly nevratně nečitelnými se všemi z toho plynoucími právními a ekonomickými důsledky. Řešení problému má i svůj technologický rozměr.
V této souvislosti je nutno opět poukázat na špatné zkušenosti některých vyspělých zemí světa. Příkladem může být současná nedostupnost některých dat z projektu Apollo realizovaného americkým Úřadem pro letectví a vesmír. Tento úřad má stále mnoho datových nosičů se snímky pořízenými vesmírnými sondami. V současné době však není schopen tato data zpracovat, zpřístupnit a tedy využít při dalším výzkumu. Znamená to, že nemalé náklady věnované do minulých projektů budou muset být opakovaně věnovány na tentýž výzkum. V této souvislosti je třeba zdůraznit, že to, co je řešitelné pro ekonomiku Spojených států amerických, nemusí být proveditelné v rozměrech České republiky, a to jak z důvodů ekonomických, tak technologických.
Podstatným kriteriem pro stanovení archivních formátů budou požadavky, které vyplynou z projektu digitálního archivu.
Úplný text je v časopise Veřejná správa č. 13/2007.