Agregace dokumentů v Manuscriptoriu: základní informace

REVIZE NUTNÁ – KOPIE Z MANU 3

Systém Manuscriptorium je koncipován jako digitální knihovna rukopisů, starých tisků a dalších vzácných dokumentů. Jako každá knihovna se skládá z katalogu a samotných digitálních dokumentů. Katalog soustřeďuje popisná metadata o fyzických dokumentech ve formě tzv. evidenčních záznamů ve formátu XML a odkazuje uživatele na digitální dokumenty, které existují v Manuscriptoriu ve formě tzv. komplexních digitálních dokumentů (KDD).

Systém Manuscriptoria centrálně soustřeďuje dostupná metadata a zajišťuje přístup k digitalizovaným datům distribuovaným v on-line prostředí na datových úložištích provozovatele i vzdálených úložištích dalších přispěvatelů.


Zařazení dokumentů do Manuscriptoria – obsahové hledisko

Metodika výběru dokumentů z obsahového hlediska je podrobněji popsána v dokumentaci MNS verze 1.0. V následujícím stanovujeme vlastnosti, které musí splňovat přijaté digitální dokumenty.

Rozhodující je:

  1. význam dokumentu a účelnost jeho zařazení do Manuscriptoria,
  2. technická použitelnost informací o dokumentu (metadata) a informací prezentujících dokument, tj. obrazy, zvuky, plné texty (data),
  3. kvalita a věrohodnost dat.

Zařazování dokumentů do Manuscriptoria řídí Národní knihovna ČR tak, že orientuje Manuscriptorium ke zpřístupňování písemného kulturního dědictví do roku 1800 s primárním zaměřením na dokumenty knižní povahy, sekundárně je však otevřeno pro dokumenty povahy archivní (zejména knihy, listiny a mapy).

Denotátem všech digitálních dokumentů v Manuscriptoriu je zásadně originální fyzický dokument, ať dosud existující či již zaniklý.


Technické požadavky

Aby jednotliví přispěvatelé mohli přispívat do systému Manuscriptorium jak evidenčními záznamy, tak s nimi souvisejícími digitálními daty, je nutno stanovit základní technické podmínky a parametry vstupních dat. Přispěvatel musí dosáhnout toho, že jím poskytovaná data i metadata jsou kompatibilní se systémem Manuscriptorium.

Do Manuscriptoria lze agregovat dokumenty přímo, pokud jsou tzv. přímo kompatibilní. Případně lze dosáhnout kompatibility využitím importních konektorů, jež umožňují jednoúčelově konvertovat metadata během importu z původních formátů.

Základní formou uchovávání informací v Manuscriptoriu jsou XML soubory se strukturou odpovídající standardu TEI P5. Pro uchování metadat v rámci tohoto formátu je použito konkrétně schéma TEI P5 ENRICH schéma, speciálně vyvinuté pro potřeby projektů zaměřených na oblast popisu rukopisů, starých tisků a dalších historických dokumentů. Vývoj schématu vedl tým Oxford University Computing Services ve spolupráci s odborníky z řady evropských paměťových institucí během projektu ENRICH.

Za kompatibilní dokumenty se považují takové dokumenty

  1. jejichž metadata jsou vytvářená libovolnými nástroji tak, aby měla formu XML validního dle DTD či XSD TEI P5 ENRICH schéma,
  2. jejichž metadata obsahují alespoň potřebné minimum informací umožňujících automatizované zpracování v Manuscriptoriu,
  3. jejichž data jsou dostupná on-line pomocí protokolu HTTP (přímo či prostřednictvím skriptu) na základě informací dostupných v metadatech,
  4. jejichž obrazová data jsou dostupná ve formátech, které jsou přímo podporované soudobými nejrozšířenějšími internetovými prohlížeči (aktuálně formáty JPEG, GIF a PNG) .

Za nutné technické minimum informací obsažených v metadatech se aktuálně považuje:

  • bibliografický popis v rozsahu elementárního množství identifikačních informací, tj. následující informace o exempláři: země a místo uložení, knihovna, signatura jednoznačná v rámci knihovny,
  • seznam datových souborů (typicky obrazů) umožnující přístup k datům dostupným on-line.

Technické minimum Manuscriptoria nezohledňuje obsahové hledisko a může být nepřijatelné pro jiné projekty!

Informace tohoto rozsahu skutečně představují pouze souhrn technického minima. Minimum, či optimální minimum, jež je vhodné dodržet, aby byl digitální dokument dobře využitelný, by mělo zahrnovat podstatně širší soubor informací, jehož struktura se samozřejmě liší v závislosti na vlastnostech fyzické předlohy. Proto si Manuscriptorium neklade za cíl stanovit minimální rozsah informací nad hranicí technického minima.


V případě, že konverze existujících informací není snadná nebo přispěvatel nemá důvod jejich formu měnit, a přesto má zájem je v Manuscriptoriu zveřejnit, je možno vytvořit nástroje pro rutinní konverzi za účelem dosažení kompatibility. Manuscriptorium zajistí ke svému systému tzv. importní konektor a přispěvatel dál spravuje data nezávislým způsobem a k agregaci je poskytuje v původní formě. Vytvoření konektoru je nutno předem konzultovat.

Konektory jsou budovány typicky na straně Manuscriptoria, alternativně též na straně přispěvatelů. Využívání existujících konektorů nebo budování nových je předmětem individuálních jednání mezi budoucím partnerem, Národní knihovnou ČR a správcem Manuscriptoria.

NK ČR podporuje a financuje import dokumentů kompatibilních s Manuscriptoriem. Dokumenty, pro jejichž metadata již existuje konektor, jsou také považovány za kompatibilní.


Manuscriptorium poskytuje volně dostupné on-line nástroje usnadňující tvorbu a kontrolu kvalitních metadat digitálních dokumentů.

Domů    /    Agregace dokumentů v Manuscriptoriu: základní informace