Environmentální Web – pomocník státní správy
Návrh metadatového schématu pro environmentální data

V České republice jsou nyní v platnosti zákony, které dávají všem žadatelům (občanům, podnikatelům, vládním i nevládním organizacím) možnost získat environmentální (týkající se životního prostředí) informace, které mají orgány veřejné správy a jimi řízené organizace k dispozici. Do jaké míry je však tento právní nárok prakticky uplatnitelný?
Zákon č. 123/1998 Sb., o právu na informace o životním prostředí, platný od 1. července 1998, stanoví orgánům státní správy i samosprávy v oblasti životního prostředí povinnost poskytovat informace o životním prostředí. Již ve fázi návrhu zákona vyvstaly částečně oprávněné obavy o technickou vymahatelnost tohoto práva.
Přímé (adresné) poskytování informací (na žádost) je nejen značně zdlouhavé, nákladné pro obě strany (žadatele i příslušný orgán), ale mnohdy i neúčinné. Zvláště v případech, kdy se jedná o mnoho drobných dotazů, namnoze směřujících na již zveřejněné informace, na primární data z měření a monitoringu ve formě časových řad, atd. Zákon sice tyto situace ošetřuje, ale bez technického zázemí zůstávají možnosti poskytovat informace spíše teoretické.
Proto pro často kladené žádosti o informace se nabízí možnost neadresného poskytování publikování (zveřejnění) informací v hromadných sdělovacích prostředcích (TV, rozhlas, teletext, denní tisk), publikacích, ročenkách, zpravodajích, atd. Tím se sice odstraní neefektivnost při vyřizování jednotlivých žádostí, ale výběr zveřejňovaných informací je ponechán na rozhodnutí orgánu poskytujícího informace. Existuje však perspektivní možnost spojující výhody adresného i neadresného poskytování přímý přístup do informačních systémů životního prostředí.
Moderní informační systémy (zkráceně IS) zpřístupňující environmentální informace široké veřejnosti, novinářům a nevládním organizacím i podnikatelům mají smysl jen tehdy, splňují-li následující kritéria:
• musí být dostupné online v globálních sítích, tzn. dnes především na Internetu;
• musí být dostatečně uživatelsky příjemné, aby neznepříjemňovaly a neodrazovaly potenciální zájemce (novinář by si nějak poradil, prostého občana by to však odradilo…);
• nesmí vyžadovat speciální informační technologie pro přístup k nim v současnosti to znamená, že nejvhodnější je přístup z obecně dostupného počítače typicky prohlížeče WWW stránek (důvod obdobný jako v předchozím).
V zahraničí již dnes existuje poměrně mnoho on-line dostupných datových zdrojů s environmentální problematikou. Těžiště pozornosti uživatele se tedy přesouvá od otázky, zda jsou informace dostupné k (možná ještě složitějšímu) problému kde, pro koho a jak jsou informace dostupné.
Tyto problémy řeší zavedení a důsledné používání tzv. metadat doprovázejících environmentální datové zdroje, kterým se budeme v dalším zabývat.

Metadata – prostředek k lepšímu využití dat

Historicky nejsou metadata ničím novým. V podobě nejrůznějších katalogových záznamů o dalších datech, tehdy hlavně knihách, spisech, dokumentech v archívech a knihovnách, tvořily základ dokumentografickým databázím. Zde mají dodnes své místo při evidenci informačních zdrojů (např. knih, časopisů), vyhledávání relevantních informací, při statistickém vyhodnocování apod.
K podstatnému nárůstu důležitosti (i popularity) metadat dochází až v době, kdy začaly být v elektronické podobě k dispozici samotné informace (dokumenty). Jejich dostupnost byla nejprve lokální (v určité lokální síti, na disketě, apod. většinou ve speciálním formátu), později globální (na globální síti, většinou ve veřejném formátu).
Od metadat se vyžadovalo nejen popsat formální (syntaktické) náležitosti příslušných dat, ale také umožnit přístup k těmto datům. Další požadavky se objevily ve chvíli, kdy se data díky globálním sítím stala potenciálně dostupná komukoli a bylo třeba metadaty popsat např. autorství a autorská práva k nim, jejich přístupnost a práva k použití.
S možností síťové komunikace mezi jednotlivými metadatovými zdroji (např. knihovními katalogy) mohutně narostla vzájemná výměna metadat a vyvstal problém vzájemné interoperability. Začaly vznikat standardizovaná schémata metadat a standardizované protokoly jejich výměny.
Dnes jsme v té situaci, že existují na jedné straně univerzální (generická) metadatová schémata, používaná v dokumentografických IS a kromě nich se začínají objevovat schémata specifická pro metadatový popis určité kategorie dat, např. standard pro geografická data podle normy CEN/CENELEC TC287, metadatový standard GILS, GELOS pro data o životním prostředí a další.


Obecné požadavky pro metadata na Internetu

Jak jsme uvedli u požadavků na IS pro poskytování environmentálních informací, základem je jejich dostupnost v síti Internet. Totéž platí i pro metadata, která tudíž musí být:
• přenositelná Internetem (nejlépe samotným protokolem HTTP);
• v otevřeném formátu (nepodléhajícím autorským poplatkům plynoucím z autorských práv a/nebo dalším omezením použití);
• digitálně podepisovatelná (z důvodu bezpečnosti a správné verifikace);
Úkolu vytvořit jednotný rámec pro konstrukci metadatových schémat použitelných v prostředí Internetu se ujalo World Wide Web Consortium (W3C). Jeho pracovní skupina Metadata Working Group vyvíjí v rámci programu W3C Metadata Activity obecný rámec Resource Description Framework (RDF), který má šanci stát se v budoucnu základem pro většinu metadatových schémat.


Specifika environmentálních metadat

Environmentální metadata přinášejí specifické prvky, které se u obecně použitelných metadat nevyskytují. Zvláštnosti se týkají zejména těchto prvků, které se vyskytují u geografických (environmentálních) dat:
• prostorové a časové umístění dat;
• topologické a geometrické vztahy mezi objekty popsanými v těchto datech;
S prostorovým umístěním a vymezením souvisí i informace o použitém referenčním systému pro prostorové určení. Obzvlášť problematicky zvládnutelné jsou nepřímé referenční systémy, kde je poloha geografického objektu popsána jeho přiřazením k určité prostorové (územně identifikační) jednotce (např. obci, okresu, kraji). Tyto systémy mívají v praxi v České republice celou řadu výjimek a jsou s tím, jak se postupně zaváděly, navzájem dosti nekonzistentní.


Stávající mezinárodní metadatové standardy

V oblasti environmentálních metadat (snad kromě jejich podskupiny geografických metadat) zatím neexistuje ke standardizaci jednotný přístup. Existující standardy jsou povýtce skutečně záležitostí konkrétních realizovaných systémů. Mezi ty univerzální patří především standard Dublin Core.
Tento metadatový standard patří mezi standardy generické, pro obecné použití. Jeho hlavní oblastí použití však jsou bibliografické či obecně dokumentografické databáze. Pro environmentální aplikace je zpravidla příliš obecný.
Technický výbor CEN/TC287 navrhl pro výměnu geograficky (a časově) určených dat konceptuální metadatový standard, podle něhož by měly být popisovány digitální a případně i jiné geografické datové zdroje v rámci EU. Tento návrh standardu geografických metadat je velmi cenným příspěvkem pro environmentální metadatovou standardizaci. Metadatově popisuje geografická data (data s prostorovým a časovým určením) se specifickými atributy (např. s přímým i nepřímým prostorovým určením, časovým vymezením, atd.). Explicitně stanoví návaznost na thesaurus, uvádí i atributy týkající se administrativy samotného metazáznamu (datum jeho vložení, kontakt na autora metazáznamu). Vhodné je i uvedení okolností duševního vlastnictví.

Dalšími, tentokrát spíše de facto standardy, jsou:
• americký metainformační systém GILS (Government Information Locator Service);
• metainformační systém původně zemí G7 – GELOS (Global Environmental Locator Service);
• metainformační systém zemí EU – ETC/CDS (Catalogue of Data Sources);
• metainformační systém německy mluvících zemí – UDK (Umweltdatenkatalog).


Národní metadatové standardy

V současnosti na ministerstvu životního prostředí budovaný český státní environmentální metainformační systém MEDIS má přes řadu předností dosti podstatná omezení. Především se soustřeďuje hlavně na své první poslání – mapovat existující datové zdroje a zpřístupňovat environmentální indikátory veřejnosti, potud je navržen dobře.
Je však budován jako systém s uzavřeným, centrálně definovaným metadatovým schématem, tudíž jakékoli změny směrem k detailnější specifikaci metadat v některé dílčí oblasti nasazení jsou velmi obtížně proveditelné, neboť se dějí vždy centrálně. Metadatový popis environmentálních dat v MEDIS není dostatečně flexibilní, je omezen autorskoprávní ochranou a jeho využití je pevně spjato s „mateřským“ metainformačním systémem.
Infrastruktura pro sdílení a výměnu metadat o datových zdrojích v životním prostředí vytvořená tímto systémem tedy nesplňuje požadavek otevřenosti, přenositelnosti a rozšiřitelnosti.
Proto byl na Fakultě informatiky MU v Brně před dvěma lety zahájen v rámci doktorandského studia výzkum výše uvedených informačních technologií jehož výsledkem je návrh infrastruktury pro výměnu environmentálních metadat pracovně nazvaný „Environmental Web“. Název není zvolen náhodně – infrastruktura připomíná svou filozofií, topologií a použitými protokoly (HTTP) svůj úspěšný vzor – síť World Wide Web. Jakožto formát metadatových souborů používá obecný rámec RDF.
Metadata jsou uložena na tzv. datových serverech navrženého a prototypově realizovaného systému. Přístup k metadatům se děje připojením k tzv. procesním serverům systému prostřednictvím prohlížeče (browseru) WWW. Stejnými prostředky lze také metadata vkládat a modifikovat.
Kromě samotného prototypového systému realizujícího infrastrukturu „Environ-mental Web“ bylo současně navrženo generické metadatové schéma, které definuje strukturu a obsah „povinných“ složek environmentálních metadat pořizovaných v České republice.

Závěr

Výše zmíněný návrh infrastruktury pro sdílení a výměnu environmentálních metadat pro Českou republiku je jedním z prvním teoretických počinů v informačních technologiích vedoucích k systematizaci tvorby environmentálních metadat v České republice a jedním z mála takových návrhů ve světě. Pro tento návrh byl navíc použit velmi progresivní prostředek pro modelování metadat rámec RDF, který má šanci stát se unifikujícím prostředkem pro decentralizované a platformově nezávislé vytváření a zpracování metadat.
Nasazení navrženého systému ve státní správě v životním prostředí by mohlo podstatně přispět k snazšímu vyhledávání ve stávajících datových zdrojích o životním prostředí na Internetu a tím k jejich lepšímu využívání. Tím by státní správa í samospráva dostala účinného pomocníka pro vyřizování opakujících se žádostí o již zveřejněné informace, které by bylo možno vyhledat on-line na Internetu. Dostupnost metadat by také usnadnila napojení tuzemských environmentálních informačních systémů na systémy mezinárodní.