Jan Boček, datový novinář ve firmě Samizdat a konzultant pro otevřená data Fondu Otakara Motejla
Před pěti lety začali Britové zveřejňovat surová data, která si do té doby úřady nechávaly pro sebe. Následná vlna zájmu přinesla tisíce mobilních aplikací, odhalila nové příležitosti pro podnikání a proměnila státní správu. Teď stejné téma dorazilo do Česka.
Loni v červnu spontánně vznikla jednoduchá mapa: ukazuje, kdy jsou dětská hřiště v Jižním Městě zastíněná a kdy na ně svítí slunce (www.gismentors.eu). Animace prodlužujících se stínů sice řeší dost lokální a specifický problém, ale zároveň odpovídá na úplně obecnou otázku. Proč a jak by měla města zveřejňovat svá data?
Mapu dětských hřišť nakreslil geoinformatik Jáchym Čepický během jedné neděle kolektivního programování. Akci, kde programátoři improvizovali nad nehotovými nápady – neboli hackathon – uspořádal Fond Otakara Motejla. Jediné, čím musela přispět samotná Praha, bylo zveřejnění datových podkladů, v tomto případě dodala 3D model výšky budov ve městě. Za nepatrný příspěvek tak hlavní město získalo cennou aplikaci. A ne jednu, podobných nápadů vzešlo ze zmíněného hackathonu hned několik (www.geoportalpraha.cz). Na letošním pokračování hackathonu se navíc chystá rozšíření mapy na celou Prahu.
Letos se iniciativa rozjela ve velkém. Prvního dubna nabídl pražský Institut plánování a rozvoje mapová data všem zájemcům. Balík geodat ukazuje cyklistické trasy, hlukové mapy, kvalitu ovzduší, záplavové oblasti, digitální model terénu nebo územní plán (www.geoportalpraha.cz). Podstatné je, že nejde pouze o vizualizace, ale taky o podkladová data. Ta lze na rozdíl od hotových map spojovat nebo porovnávat.
Data nejsou smlouvy
Otevřená data poznáte snadno. Za prvé, jsou volně k dispozici na webu, neschovávají se za žádným přihlašovacím formulářem. Za druhé, nakládání s nimi musí být bezplatné a licence musí uživateli povolovat komerční využití; dnes se nejčastěji používá licence Creative Commons 4.0. Nelze tedy například podmínit vydání dat podpisem smlouvy, „abychom aspoň věděli, co se s nimi bude dít“. A za třetí, data musí být k dispozici ve strojově čitelném formátu. Neznamená to nic jiného, než že by textové informace neměly být uložené jako obrázky. Takovým nevhodným „obrázkovým“ formátem je třeba PDF, typicky naskenovaný dokument. S tím si počítač téměř jistě neporadí. K publikování dat jsou vhodnější tabulky ve formátech CSV, XLSX nebo XLS.
Z poslední podmínky mimo jiné vyplývá, že otevřená data jsou něco jiného než otevřené smlouvy. V případě otevřených dat jde nejčastěji o klasické excelovské tabulky. Otevřené smlouvy jsou obvykle právě naskenované dokumenty, které visí na webu úřadu. Mimochodem, zveřejnění smluv je opravdu tak jednoduché, jak to zní: neznamená nic jiného než na webu úřadu vytvořit stránku, kde budou vystaveny smlouvy o veřejných zakázkách.
Nejzajímavější využití vašich dat vymyslí někdo jiný
Motivací k otevření dat by v ideálním světě mohlo být už jen to, že vznikla z veřejných peněz. Jenže v opravdovém světě tenhle argument ještě nikoho nepřesvědčil, takže zkusím lepší.
„Nejzajímavější způsob využití vašich dat vymyslí někdo jiný,“ říká Rufus Pollock, ředitel Open Knowledge Foundation a jeden z hlavních propagátorů myšlenky otevřených dat. Ví, o čem mluví: Britové a Američané otevřeli data kolem roku 2010 a od té doby nabídli svým občanům statisíce datasetů. Vzniklo nad nimi nespočet aplikací. Přesný počet aplikací, uspořené peníze nebo počet nových byznysových příležitostí je, podobně jako u jiných inovací, nesmyslné měřit. Existují jednotlivé případové studie; když například Dánové zveřejnili registr adres, mluvilo se o ušetřených miliardách eur na straně státní správy a vydělaných miliardách na straně firem. Mění se ale samotná struktura trhu, takže logika „ušetřené“ vs. „vydělané“ nikam nevede. Otevřená data vytvořila množství nových příležitostí na obou stranách. Konkrétní aplikace ukazují samotné katalogy otevřených dat: briský (data.gov.uk) nebo americký (www.data.gov).
K Anglosasům se brzy přidalo silně elektronifikované Estonsko, ale i země třetího světa – Brazílie, Indie nebo Keňa. Ty cítí příležitost částečně dotáhnout rozvinuté země, která není drahá. Případ Keni, která přeskočila období počítačů a míří od papíru rovnou k mobilům, je zajímavý i sociologicky, o tom ale někdy jindy. Česko je – stejně jako v mnoha jiných věcech, kde je potřeba dlouhodobé uvažování – lehce pozadu. Před dvěma lety sice místopředsedkyně vlády Karolína Peake slíbila účast na mezinárodní iniciativě Open Government Partnership a otevření desítky vládních datasetů, pak ale zmizela ze scény i se svým závazkem. Přesto se občas některé ministerstvo uvolí otevřít alespoň část své agendy. Na lokální úrovni je situace ještě horší, kromě Prahy se zatím k otevřeným datům přihlásila maximálně desítka měst a reálně je otevřel pouze Děčín.
Když levá neví, co dělá pravá
Otevření dat přitom úřadům evidentně přináší něco, co nutně potřebují. Když jsem se před dvěma lety na konferenci Chytřejší stát vyptával dlouholetého britského komisaře pro otevřená data Andrewa Stotta, jak se mu povedlo nastartovat nový trend ve své zemi, vysvětlil mi – s pohledem lišky podšité – že potřeba vzešla od samotných úřadů. „Zeptal jsem se třeba ministra zdravotnictví, kolik ho stojí určitá nemocnice,“ vysvětloval mi nadšeně. „Nevěděl, a od té doby byl na mé straně.“
Podobná situace je logicky i u nás. Je málo ministerstev nebo radnic, kde by levá ruka věděla, co zrovna dělá pravá. Těm, kteří mají rozhodovat, obvykle chybí základní data a pokud je mají, málokdy chápou, co říkají. A bez toho je obtížné rozhodnout se racionálně. Otevření dat přitom skoro nic nebrání. Největší překážka je psychologická. Zveřejnění dat – a to stejné platí pro smlouvy – vyžaduje ochotu zbavit se pevné kontroly nad agendou svého úřadu a masochisticky pozvat všechny, kdo se vám chtějí dívat pod ruce. Je to obtížné, ale přínosné a nakonec i příjemné.
Nemalou výhodou otevřenosti může být i snížení administrativní zátěže při odpovídání na žádosti o informace. Známá „stošestka“ přitěžuje hlavně právníkům, ale čas od času doputuje i na ty nejzapadlejší odbory. Ministerstva to řeší tím, že se snaží žádosti odmítat už na úrovni tiskového oddělení, což není příliš čisté. Zveřejnění dat může právě agendy kolem infožádostí ubrat – čím více je toho online, tím méně zbývá k doptávání.
První zveřejnění chvíli trvá, aktualizace je hned
Zveřejnění dat přitom není žádný děsivý proces, který by zablokoval úřad na dny až týdny práce, jak je občas slyšet ze sněmovny. Reálně je k němu potřeba rozhodnutí shora, souhlas právníka a spolupráce IT oddělení. Úplně na úvod je nutné zjistit, jaká data vůbec úřad má, ale to většinou IT odbor „nějak“ ví. Spousta datasetů už ostatně zveřejněná je – visí na webu, často v zapadlém zákoutí, kam nikdo nechodí. Šikovný programátor je přesto schopný tahle data „oscrapovat“; napíše si robota, který z webu postahuje řádek po řádku a ze struktury HTML data vytěží.
Před prvním zveřejněním dat by měl datasety posvětit právník. Ani tady ale obvykle není tolik práce, většina datasetů se s osobními údaji ani obchodním tajemstvím nesrazí.
Posledním krokem je domluvit se, kdo a jak často má data aktualizovat. Data je totiž nutné zveřejňovat s určitou periodicitou, obvykle měsíční nebo čtvrtletní. Většinu toho zvládnou skripty, takže aktualizace nemusí zabrat víc než několik minut. Ta část dat, která má být stále aktuální, jako jsou třeba souřadnice vozů MHD, se zrcadlí přímo z IT systému úřadu. Na překážky, které vás při zveřejňování dat můžou potkat, se snaží odpovídat brožura Jak otevírat data (www.otevrenadata.cz).