pondělí 31. března 2014

SGG - 8. týden

Hlavním tématem tohoto týdne budou sídla a osídlení (což koresponduje i s tématem seminární práce). Prezentace na gis.zcu.cz vysvětlují geografii sídel obecně, geografii města (především různé vlastnosti a vývojové fáze městského osídlení) a také tzv. teorie lokalizace neboli to jakým způsobem jsou sídla rozmístěna a diferencována v závislosti na poskytovaných a požadovaných službách.
Budu se samozřejmě těšit na vaše metodiky. Jejich bodové ohodnocení se objeví v příslušné tabulce, komentáře na blogu nebo jako poznámky v tabulce. Hodnocení očekávejte zhruba do týdne, abyste mohli začít pracovat na vlastním hodnocení.

Jsme za polovinou semestru. Už jste si zřejmě přivykli tomu, jak předmět SGG probíhá, ale stále je čas na změny. Máte-li nějaké nápady, připomínky nebo komentáře, diskuze (například pod tímto příspěvkem) je vám k dispozici.

Linking Geospatial Data - poznámky

Hlavní událostí prvního dne byly bez pochyby dvě prezentace, které nezávisle na sobě a pomocí atraktivních vizualizací oznamovaly sňatek mezi prostorovými daty (ve jedné prezentaci symbolizované pomocí Miss Globe) a sémantickými a linked daty (Mr. Globe). Samozřejmě zaznělo i mnoho (bohužel převážně teoretických) důvodů, proč je tento svazek dležitý pro obě strany.
Mezi další zajímavosti patřily například australské ontologie ACORN-SAT (klimatologie) a ad-hoc (vodohospodářství), zmínka o transformaci INSPIRE registrů do RDF, ukázky projektů ARe3NA, SmartOpenData, Melodies nebo různé standardy jako stRDF, RDFi, NeoGeo a další.

Druhý den konference byl především ve znamení aplikací a diskuzí. Aplikace založené na LOD představili například zástupci BBC, Ordnance Survey (projekt RAGLD), administrativy Skotska (jednotlivé kroky transformace relačních databází do LOD) i Walesu (je vidět, že Británie je obecně z hlediska zpřístupňování a otevírání dat na špičce). Ale zajímavé byly i nástroje jako Geohazard (integrující služby nabízející data o povodních, zemětřeseních, tsunami a podobně z celého světa (data jsou zatím sbírána izolovaně podle oblasti, tématu nebo konkrétní katastrofy) nebo nástroj pro vizualizaci LOD pro operční systém iOS. Nejde nezmínit ani vizuálně zajímavé prezentace o city SDK a Open Green Space.
Zajímavá byla i poznámka, že bude nutné data uchovávat ve více podobách / formátech (případně je do nich efektivně transformovat), protože jeden formát je vhodný pro reprezentaci dat (modelování), zatímco jiný pro jejich efektivní zpracování nebo vizualizaci.
Závěrečné diskuze se pak odehrávaly v tematicky zaměřených kruzích, kdy si každý účastník mohl vybrat, zda ho více zajímá problematika vztahu SDI a LOD, slovníky používané v geoaplikacích, vztah LOD a HTML 5, případně další témata.
Prezentace jednotlivých účastníků budou vystaveny na webu, takže mohou sloužit jako velice důležité studijní materiály nebo jako podklady pro odborné práce.

Poznámka: Příspěvek jsem kopíroval ze svých off-line poznámek, proto neobsahuje žádné odkazy. Ale Google nebo jeho konkurenti jistě pomohou.

pátek 28. března 2014

ePSI Webinar: Open Electoral Data

11. dubna se uskuteční webinář o datech týkajících se výsledků voleb. Více podrobností najdete na stránce ePSIplatform a následných odkazech.

středa 26. března 2014

Základy ontologií 7 - Prvky ontologií (úvod)

Na úvod této kapitoly je potřeba poznamenat, že ontologie pracují s konceptem Open World Assumption. Tento koncept lze vyjádřit českým výrazem "co není zakázáno, je povoleno". Jinými slovy, zatímco systémy užívající tzv. Close World Assumption (například relační databáze) figurují tak, že do dané skupiny zařadí pouze to, co je nějakým předpisem povoleno a každý jiný prvek je brán jako chybný. V případě ontologických systémů je množina prvků spadající do daného konceptu víceméně nekonečná, pokud není explicitně omezená (více viz axiom pokrytí). Přístup Open Wolrd Assumption vyžaduje explicitní vyjádření neexistence (nikoli existence) daného objektu. Jinými slovy „vše existuje“, pokud není uvedeno opačné tvrzení.
Dále je třeba připomenout, že pro teorii ontologických systémů je charakteristický velký počet synonym označujících jednotlivé prvky. V této práci budou přednostně používány pojmy,

  • které jsou součástí specifikace jazyka OWL 2 (OWL 2, 2009), 
  • které se jsou používány v editoru ontologií Protégé, který patří mezi nejpoužívanější programy tohoto typu na celém světě, 
  • které se v dané souvislosti vyskytují nejčastěji a mají svůj protějšek nebo význam v českém jazyce, 
  • které se u jiných jazyků a formátů mohou lišit, ale princip (propojování konceptů pomocí vlastností) zůstává stejný. 

V sekci Úvod bylo zmíněno, že tento text by měl rozšiřovat poměrně úzkou nabídku výukových materiálů na téma ontologie v doméně geomatiky a geoinformatiky. Proto tato kapitola je pojata tak, že může být využita samostatně pro seznámení se se základy ontologických systémů obecně, přičemž veškeré příklady se týkají prostorových dat a informací.



OWL 2 Web Ontology Language. Document Overview. W3C Recommendation 27 October 2009.

pondělí 24. března 2014

Další přírůstek do sbírky chyb na mapách

Kdo by ještě dnes čekal, že se na mapách Berlína objeví Adolf-Hitler-Platz? Více v článku Na mapách Google se v Berlíně objevilo Hitlerovo náměstí.

SGG - 7.týden

Sedmý týden (skoro polovina semestru) je ve znamení pokračování práce na zápočtovém úkolu. Proto v tomto týdnu nebudu publikovat žádné nové přednášky. Je to už poslední ze dvou takto vyhrazených týdnů, proto se ho snažte plně využít.
Co se týká úkolů, tak v současné době je aktuální především metodika. Chtěl bych vás upozornit, že při jejím hodnocení už budu rozhodně přísnější než v předchozích případech. Jak úvodní představy, tak sběr dat měl sloužit především k tomu, abyste o seminární práci začali přemýšlet. Ale metodika je skutečně klíčová. Proto budu rád za jakékoli dotazy před odevzdáním (samozřejmě za konkrétní dotazy, nikoli požadavky typu "překontrolujte naši metodiku", ty budu ignorovat). Rozhodně se ještě podívejte na data a zkuste i najít jiné metodiky, které se zabývají podobným problémem (nejde o to, je opsat, ale nechat se inspirovat). Určitě se podívejte na případné crowdsourcingové projektu hodnotící kvalitu života, v Česku se hodnotí kvalita života v jednotlivých krajích a určitě existují podobné statistiky i na úrovni EU. Snažte se nevymýšlet již vymyšlené, ale přizpůsobit to obrazu svému.

pátek 21. března 2014

Linked Data for Environmental Sector

Neporizuměli jste úplně přístupu a principu Linked Open Data a máte zhruba hodinu volného času? Pak si sedněte ke svému počítači a sledujte video Linked Dat for Environmental Sector. Seznámíte se se základy LOD a uvidíte i zajímavé příklady.

středa 19. března 2014

Kartografie zase v médiích...

...bohužel v souvislosti se smutnými událostmi na Ukrajině...Kartografové v akci: Kreml už maže Krym z mapy Ukrajiny. A co české atlasy? 

Základy ontologií 6 - Členění ontologií podle míry komplexnosti

Na základě míry komlexnosti podle Fisseha, 2003 existují dva základní typy ontologií - light-weight ontologie a heavy-weight ontologie. V prvním případě se jedná o strukturu konceptů na základě vazby is-a (viz níže) a některých jednoduchých vztahů. Heavy-weight ontologie přidávají další pokročilé konstrukty jako například logické axiomy, omezení počtu nebo uzavřené množiny hodnot. Druhý případ je vhodnější pro potřeby odvozování nových informací pomocí reasoningu.



Fisseha, F. (2003). The basics of ontologies–exploratory project. In Fourth Nordic Agricultural Ontology Service (AOS) Workshop.

SGG - hodnocení prezentace dat

V tabulce jsou již dopsané body za sesbírané a popsané datové sady. Je vidět, že se všechny skupiny zhostily svého úkolu podobným způsobem a výsledky se liší jen v drobných nuancích. Jedná se například o nefunkční některé linky, chybějící zdůvodnění u některých dat, kvalitu prezentace dat (tabulka s nezalomenými řádky - je důležité, co odevzdáte, ale také jak to vypadá).
Nejvíce se mi líbila prezentace ORP Blovice, kde bylo k datům přistupováno nejsystematičtěji. Pro následující kroky (metodika a vlastní analýzy) rozhodně nezůstávejte u dat, která jste našli. Jednak je jich celkem málo (50 datových sad dosáhla jedna skupina) a jednak tam z mého pohledu některá data chybí (například více demografických, ekonomických a politických statistik z ČSÚ nebo například radonové či jiné riziko). A rozhodně se podívejte i na soubory "konkurenčních" skupin.

pondělí 17. března 2014

SGG - 6. týden

Tento týden se dostáváme k demografii, geo-demografii a geografii obyvatelstva. Z vlastní zkušenosti musím říct, že tato tématika je poměrně rozsáhlá a složitá. Na webu je pouze jedna prezentace Demografie a geografie obyvatelstva. Prostudujte ji pečlivě a na případné nejasné termíny se zeptejte v diskuzi pod článkem nebo se je snažte vyhledávat na internetu. Terminologie demografů je totiž poměrně specifická.
Ti z vás, kteří již v minulých létech absolvovali tematickou kartografii, si jistě vybaví i problematiku vizualizace dat týkajících se obyvatelstva (kartogram vs. jiné metody). O tom se ještě zmíníme ve volební geografii.
Pokud budete chtít do problematiky demografie proniknout pomaleji, pusťte si například rozhovory s demografy na Radiožurnálu (Daniel Hůle, Jitka Rychtaříková). Pokud naopak budete chtít proniknout hlouběji, doporučuji web některé z vysokých škol zabývajících se demografií (viz prezentace) nebo se spojte s vaší bývalou spolužačkou Barborou Musilovou, která se po absolvování bakalářského studia geomatika rozhodla pokračovat v Praze na demografii.

Úkoly na další týdny znáte. Co neznáte, je hodnocení posledního dodaného úkolu. To se objeví během tohoto týdne.

Edudemic

Dnes posílám obecný odkaz na blog o vzdělávání. Témata sice nejsou přímo geomatická, ale předpokládám, že mohou být nápomocná ve výuce.

pátek 14. března 2014

Mezinárodní studium kartografie

Mezinárodní studium kartografie může být zajímavá zkušenost. Pokud o něčem podobném uvažujete podívejte se na nové webové stránky programu.

čtvrtek 13. března 2014

Cookbook for translating Data Models to RDF Schemas

Cookbook for translating Data Models to RDF Schemas je velice jednoduchý (až schématický) návod pro převod tradičních datových modelů do RDF podoby. Na webových stránkách najdete jak text (cca 40 stran), tak krátkou prezentaci (ta je pro začátek ideální).
Berte tento materiál jako výukovou pomůcku pro zkoušku ze SGG.

středa 12. března 2014

Základy ontologií 5 - Členění ontologií podle předmětu formalizace

Nejobecnější variantou ontologií jsou top-level (upper-level, generické) ontologie. Ty popisují obecné zákonitosti, prvky a jevy ve velice obecných rovinách (například problematika času, vzájemné pozice objektů /topologie/, skladby objektů z částí /mereologie/ a podobně) bez ohledu na kontext a způsob využití (někdy dokonce napříč různými doménami). V praxi se jedná například o lexikální databáze na principu výkladových slovníků. Příkladem může být WordNet (odkaz), SUMO – Standard Upper Merged Ontology (http://suo.ieee.org/SUO/SUMO/index.html). Ontologie podtypu common-sense („přirozeného rozumu“) mohou naopak obsahovat řadu velmi specifických, avšak relativně doménově-nezávislých znalostí, které lidé používají v každodenním životě. Nejznámějším příkladem je Cyc (http://www.cyc.com/).
Doménové ontologie jsou typem daleko nejfrekventovanějším. Jejich předmětem je vždy určitá specifická věcná oblast, vymezená šířeji (např. celá problematika medicíny, geografie nebo fungování firmy) či úžeji (problematika určité choroby, pokryvu zemského povrchu, poskytování úvěru apod.). Veškeré definice pojmů a vazby jsou orientované. Příklady doménových ontologií se širokým záběrem jsou Enterprise Ontology nebo Beer Ontology.
Jako úlohové ontologie jsou někdy označovány modely znalostních úloh a metod jejich řešení. Na rozdíl od ostatních ontologií, které zachycují znalosti o světě („tak, jak je“), se zaměřují na procesy odvozování. Mezi úlohy tradičně zachycené pomocí takových znalostních modelů patří např. diagnostika, zhodnocení („assessment“), konfigurace, nebo plánování.
Aplikační ontologie jsou nejspecifičtější. Jedná se o konglomerát modelů převzatých a adaptovaných pro konkrétní aplikaci, v ideálním případě zahrnující zpravidla doménovou i úlohovou část (a tím automaticky i top-level část). 

pondělí 10. března 2014

SGG - 5. týden

Jak jsem avizoval před týdnem, právě dnes začíná část semestru věnovaná socioekonomické geografii. Předtím bych vás však chtěl ještě upozornit na webinář o RDF, o kterém jsem psal minulý čtvrtek. Myslím, že by pro studenty SGG mohl být velice zajímavý.
Z geografie nás tento týden čeká několik úvodních prezentací, které se zabývají problematikou geografie z hlediska systému věd a jejím vývojem, především s důrazem na socioekonomickou část. Konkrétně se jedná o tyto prezentace na gis.zcu.czStručný úvod do (nejen socioekonomické) geografieHistorie a stručný vývoj (nejen) socioekonomické geografie.
Začínáme relativně zvolna, proto věnujte také část času přípravě seminárních prací. Aktuální je především termín 15.3., kdy má být odevzdána prezentace dat (podrobnější informace viz post z minulého týdne).
Další část úkolu by měla být odevzdána do začátku dubna. Jedná se o metodiku výběru zájmového území. Představoval bych si prezentaci nebo textový dokument, kde bude velice podrobně vysvětleno (nejlépe ve formě navazujících kroků) - jaká data budete zpracovávat, jakým způsobem, co očekáváte za výsledek, jaká jsou rizika tohoto postupu, jak budou ošetřena a podobně. A samozřejmě nesmí chybět pečlivé zdůvodnění jednotlivých kroků. Metodika by měla vypadat jako algoritmus nebo recept, který by měl být znovu zopakovatelný a to i na jiném srovnatelném území. Za perfektní metodiku (nejen z hlediska obsahu, ale i formy) získáte až 10 bodů, ale především náskok ke zkoušce, kde se ústní otázky často týkají právě metodiky a jejího zdůvodnění.

Poslední odstavce se týkají hodnocení předchozího úkolu. Celkově jsem byl poměrně spokojený, což je vidět i z bodového ohodnocení, které se pohybuje na horní hranici.
Je zapotřebí si dávat pozor na binární kritéria. Jednak proto, aby nebylo odstraněno velké množství obcí, a také proto, aby kritéria měla skutečně silnou vypovídací hodnotu (například má smysl dávat jako binární kritérium přítomnost obecního vodovodu, když je v současnosti velice moderní budování vrtů a navíc je i finančně velmi výhodné a podobně).
Další poznámky se sice týkají především jednotlivých skupin, ale nejsou určeny pouze pro danou skupinu.

ORP Stod
  • Prezentace by měla splňovat požadavky na prezentace (v tomto konkrétním případě je potřeba vytknout příliš malé písmo a pochválit doplňují obrázky).
  • Je potřeba vyzdvihnout zmínku o případných problémech.

ORP Blovice

  • Hypotézy jsou poměrně obecné.
  • Cílem by asi nemělo být ideální území pro všechny, ale (i) několik území, která by mohla být vhodná pro specifické skupiny (samozřejmě velikost skupin by bylo vhodné prověřit demografickou analýzou). Například si dovedu představit, že pobrdské obce budou vhodnější pro seniory, ale má smysl se touto skupinou zabývat (je jich v ORP dostatečně velké množství, zaznamenáváte zvýšenou migraci u této skupiny apod.)?


ORP Sušice

  • Drobné terminologické nepřesnosti a překlepy.
  • Hypotézy jsou poměrně obecné.
  • Výsledkem by nemělo být město nebo obec, ale části obcí.

SmartOpenData (podruhé)

Posílám další informace o projektu SmartOpenData:

  • LinkedIn skupina projektu - zaregistrujte se, budete mít přístup k zajímavým diskuzím.
  • Prezentace jednoho z technologicky zaměřených partnerů.
  • A odkaz na zajímavou stránku Open Knowledge na ještě zajímavějším agregátoru informací Scoop.it (tato stránka zaintegrovala i článek o projektu SmartOpenData). 

pátek 7. března 2014

Základy ontologií 4 - Členění ontologií podle míry formalizace

Přestože je formalizace, jak již bylo řečeno, do jisté míry definiční vlastností ontologií, smysluplné využití mají i „ontologie“ zcela neformální či „semi-formální“ (i když podle podle publikace Poli, 2002 se jedná o korektní ontologie ve smyslu chápání informačních technologií, protože právě formálnost a formalizace je základní podmínkou pro efektivní automatizované zpracování). Jde zpravidla o glosáře, v nichž jsou jednotlivé pojmy vysvětleny přirozeným jazykem (volnou či strukturovanou formou). Ontologie vyjádřené ve formálních jazycích pak lze dále rozlišovat podle formálně-logických vlastností daného jazyka, jako je úplnost a rozhodnutelnost; tyto vlastnosti vycházejí z vlastností logického kalkulu, na kterém je jazyk založen, např. deskripční logiky. Většina formálních ontologií v sobě ovšem svým způsobem zahrnují i ontologii neformální. Jednotlivé konstrukty bývají totiž vybaveny dokumentačních položkou, umožňující vyjádřit obsah přirozeným jazykem  (například prostřednictvím definic udávaných jako anotační vlastnosti). 

čtvrtek 6. března 2014

Webinar: State-of-play RDF & PIDs

Zájemci o Linked Open Data mohou navštívit webinář na téma RDF, který je pořádaný v rámci projektu ARe3NA. Webinář se koná 13.3., více informací je k dipozici na příslušných webových stránkách.
Další navazující webinář je plánovaný na začátek května.
Vzhledem k tomu, že ve čvtrtek 13.3. budu právě na cestě, a tudíž se nebudu moci zúčastnit, byl bych velice rád za jakékoli postřehy v diskuzi pod tímto článkem.

úterý 4. března 2014

Linking Geospatial Data

Od zítra do čtvrtka se v Londýně koná významná akce nazvaná Linking Geospatial Data, kterou pořádají World Wide Web Consortium a Open Geospatial Consortium. V příštích týdnech se budu snažit poreferovat výsledcích workshopu na tomto blogu, ale již dnes máte možnost stažení jednotlivých příspěvků, prohlédnutí programu akce a hlavně sledování workshopu prostřednictvím Twitteru nebo IRC (veškeré informace jsou na webu workshopu v sekci Agenda).

pondělí 3. března 2014

SGG - 4. týden

I během semestru je potřeba si trochu odpočinout. Proto čtvrtý týden využijte k dokončení zápočtových úkolů (viz níže), k zopakování probraných témat (především ontologií, Linked Open Data a prostorová data obecně). Příští týden začne geografický blok.
Z úkolů je aktuální sběr dat pro vaše analýzy. Výstupem by měla být tabulka nebo strukturovaný text, který bude obsahovat základní informace o datech (název datové sady, URL ke stažení, licence, rok vzniku nebo poslední aktualizace, formát, co data obsahují za informace, případně další informace). Kromě informací doplňte ještě poznámku, která bude stručně popisovat jak a proč chcete daná data využít (jde zatím jen o představy, které samozřejmě budete moci kdykoli změnit). Každá skupina by měla odevzdat cca 50 datových zdrojů. Termín pro odevzdání je 15.3. Za zpracovaný přehled dat můžete získat až 7 bodů.
Věnujte tomuto úkolu zvláštní pozornost. Protože jeho zdárné splnění vám usnadní práci na vlastních analýzách.
V průběhu týdne se budu snažit opravit a v hodnocení předmětu publikovat bodové ohodnocení a komentáře k předchozímu úkolu.

What's The Plan

Výsledkem projektu plan4business, na které spolupracovalo také Oddělení geomatiky a dokonce i studenti bakalářského a magisterského studia, je portál What's The Plan. Na něm můžete najít obrovské množství užitečných informací a data především z oblasti územního plánování, statistiky a demografie z celé Evropy. Kromě možnosti tvorby přehledných reportů pro regiony, obce a budovy, je součástí aplikace i Thematic Map Viever - přehledný nástroj pro prezentaci nejrůznějších tematických map ve formě portálu.