pátek 28. února 2014

Základy ontologií 3 - Klasifikace ontologií (úvod), Členění podle „historických paradigmat“

Následující odstavce vychází z dokumentu (Svátek, 2002) a dalších přímo citovaných publikací. Až na drobné změny byl převzatý z disertační práce autora (Čerba, 2012). Důvodem je fakt, že na poli členění ontologií nedochází k žádným významným změnám, ale na druhou je z hlediska poskytnutí ucelené informace vhodné tuto pasáž uvést a nikoli na ni pouze odkázat.


Historickým paradigmatem se myslím především způsob využití ontologie a z něj vycházející forma. Rozlišují se tři základní typy ontologií:

  • Terminologické či lexikální ontologie, které lze ztotožnit s pokročilými tezaury, používanými v knihovnictví a dalších oborech orientovaných na textové zdroje. Jejich charakteristickým rysem je ústřední role termínů, které již nejsou dále (formálně) definovány. Používané relace mají z velké části taxonomický charakter (vymezení vztahu obecnějšího a speciálnějšího termínu neboli vztah is-a), vedle toho bývá vyjádřena synonymie, meronymie (vztah termínů označujících celek a jeho část) a další relace obecného charakteru. Nejznámější terminologická ontologie je nepochybně lingvisticky a lexikologicky zaměřený WordNet (http://wordnet.princeton.edu/). Z něj byl odvozen např. Sensus (http://www.isi.edu/natural-language/projects/ONTOLOGIES.html) nebo vícejazyčná varianta EuroWordNet (http://www.illc.uva.nl/EuroWordNet/) nebo EuroVoc (http://eurovoc.europa.eu/drupal/). Podle (Benda, 2005) patří tento typ (označovaný jako taxonomie) a typ číslo tři (množina odvozovacích pravidel) mezi nejtypičtější ontologie. 
  • Informační ontologie jsou rozvinutím databázových konceptuálních schémat. Hrají roli nadstavby nad primárními (strukturovanými, např. relačně-databázovými) zdroji, pro které zabezpečují jednak konceptuální abstrakci potřebnou pro pojmové dotazování, jednak vyšší úroveň kontroly integrity než běžné nástroje. 
  • Znalostní ontologie navazují na výzkum v oblasti reprezentace znalostí v rámci umělé inteligence. Ontologie jsou zde chápány důsledně jako logické teorie, a jejich vazba na reálné objekty (instance) je oproti informačním ontologiím relativně volná. Třídy (koncepty) a relace jsou systematicky definovány prostřednictvím formálního jazyka. 

Čerba, O. (2012). Ontologie jako nástroj pro návrhy datových modelů vybraných témat příloh směrnice INSPIRE. Dissertation, Univerzita Karlova v Praze.

Svátek, V. (2002). Ontologie a WWW. Praha: Vysoká škola ekonomická.

pondělí 24. února 2014

SGG - 3. týden

Ve třetím týdnu se tak trochu vrátíme zpátky. Hlavním tématem jsou prostorová data, jejich definice, terminologie a především vlastnosti. Podívejte se především na prezentace Vlastnosti prostorových dat a jejich harmonizace a text Popis dat pro geoinformační technologie (obojí je uložené ještě na starých stránkách předmětu). A také si zopakujte všechno, co víte o prostorových datech a informacích z jiných předmětů.
Z úkolů je aktuální především sepisování základní představy o projektu (viz post z minulého týdne).
Paralelně také můžete začít řešit další krok, kterým je sběr dat pro vaše analýzy. Výstupem by měla být tabulka nebo strukturovaný text, který bude obsahovat základní informace o datech (název datové sady, URL ke stažení, licence, rok vzniku nebo poslední aktualizace, formát, co data obsahují za informace, případně další informace). Kromě informací doplňte ještě poznámku, která bude stručně popisovat jak a proč chcete daná data využít (jde zatím jen o představy, které samozřejmě budete moci kdykoli změnit). Každá skupina by měla odevzdat cca 50 datových zdrojů. Termín pro odevzdání je 15.3. Za zpracovaný přehled dat můžete získat až 7 bodů.

Informační zdroje pro kartografy

Sice to avizoval seznam RSS kanálů na tomto blogu, ale protože se jedná o velice zajímavý dokument, raději na něj upozorňuji ve zvláštním příspěvku. Komise pro vzdělávání (ICA) vydala seznam 83 skvělých odkazů na kartografické zdroje. Takže až budete psát bakalářku, diplomku nebo seminárku, víte kde můžete hledat.

pátek 21. února 2014

Brainstroming

V minulém roce jsme se studenty používali techniku brainstormingu pro vymýšlení potřebných témat datových sad a nápadů pro analýzy v rámci zápočtového úkolu v předmětu SGG. Pokud byste si chtěli tuto techniku ve skupině nebo dokonce napříč skupinami vyzkoušet, doporučuji článek A Seven Step Plan for Effective Brainstorming.

středa 19. února 2014

Základy ontologií 2 - Definice ontologií

Tato podkapitola vychází z článku Doménová ontologie – nástroj pro harmonizaci prostorových dat (Čerba, 2011) a z disertační práce autora (Čerba, 2012).
První moderní definice ontologií (jako součástí informatiky a nikoli filozofie) vznikla v roce 1993 a jejím autorem je Thomas Gruber. Ten definuje ontologie jako „explicitní specifikace konceptualizace“ (Gruber, 1993). Tato definice byla rozšířena nebo různě modifikována mnoha následovníky T. Grubera. Například Willem Nico Borst ve své disertační práci (Borst, 1997) ontologii považuje za „formální specifikaci sdílené konceptualizace“.
Obě definice jsou díky použití neobvyklých pojmů dosti těžkopádné. Co vlastně jednotlivé výrazy v obou definicích znamenají?
Explicitní – výslovný, přímý, jasný, zřetelný; otevřeně, přímo vyjádřený.
Formální – vyhovující požadavkům, předpisům; zdůrazňující formu.
Specifikace – přesný výčet, podrobnější rozepsání položek, zpřesnění, upřesnění.
Sdílený – určený pro veřejné užívání.
Konceptualizace – systém pojmů a vztahů mezi nimi, přičemž obojí lze chápat jakkoli nikoli univerzální, ale kontextově závislý systém.

Pokud bychom se obě výše uvedené definice pokusili vyjádřit českými slovy, pak můžeme ontologii charakterizovat jako „jasný, zřetelný a přímo vyjádřený přesný výčet pojmů daného systému, včetně vztahů mezi těmito pojmy“.
Klíčový termín konceptualizace je ovšem mnohem širší a kromě jiného znamená „způsob jak člověk chápe svět a jak ho reprezentuje“, přičemž koncepty mohou představovat prvky jako například parcela, dálnice nebo jezero (Bittner, 2004). Podle Fisseha, 2010 se konceptualizace skládá z identifikace a defice konceptů a také vazeb mezi nimi. Příkladem takové konceptualizace může být definice konceptů "město" a "řeka", které jsou propojeny vazbou "řeká protéká městem".
Z hlediska přesného vyjádření vlastností ontologií je nesporně důležitý také přívlastek „formální“, který vyjadřuje nejen určitou preciznost, explicitu a jednoznačnost, ale především možnost strojového (automatizovaného) zpracování. R. Poli (Poli, 2002) důsledně rozlišuje přívlastky formální a formalizovaný (čímž automaticky odmítá jiné než formální ontologie, viz dělení ontologií). Ontologie ve smyslu IT by měla být nejen formální (tj. měla by obsahovat jasně definované pojmy – sémantiku), ale také formalizovaná – jinými slovy výše zmíněné pojmy musí být zapsané pomocí přesně definovaného formátu (jazyka) – syntaxe. Pozměněná definice ontologií by mohla znít „formální a formalizovaná specifikace sdílené konceptualizace“.
Množina pokusů o definování ontologií je však mnohem šiřší. Jako příklad je možné uvést rozsáhlejší a komplexnější definici, která navíc hovoří o modelování reálného světa, nabízenou v publikaci Methodology of Ontology Building (Číhalová et al., 2009) – „Ontologie je strukturovaná množina konceptů, integritních omezení, která stanovují jejich vzájemné vztahy, a pravidel. Ontologie zachycuje popsanou oblast tak, že může být sdílena širší komunitou zainteresovaných uživatelů tak, že podporuje korektní modelování reálného světa, čímž přispívá k sémantické interoperabilitě a automatickému odvozování ve znalostních systémech.“
Dokumenty související se směrnicí INSPIRE (například D2.5, 2009) používají definici ontologií publikovanou také na internetové encyklopedii Wikipedia – „representation of a set of concepts within the domain and the relationships between those concepts“. Další definice jsou k dispozici například v publikacích (Gaševič et al., 2009, s. 47-48), (Crofts et al., 2002) a jiných.Bittner, T. (2004). Geo-semantics and ontology – Bridging AEC and GI systems. Direction magazine.

Borst, W. N. (1997). Construction of engineering ontologies for knowledge sharing and reuse. Universiteit Twente.

Crofts, N., Le Beuf, P., Odile, A. (2002). ELAG Presentation. Ontologies. Semantic Web and Libraries. 26 Library Systems Seminar, Rome, 17.-19.4.2002

Čerba, O. (2011). Doménová ontologie - nástroj pro harmonizaci prostorových dat. Geodetický a
kartografický obzor, 57/99(11), pp.269–276.

Čerba, O. (2011). Ontologie jako nástroj pro návrhy datových modelů vybraných témat příloh směrnice INSPIRE. Dissertation, Univerzita Karlova v Praze.

Číhalová, M., Ďuráková, D., Hrubá, L., Rapant, P. (2009). Methodology of Ontology Building. In Advances in Geoinformation Technologies. Horák, P., Halounová, L., Kusendová, D., Rapant, P., Voženílek, V. (eds.). 1. vydání. VŠB – Technical University of Ostrava, Ostrava, 2009. 178 s. ISBN 978-80-248-2145-0.

D2.5 Drafting Team "Data Specifications" Generic Conceptual Model. Version 3.2, 2009.

Fisseha, F. (2003). The basics of ontologies–exploratory project. In Fourth Nordic Agricultural Ontology Service (AOS) Workshop.

Gasevic, D., Djuric, D., Devedzic, V., & Selic, B. (2006). Model driven architecture and ontology development (Vol. 1). Heidelberg: Springer.

Gruber, T. R. (1993). A translation approach to portable ontology specifications. Knowledge acquisition, 5(2), 199-220.

Poli, R. (2002). Ontological methodology. International Journal of Human-Computer Studies, 56(6), 639-664.

úterý 18. února 2014

Průvodce předmětem

Dokument Průvodce předmětem SGG byl aktualizován. Doplněna byla penalizace za pozdní odevzdání zápočtových úkolů.

pondělí 17. února 2014

SGG - 2. týden

Já je studijní náplň tohoto týdne? Rozdílná pro studenty kombinované a prezenční formy studia. Ti první by si měli projít materiály týkající se harmonizace dat, které jsme se studenty prezenční formy probrali minulý čtvrtek. Pro druhou skupinu jsou určeny materiály týkající se ontologií.

Co se týká úkolů, tak pro následující týdny jsou aktuální hned tři (o prvních dvou jsem informoval již minulý týden):


  1. Do diskuze pod tento příspěvek napište připomínky ke kurzu (nápady, náměty, očekávání...). Získáte hned dva body (za smysluplné poznámky). Termín je 19.2.2014.
  2. Do diskuze pod tento příspěvek také napište rozdělení do skupiny (jména členů skupiny) a výběr ORP. Opět získáte 2 body (každý ze členů skupiny), termín je 23.2.2014.
  3. Každá skupina zašle do 1.3.2014 prezentaci, která představí zápočtový projekt. Jak jsem avizoval na přednáškách, mělo by se jednat o úvod. To znamená očekávám, že se dozvím následující informace - strukturu projektu, vaše plány, úvodní hypotézy, motivaci, očekávání a podobně. Plný počet bodů, tedy 7 bodů, bude uděleno za kreativní, nápaditou, věcnou a konkrétní prezentaci (a samozřejmě také za správnou z hlediska obsahu i z hlediska zásad pro tvorbu prezentací).


Poznámka na závěr: Během týdne ještě doplním do Průvodce předmětem penalizaci pozdní odevzdání úkolů.

Knihy pro kartografy

Chcete trávit dlouhé zimní večery nad knihou a nemůžete vybrat? Zkuste se inspirovat v krátkém článku Creative Cartography: 7 Must-Read Books on Maps. On je vůbec zajímavý celý blog Brain Pickings.

pátek 14. února 2014

Nemáte ještě zápočet?

Nemáte ještě zápočet? Pak mám pro vás dvě zprávy - špatnou a dobrou.

Špatná zpráva - vzhledem k začátku nového semestru a dalším aktivitám bohužel nemohu věnovat tolik času na hodnocení zápočtů, které měly být hotové v prosinci. Proto prosím očekávejte odpovědi spíše v řádu týdnu než dnů.

Dobrá zpráva - to, že je poslední termín vypsaný na pondělí 17.2., neznamená, že nebudou vypsané další termíny. Záleží samozřejmě na počtu studentů, kteří budou mít zájem. Ale rozhodně oba předměty (POK a TKA) dozkoušíme. Další termín bude vypsán na 3.3.

Sněžka

Určitě jste už stačili zaznamenat mediálně vděčnou diskuzi, kolik vlastně měří Sněžka. Informace je spojená s efektními titulky typu Sněžka „vyrostla“, vrchol je ve výšce 1603,3 metru nad mořem nebo otázkami nepřipravených moderátorů typu „nerozhoduje o výšce hory nadmořská výška trigonometrického bodu“.

Zmatení však nejsou jen novináři, ale nejmenovaný pracovník zeměměřičského úřadu - cituji „...záleží na tom, jak se k tomu postaví kartografové...“. Pořád si říkám, že výška hory asi nezáleží na kartografech, ale na objektivním měření. To bych mohl jako kartograf říct, že Sněžka má 9000 metrů...

A to nemluvím ani o termínu „takzvané státní mapové dílo“ - co to je?
Když už někdo konečně píše o našem oboru, tak by měl trochu nastudovat fakta...

čtvrtek 13. února 2014

Základy ontologií 1

Protože jednou z částí předmětu SGG jsou také ontologie, bude v letním semestru vycházet krátký seriál, který objasní základy ontologií a jejich používaní v oblasti prostorových dat a informací. V jednotlivých článcích se postupně setkáte s definicemi ontologií, dělením ontologií a základními prvky ontologických systémů.
Články budou vycházet z mé disertační práce a také připravovaného textu na téma role ontologií v procesu integrace prostorových dat a informací.

Začneme úvodem....

Do světa informačních technologií ontologie pronikají v souvislosti s pokusy o co možno nejvěrnější popis reálného světa pomocí datových struktur. Termín ontologie se v oboru informačních technologií používá v mnoha významech, často dokonce jako náhrada již existujících a zavedených výrazů, například se často ztotožňují významy pojmů „ontologie“ a „sémantika“ (Poli, 2002).
Tato kapitola se nejdříve zabývá teoretickými základy ontologií – definováním pojmu „ontologie“, historií a vývojem ontologií, členěním ontologií, způsoby využití a základními prvky ontologií. V druhé části se pak věnuje praktickým aspektům tvorby ontologií jako jsou konceptualizace, volba formátů pro zápis ontologií, syntaxe nebo základní metodiky.


Poli, R. (2002). Ontological methodology. International Journal of Human-Computer Studies, 56(6), 639-664.

středa 12. února 2014

Zemřel Roger Tomlinson – otec GIS

Normálně zprávy z GISportal.cz publikujeme v sekci Kartografické a GIT blogy, ale tahle zpráva si zaslouží samostatný příspěvek.

pondělí 10. února 2014

SGG - 1. týden

Vítejte v prvním týdnu letního semestru.

Na začátek připomínám dvě hlavní zásady pro úspěšné absolvování předmětu KMA/SGG aneb Socioekonomická geografie pro geomatiku.

  1. Pečlivě si pročtěte dokument Průvodce předmětem, najdete v něm odpovědi na mnoho otázek týkajících se sylabu, zápočtu nebo zkoušky.
  2. Sledujte tento blog, budou na něm uveřejňovány veškeré informace a novinky.
Přednáška v prvním týdnu bude zaměřena na úvod do předmětu (ujasníme si nejasnosti z Průvodce předmětem), harmonizaci prostorových dat a Linked Open Data. Nové prezentace jsou umístěny v sekci Studijní materiály, starší pak na stránkách předmětu SGG na gis.zcu.cz.

Co se týká úkolů, tak pro následující týdny jsou aktuální hned dva:

  1. Do diskuze pod tento příspěvek napište připomínky ke kurzu (nápady, náměty, očekávání...). Získáte hned dva body (za smysluplné poznámky). Termín je 19.2.2014.
  2. Do diskuze pod tento příspěvek také napište rozdělení do skupiny (jména členů skupiny) a výběr ORP. Opět získáte 2 body (každý ze členů skupiny), termín je 23.2.2014.

Další vzdělávací zdroje

V minulém příspěvku jsem odkazoval na kurz Map and geospatial revolution na protálu Coursera. Coursera však není jediný nástroj pro další online vzdělávání. Nenajdete-li vhodný kurz na Courseře, podívejte se na rozcestník Mimo školu nebo na NovoEd.

pátek 7. února 2014

Mapy a geoprostorová revoluce

Coursera je úžasný webový portál, na kterém publikují své kurzy přední světové univerzity především z USA. Kurzy jsou zadarmo, výhradně online, každý týden dostanete nové materiály (texty, videa, prezentace) a úkoly (texty, eseje). U každého kurzu je většinou napsaná časová náročnost a znalosti, které musíte mít před jeho absolvováním. A na konci po úspěšném absolvování získáte certifikát.
Proč to všechno píšu? Protože 30. dubna začíná kurz Maps and the Geospatial Revolution, který z Pennsylvania State University (PennState) vede Anthony C. Robinson.
Pokud si kurz vyzkoušíte, napište mi do diskuze pod článek vaše zkušenosti a postřehy.

čtvrtek 6. února 2014

SGG: Konzultace pro studenty dálkového studia

Konzultace pro studenty dálkového studia bude na základě přání studentů v pátek 14.2. od 16:00 v učebně UL-608.

pondělí 3. února 2014

Digital Atlas of Roman and Medieval Civilization

Dnes posílám upozornění na zajímavý digitální atlas. historických (nikoli starých) map. Z názvu je vidět, že se atlas zaměřuje na období Římské říše a středověku. Jak uvidíte  v záložce Maps, jedná se vlastně o typickou webovou mapovou aplikaci s jednoduchými ovládacími prvky a možností zapínání a vypínání vrstev. Zajímavý je i bohatý doprovodný materiál.