dc.contributor.advisor | Snášel, Václav | cs |
dc.contributor.author | Horák, Zdeněk | cs |
dc.date.accessioned | 2012-10-22T07:34:05Z | |
dc.date.available | 2012-10-22T07:34:05Z | |
dc.date.issued | 2012 | cs |
dc.identifier.other | OSD002 | cs |
dc.identifier.uri | http://hdl.handle.net/10084/95073 | |
dc.description | Import 22/10/2012 | cs |
dc.description.abstract | Formální konceptuální analýza (FCA) je zavedenou metodou pro analýzu objekt-atributových dat. Je založena na chápání světa pomocí tzv. konceptů, které lze zjednodušeně popsat jako množiny objektů a jejich atributů. Jedním z hlavních výstupů FCA je konceptuální svaz, který umožňuje uspořádat všechny koncepty obsažené v datech. Zároveň také poskytuje možnost vizualizace dat a jejich struktury, umožňuje navigaci v této struktuře a obecně podporuje explorativní chování nad daty.
Nicméně aplikace FCA v různých oblastech není vždy zcela přímočará a metodologie použití se různí. V této práci je formální konceptuální analýza aplikována na tři různé typy dat – sociální sítě, obrázky a webové stránky. Všechny tyto typy se v posledních deseti letech staly terčem velkého zájmu. A zároveň všechny mohou představovat rozsáhlé složité struktury, do kterých není snadné nahlédnout. Použití FCA má tak v těchto situacích zcela jistě své opodstatnění.
Při praktických aplikacích FCA ovšem často zjistíme, že obdržené výsledky jsou příliš složité na to, aby se daly interpretovat či dokonce že vstupní data jsou na tuto analýzu příliš rozsáhlá. Vedlejším výstupem této práce je ilustrace rozsahu vstupních dat zpracovatelných pomocí FCA. Nicméně hlavním tématem této práce je redukce umožňující zpracování většího množství dat.
Přestože jsou v práci diskutovány různé přístupy, hlavní pozornost je věnována metodám rozkladu matic a jejich využití při zjednodušování vstupních dat. Tyto metody umožňují rozložení vstupních dat na části, přičemž zároveň poskytují informaci o důležitosti těchto částí. Díky tomu lze pro další zpracování vybrat pouze ty nejdůležitější. Tato práce ukazuje, že tento specifický typ zjednodušení vede k redukci konceptuálního svazu. Celý proces redukce je v práci studován pomocí obecných i specifických měr a ukazatelů. Chování redukce je částečně vysvětleno a práce představuje nový typ formalizace, který rozděluje koncepty do dvou skupin, přičemž každá z nich v průběhu redukce vykazuje odlišné chování. Tento pohled na koncepty má potenciál pro další analýzu.
Tato práce obsahuje stručný přehled objekt-atributových dat a jejich škálování, úvod do formální konceptuální analýzy a základy tří metod rozkladu matic – Singulární rozklad, NMF a SDD. Součástí práce jsou informace o historii a vývoji zmíněných metod a příbuzných přístupů. Pro ověření výsledků byly využity kvantitativní míry a ukazatele z různých oblastí. Jmenovitě – obecné míry jako entropie, normalizovaná korelační dimeze a Lorenzovy křivky a specifické míry formální konceptuální analýzy jako je stabilita konceptů a další. Atributové implikace – jako další typ výstupu FCA – jsou také diskutovány. | cs |
dc.description.abstract | Formal Concept Analysis (FCA) is well known method for object-attribute data analysis. It is based on understanding the world in terms of concepts which can be simply described as sets of objects and their attributes. One of the main FCA outputs is the concept lattice, which organizes all concepts present in the analyzed data and allows the visualization of the dataset, navigation within particular subsets of the dataset and generally supports the exploration of the data.
However the application of FCA in various fields is not always straightforward and the methodology of the usage differs. In this thesis the Formal Concept Analysis is applied on three different types of data - social networks, images and web pages. All of these types have become hot topics in the last decade. And all of them may represent large complex structures which can be difficult to inspect. The usage of FCA may be clearly helpful in this situation.
But when it comes to practical applications of FCA, we often find that the obtained results are too complicated to interpret or the input data may be too large to even perform the analysis. As a secondary output of this thesis we may see the range of input data which is processable by the FCA. However the main topic of this thesis is the reduction which will allow the analysis of larger data.
Although there are more approaches discussed, the thesis is focused on using matrix factorization methods to simplify the input data. These methods allow the input data to be broken down to parts and provide information about their importance. Therefore we are able to select the most important parts for further processing only. This thesis shows that this specific type of simplification leads to the reduction of concept lattice. Additionally, the properties of the reduction process are studied using both general and specific measures. The behaviour of the reduction is partially explained. A novel formalization is introduced allowing the separation of formal concepts into two groups, while each of them behaves differently during the reduction. This point of view has the potential for future analysis.
This thesis contains a brief overview of object-attribute data and their scaling, introduction to the Formal Concept Analysis and basics of three matrix factorization methods - Singular Value Decomposition, Nonnegative Matrix Factorization and Semidiscrete Matrix Decomposition. My thesis is accompanied by an overview of the historical development of mentioned methods and related approaches. For the validation of the results various quantitative measures from different fields are used. Namely -- the general measures, such as entropy, normalized correlation dimension and Lorenz curves were used in conjunction with specific Formal Concept Analysis measures such as relatedness, closeness and concept stability. Attribute implications -- as different type of FCA output -- are also discussed. | en |
dc.format | 95 s. : il. + 1 DVD-R | cs |
dc.format.extent | 944899 bytes | cs |
dc.format.mimetype | application/pdf | cs |
dc.language.iso | cs | cs |
dc.publisher | Vysoká škola báňská - Technická univerzita Ostrava | cs |
dc.title | Konceptuální svazy, jejich redukce a aplikace | cs |
dc.type | Disertační práce | cs |
dc.identifier.signature | 201201041 | cs |
dc.identifier.location | ÚK/Sklad diplomových prací | cs |
dc.contributor.referee | Řezanková, Hana | cs |
dc.contributor.referee | Abraham Padath, Ajith | cs |
dc.contributor.referee | Wegrzyn Wolska, Katarzyna | cs |
dc.date.accepted | 2012-08-23 | cs |
dc.thesis.degree-name | Ph.D. | cs |
dc.thesis.degree-level | Doktorský studijní program | cs |
dc.thesis.degree-grantor | Vysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatiky | cs |
dc.description.category | Prezenční | cs |
dc.description.department | 460 - Katedra informatiky | cs |
dc.thesis.degree-program | Informatika, komunikační technologie a aplikovaná matematika | cs |
dc.thesis.degree-branch | Informatika | cs |
dc.description.result | vyhověl | cs |
dc.identifier.sender | S2724 | cs |
dc.identifier.thesis | HOR632_FEI_P1807_1801V001_2012 | |
dc.rights.access | openAccess | |