Shlukování na základě hustoty pro velká data

dc.contributor.advisorPlatoš, Jan
dc.contributor.authorBill, Vojtěch
dc.contributor.refereeDráždilová, Pavla
dc.date.accepted2018-06-04
dc.date.accessioned2018-06-26T08:05:48Z
dc.date.available2018-06-26T08:05:48Z
dc.date.issued2018
dc.description.abstractTato diplomová práce se věnujeme problematice shlukování, zejména pak shlukování na základě hustoty s důrazem na běh pro velká data. V první části práce jsou popsány teoretické poznatky, věnujeme se shlukování podle hustoty rozložení dat v prostoru a velká část je věnována popisu algoritmu DBSCAN. Následně se seznámíme s pokročilými datovými strukturami pro ukládání dotazovaných dat. Ve druhé části implementujeme vlastní řešení upraveného algoritmu DBSCAN, který využívá kd-strom jako datovou strukturu a umožňuje paralelní běh. V závěru změříme výsledky paralelizovaného řešení v porovnání se sekvenčním algoritmem, porovnáme kd-strom s přístupem dotazování hrubou silou a podíváme se na možné návrhy dalšího vylepšení.cs
dc.description.abstractThis diploma thesis focuses on clustering with special interest in density based cluster analysis for big data. In the beginnig, there is a theory behind clustering and mainly behind density based cluster analysis and the DBSCAN algorithm. Significant part of the first half of this theses consists of the data structures for efficient data storage and quering. In the second part, we propose our own version of DBSCAN with kd-tree used as a data structure and with parallel aproach of some of DBSCAN’s steps. We than measure the impact of parallelizing the DBSCAN algorithm and compare the basic approach of querying data using brute force in contrast to kd-tree. In the final part we propose possible enhancements and functionality for further improvement.en
dc.description.department460 - Katedra informatikycs
dc.description.resultvýborněcs
dc.format.extent3322886 bytes
dc.format.mimetypeapplication/pdf
dc.identifier.otherOSD002
dc.identifier.senderS2724
dc.identifier.thesisBIL0059_FEI_N2647_2612T025_2018
dc.identifier.urihttp://hdl.handle.net/10084/128336
dc.language.isocs
dc.publisherVysoká škola báňská - Technická univerzita Ostravacs
dc.rights.accessopenAccess
dc.subjectshlukovánícs
dc.subjectDBSCANcs
dc.subjectdatová strukturacs
dc.subjectk-d stromcs
dc.subjectparalelizacecs
dc.subjectOpenMPcs
dc.subjectclusteringen
dc.subjectDBSCANen
dc.subjectdata structureen
dc.subjectk-d treeen
dc.subjectparallelizationen
dc.subjectOpenMPen
dc.thesis.degree-branchInformatika a výpočetní technikacs
dc.thesis.degree-grantorVysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.thesis.degree-levelMagisterský studijní programcs
dc.thesis.degree-nameIng.
dc.thesis.degree-programInformační a komunikační technologiecs
dc.titleShlukování na základě hustoty pro velká datacs
dc.title.alternativeDensity Based Classification for Big Dataen
dc.typeDiplomová prácecs

Files

Original bundle

Now showing 1 - 4 out of 4 results
Loading...
Thumbnail Image
Name:
BIL0059_FEI_N2647_2612T025_2018.pdf
Size:
3.17 MB
Format:
Adobe Portable Document Format
Description:
Text práce
Loading...
Thumbnail Image
Name:
BIL0059_FEI_N2647_2612T025_2018_priloha.zip
Size:
19.98 MB
Format:
Unknown data format
Description:
Příloha
Loading...
Thumbnail Image
Name:
BIL0059_FEI_N2647_2612T025_2018_posudek_vedouci_Platos_Jan.pdf
Size:
51.32 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího – Platoš, Jan
Loading...
Thumbnail Image
Name:
BIL0059_FEI_N2647_2612T025_2018_posudek_oponent_Drazdilova_Pavla.pdf
Size:
48.83 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta – Dráždilová, Pavla