Shlukování na základě hustoty pro velká data
| dc.contributor.advisor | Platoš, Jan | |
| dc.contributor.author | Bill, Vojtěch | |
| dc.contributor.referee | Dráždilová, Pavla | |
| dc.date.accepted | 2018-06-04 | |
| dc.date.accessioned | 2018-06-26T08:05:48Z | |
| dc.date.available | 2018-06-26T08:05:48Z | |
| dc.date.issued | 2018 | |
| dc.description.abstract | Tato diplomová práce se věnujeme problematice shlukování, zejména pak shlukování na základě hustoty s důrazem na běh pro velká data. V první části práce jsou popsány teoretické poznatky, věnujeme se shlukování podle hustoty rozložení dat v prostoru a velká část je věnována popisu algoritmu DBSCAN. Následně se seznámíme s pokročilými datovými strukturami pro ukládání dotazovaných dat. Ve druhé části implementujeme vlastní řešení upraveného algoritmu DBSCAN, který využívá kd-strom jako datovou strukturu a umožňuje paralelní běh. V závěru změříme výsledky paralelizovaného řešení v porovnání se sekvenčním algoritmem, porovnáme kd-strom s přístupem dotazování hrubou silou a podíváme se na možné návrhy dalšího vylepšení. | cs |
| dc.description.abstract | This diploma thesis focuses on clustering with special interest in density based cluster analysis for big data. In the beginnig, there is a theory behind clustering and mainly behind density based cluster analysis and the DBSCAN algorithm. Significant part of the first half of this theses consists of the data structures for efficient data storage and quering. In the second part, we propose our own version of DBSCAN with kd-tree used as a data structure and with parallel aproach of some of DBSCAN’s steps. We than measure the impact of parallelizing the DBSCAN algorithm and compare the basic approach of querying data using brute force in contrast to kd-tree. In the final part we propose possible enhancements and functionality for further improvement. | en |
| dc.description.department | 460 - Katedra informatiky | cs |
| dc.description.result | výborně | cs |
| dc.format.extent | 3322886 bytes | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.other | OSD002 | |
| dc.identifier.sender | S2724 | |
| dc.identifier.thesis | BIL0059_FEI_N2647_2612T025_2018 | |
| dc.identifier.uri | http://hdl.handle.net/10084/128336 | |
| dc.language.iso | cs | |
| dc.publisher | Vysoká škola báňská - Technická univerzita Ostrava | cs |
| dc.rights.access | openAccess | |
| dc.subject | shlukování | cs |
| dc.subject | DBSCAN | cs |
| dc.subject | datová struktura | cs |
| dc.subject | k-d strom | cs |
| dc.subject | paralelizace | cs |
| dc.subject | OpenMP | cs |
| dc.subject | clustering | en |
| dc.subject | DBSCAN | en |
| dc.subject | data structure | en |
| dc.subject | k-d tree | en |
| dc.subject | parallelization | en |
| dc.subject | OpenMP | en |
| dc.thesis.degree-branch | Informatika a výpočetní technika | cs |
| dc.thesis.degree-grantor | Vysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatiky | cs |
| dc.thesis.degree-level | Magisterský studijní program | cs |
| dc.thesis.degree-name | Ing. | |
| dc.thesis.degree-program | Informační a komunikační technologie | cs |
| dc.title | Shlukování na základě hustoty pro velká data | cs |
| dc.title.alternative | Density Based Classification for Big Data | en |
| dc.type | Diplomová práce | cs |
Files
Original bundle
1 - 4 out of 4 results
Loading...
- Name:
- BIL0059_FEI_N2647_2612T025_2018.pdf
- Size:
- 3.17 MB
- Format:
- Adobe Portable Document Format
- Description:
- Text práce
Loading...
- Name:
- BIL0059_FEI_N2647_2612T025_2018_priloha.zip
- Size:
- 19.98 MB
- Format:
- Unknown data format
- Description:
- Příloha
Loading...
- Name:
- BIL0059_FEI_N2647_2612T025_2018_posudek_vedouci_Platos_Jan.pdf
- Size:
- 51.32 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího – Platoš, Jan
Loading...
- Name:
- BIL0059_FEI_N2647_2612T025_2018_posudek_oponent_Drazdilova_Pavla.pdf
- Size:
- 48.83 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta – Dráždilová, Pavla