Vzorkování rozsáhlých dat
| dc.contributor.advisor | Platoš, Jan | |
| dc.contributor.author | Dvořák, Jakub | |
| dc.contributor.referee | Dráždilová, Pavla | |
| dc.date.accepted | 2016-06-07 | |
| dc.date.accessioned | 2016-11-03T07:32:38Z | |
| dc.date.available | 2016-11-03T07:32:38Z | |
| dc.date.issued | 2016 | |
| dc.description | Import 03/11/2016 | cs |
| dc.description.abstract | Cílem této práce je analyzovat, popsat a implementovat metody pro získání reprezentativních vzorků vektorových a síťových dat, a to zejména s ohledem na rozsáhlá data. Začátek práce je zaměřený na teoretický úvod do problematiky rozsáhlých dat. Následující část tvoří představení pojmů vektorový počet a vektorový prostor a síťových dat, jenž jsou reprezentovány ve formě grafů. Další kapitola se věnuje problému vzorkování z pohledu statistiky. Poslední teoretickou kapitolou je úvod do paralelního zpracování pomocí standardu MPI v .NET. Následující dvě kapitoly jsou praktické a prezentují existující metody získávání vzorků ve vektorových a síťových datech včetně jejich názorných implementací. Na konci práce jsou algoritmy experimentálně vyzkoušeny nad reálnými datasety a zhodnoceny. | cs |
| dc.description.abstract | The aim of this diploma thesis is to analyze, describe and implement of sampling methods for vector and network data with respect to big data. On the beginning the thesis focuses on theoretical basics of big data. Furthermore, in theory, the terms of vector, vector space and network data, which are represented in the form of graph, are introduced. Next chapter focuses on the statistical point of view for data sampling. The last theoretical chapter presents MPI standard for parallel processing in .NET. The next two chapters are more practical and show existing sampling methods for vector and network data including their showcase implementation. In the end of this thesis all algorithms are tested on real datasets and evaluated. | en |
| dc.description.department | 460 - Katedra informatiky | |
| dc.description.result | výborně | cs |
| dc.format.extent | 6896539 bytes | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.other | OSD002 | cs |
| dc.identifier.sender | S2724 | cs |
| dc.identifier.thesis | DVO0033_FEI_N2647_2612T025_2016 | |
| dc.identifier.uri | http://hdl.handle.net/10084/115816 | |
| dc.language.iso | cs | |
| dc.publisher | Vysoká škola báňská - Technická univerzita Ostrava | cs |
| dc.rights.access | openAccess | |
| dc.subject | vzorkování dat, big data, vektorová data, síťová data, C#, message passing interface, diplomová práce | cs |
| dc.subject | data sampling, big data, vector data, network data, C#, message passing interface, master thesis | en |
| dc.thesis.degree-branch | Informatika a výpočetní technika | cs |
| dc.thesis.degree-grantor | Vysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatiky | cs |
| dc.thesis.degree-level | Magisterský studijní program | cs |
| dc.thesis.degree-name | Ing. | |
| dc.thesis.degree-program | Informační a komunikační technologie | cs |
| dc.title | Vzorkování rozsáhlých dat | cs |
| dc.title.alternative | Big Data Sampling | en |
| dc.type | Diplomová práce | cs |
Files
Original bundle
1 - 4 out of 4 results
Loading...
- Name:
- DVO0033_FEI_N2647_2612T025_2016.pdf
- Size:
- 6.58 MB
- Format:
- Adobe Portable Document Format
Loading...
- Name:
- DVO0033_FEI_N2647_2612T025_2016_priloha.zip
- Size:
- 5.69 MB
- Format:
- Unknown data format
Loading...
- Name:
- DVO0033_FEI_N2647_2612T025_2016_posudek_vedouci_Platos_Jan.pdf
- Size:
- 50.73 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího – Platoš, Jan
Loading...
- Name:
- DVO0033_FEI_N2647_2612T025_2016_posudek_oponent_Drazdilova_Pavla.pdf
- Size:
- 49.33 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta – Dráždilová, Pavla