Vzorkování rozsáhlých dat

dc.contributor.advisorPlatoš, Jan
dc.contributor.authorDvořák, Jakub
dc.contributor.refereeDráždilová, Pavla
dc.date.accepted2016-06-07
dc.date.accessioned2016-11-03T07:32:38Z
dc.date.available2016-11-03T07:32:38Z
dc.date.issued2016
dc.descriptionImport 03/11/2016cs
dc.description.abstractCílem této práce je analyzovat, popsat a implementovat metody pro získání reprezentativních vzorků vektorových a síťových dat, a to zejména s ohledem na rozsáhlá data. Začátek práce je zaměřený na teoretický úvod do problematiky rozsáhlých dat. Následující část tvoří představení pojmů vektorový počet a vektorový prostor a síťových dat, jenž jsou reprezentovány ve formě grafů. Další kapitola se věnuje problému vzorkování z pohledu statistiky. Poslední teoretickou kapitolou je úvod do paralelního zpracování pomocí standardu MPI v .NET. Následující dvě kapitoly jsou praktické a prezentují existující metody získávání vzorků ve vektorových a síťových datech včetně jejich názorných implementací. Na konci práce jsou algoritmy experimentálně vyzkoušeny nad reálnými datasety a zhodnoceny.cs
dc.description.abstractThe aim of this diploma thesis is to analyze, describe and implement of sampling methods for vector and network data with respect to big data. On the beginning the thesis focuses on theoretical basics of big data. Furthermore, in theory, the terms of vector, vector space and network data, which are represented in the form of graph, are introduced. Next chapter focuses on the statistical point of view for data sampling. The last theoretical chapter presents MPI standard for parallel processing in .NET. The next two chapters are more practical and show existing sampling methods for vector and network data including their showcase implementation. In the end of this thesis all algorithms are tested on real datasets and evaluated.en
dc.description.department460 - Katedra informatiky
dc.description.resultvýborněcs
dc.format.extent6896539 bytes
dc.format.mimetypeapplication/pdf
dc.identifier.otherOSD002cs
dc.identifier.senderS2724cs
dc.identifier.thesisDVO0033_FEI_N2647_2612T025_2016
dc.identifier.urihttp://hdl.handle.net/10084/115816
dc.language.isocs
dc.publisherVysoká škola báňská - Technická univerzita Ostravacs
dc.rights.accessopenAccess
dc.subjectvzorkování dat, big data, vektorová data, síťová data, C#, message passing interface, diplomová prácecs
dc.subjectdata sampling, big data, vector data, network data, C#, message passing interface, master thesisen
dc.thesis.degree-branchInformatika a výpočetní technikacs
dc.thesis.degree-grantorVysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.thesis.degree-levelMagisterský studijní programcs
dc.thesis.degree-nameIng.
dc.thesis.degree-programInformační a komunikační technologiecs
dc.titleVzorkování rozsáhlých datcs
dc.title.alternativeBig Data Samplingen
dc.typeDiplomová prácecs

Files

Original bundle

Now showing 1 - 4 out of 4 results
Loading...
Thumbnail Image
Name:
DVO0033_FEI_N2647_2612T025_2016.pdf
Size:
6.58 MB
Format:
Adobe Portable Document Format
Loading...
Thumbnail Image
Name:
DVO0033_FEI_N2647_2612T025_2016_priloha.zip
Size:
5.69 MB
Format:
Unknown data format
Loading...
Thumbnail Image
Name:
DVO0033_FEI_N2647_2612T025_2016_posudek_vedouci_Platos_Jan.pdf
Size:
50.73 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího – Platoš, Jan
Loading...
Thumbnail Image
Name:
DVO0033_FEI_N2647_2612T025_2016_posudek_oponent_Drazdilova_Pavla.pdf
Size:
49.33 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta – Dráždilová, Pavla