Využití Spark pro zpracování dat na HPC infrastruktuře

dc.contributor.advisorMartinovič, Jan
dc.contributor.authorCága, Jiří
dc.contributor.refereeKožusznik, Jan
dc.date.accepted2018-06-04
dc.date.accessioned2018-06-26T08:05:49Z
dc.date.available2018-06-26T08:05:49Z
dc.date.issued2018
dc.description.abstractDiplomová práce popisuje technologie Apache Hadoop a Spark. V první částí seznamuje jak s popisem technologií tak s implementací vybraných algoritmů za pomoci těchto technologií. Druhá část je věnována návrhu grafického klienta pro spouštění implementovaných algoritmů nad službou HPC as a Service. Hlavním cílem bylo porovnání různých implementací algoritmů s využitím Apache Hadoopu a Sparku nad rozsáhlými datovými sadami na infrastruktuře HPC v technologickém centru IT4Innovations.cs
dc.description.abstractDiploma thesis describes technologies an Apache Hadoop and a Spark. In first part it explains technologies and implementation selected algorithms. The second part is devode design graphic client for launching implemented algorithms on HPC as a Service. The main goal was compare different implementation algorithms with use Hadoop and Spark onto range of dataset on HPC infrastructure in technology center IT4Innovations.en
dc.description.department460 - Katedra informatikycs
dc.description.resultvelmi dobřecs
dc.format.extent9067933 bytes
dc.format.mimetypeapplication/pdf
dc.identifier.otherOSD002
dc.identifier.senderS2724
dc.identifier.thesisCAG0008_FEI_N2647_2612T025_2018
dc.identifier.urihttp://hdl.handle.net/10084/128338
dc.language.isocs
dc.publisherVysoká škola báňská - Technická univerzita Ostravacs
dc.rights.accessopenAccess
dc.subjectHPCcs
dc.subjectHadoopcs
dc.subjectSparkcs
dc.subjectMachine learning algoritmycs
dc.subjectMěření paralelismucs
dc.subjectHPCen
dc.subjectHadoopen
dc.subjectSparken
dc.subjectMachine learningen
dc.subjectParalelism measureen
dc.thesis.degree-branchInformatika a výpočetní technikacs
dc.thesis.degree-grantorVysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.thesis.degree-levelMagisterský studijní programcs
dc.thesis.degree-nameIng.
dc.thesis.degree-programInformační a komunikační technologiecs
dc.titleVyužití Spark pro zpracování dat na HPC infrastruktuřecs
dc.title.alternativeSpark for Data Processing on the HPC Infrastructureen
dc.typeDiplomová prácecs

Files

Original bundle

Now showing 1 - 4 out of 4 results
Loading...
Thumbnail Image
Name:
CAG0008_FEI_N2647_2612T025_2018.pdf
Size:
8.65 MB
Format:
Adobe Portable Document Format
Description:
Text práce
Loading...
Thumbnail Image
Name:
CAG0008_FEI_N2647_2612T025_2018_priloha.zip
Size:
1.53 MB
Format:
Unknown data format
Description:
Příloha
Loading...
Thumbnail Image
Name:
CAG0008_FEI_N2647_2612T025_2018_posudek_vedouci_Martinovic_Jan.pdf
Size:
49.59 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího – Martinovič, Jan
Loading...
Thumbnail Image
Name:
CAG0008_FEI_N2647_2612T025_2018_posudek_oponent_Kozusznik_Jan.pdf
Size:
52 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta – Kožusznik, Jan