Zpracování dat s Wikipedie

dc.contributor.advisorPlatoš, Jan
dc.contributor.authorMikula, Martin
dc.contributor.refereeDráždilová, Pavla
dc.date.accepted2019-05-29
dc.date.accessioned2019-06-26T04:33:33Z
dc.date.available2019-06-26T04:33:33Z
dc.date.issued2019
dc.description.abstractCílem této diplomové práce je zdokumentovat možnosti zpracování dat Wikipedie. V první části popisuje způsob, jak tato data získat, zpracovat a uložit pro další analýzu. Přitom je na databázi nahlíženo jako na síť a zaměření je na provázání stránek mezi sebou pomocí odkazů. Samotná analýza probíhá v prostředí Python. Práce popisuje, jak vytvořit graf a jak nad tímto grafem spočítat základní vlastnosti a metriky. Dále je zdokumentován postup hledání komunit v grafu včetně vlastní implementace algoritmu Label Propagation. Prezentovány jsou výsledky jednotlivých kroků.cs
dc.description.abstractGoal of this master thesis is to describe options of how to process data from Wikipedia. First part is about how to get the data, process them and save for further analysis. The database is viewed as a network, so it's focused on pages and their connections through links. The analysis is made in Python environment. Thesis describes how to create a graph and how to calculate his basic properties an metrices. It further documents the procedure of finding the communities, including custom implementation of Label Propagation algorithm. Presented are results of each step.en
dc.description.department460 - Katedra informatikycs
dc.description.resultvelmi dobřecs
dc.format.extent12172018 bytes
dc.format.mimetypeapplication/pdf
dc.identifier.otherOSD002
dc.identifier.senderS2724
dc.identifier.thesisMIK0095_FEI_N2647_2612T025_2019
dc.identifier.urihttp://hdl.handle.net/10084/136261
dc.language.isocs
dc.publisherVysoká škola báňská - Technická univerzita Ostravacs
dc.rights.accessopenAccess
dc.subjectWikipediecs
dc.subjectanalýza datcs
dc.subjectzpracování datcs
dc.subjectC#cs
dc.subjectPythoncs
dc.subjectsiťcs
dc.subjectgrafcs
dc.subjectCSRcs
dc.subjectNetworkXcs
dc.subjectGephics
dc.subjectword cloudcs
dc.subjectWikipediaen
dc.subjectdata analysisen
dc.subjectdata processingen
dc.subjectC#en
dc.subjectPythonen
dc.subjectnetworken
dc.subjectgraphen
dc.subjectCSRen
dc.subjectNetworkXen
dc.subjectword clouden
dc.thesis.degree-branchInformatika a výpočetní technikacs
dc.thesis.degree-grantorVysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.thesis.degree-levelMagisterský studijní programcs
dc.thesis.degree-nameIng.
dc.thesis.degree-programInformační a komunikační technologiecs
dc.titleZpracování dat s Wikipediecs
dc.title.alternativeWikipedia Data Processingen
dc.typeDiplomová prácecs

Files

Original bundle

Now showing 1 - 4 out of 4 results
Loading...
Thumbnail Image
Name:
MIK0095_FEI_N2647_2612T025_2019.pdf
Size:
11.61 MB
Format:
Adobe Portable Document Format
Description:
Text práce
Loading...
Thumbnail Image
Name:
MIK0095_FEI_N2647_2612T025_2019_priloha.zip
Size:
20.95 MB
Format:
Unknown data format
Description:
Příloha
Loading...
Thumbnail Image
Name:
MIK0095_FEI_N2647_2612T025_2019_posudek_vedouci_Platos_Jan.pdf
Size:
49.36 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího – Platoš, Jan
Loading...
Thumbnail Image
Name:
MIK0095_FEI_N2647_2612T025_2019_posudek_oponent_Drazdilova_Pavla.pdf
Size:
53.41 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta – Dráždilová, Pavla