Analýza textu pomocí neuronových sítí

dc.contributor.advisorPlatoš, Jan
dc.contributor.authorUlip, Marek
dc.contributor.refereeProkop, Petr
dc.date.accepted2020-06-24
dc.date.accessioned2020-07-20T12:07:10Z
dc.date.available2020-07-20T12:07:10Z
dc.date.issued2020
dc.description.abstractTato diplomová práce se zabývá klasifikací textu a analýzou topiků v textech. Cílem bylo nejprve sepsat klasické a neuronové modely pro zmíněné disciplíny a tyto dvě skupiny metod experimentálně porovnat. Pro účely experimentů bylo získáno a popsáno celkem šest datových sad, z toho jedna byla v českém jazyce. Při experimentech s klasifikací bylo použito pět klasických modelů a sedm architektur neuronových sítí. V případě analýzy topiků byl porovnáván model LDA s experimentálním autoenkodérem, vytvořeným v rámci této práce, kde váhy naučeného autoenkodéru jsou použity jako model topiků. Výsledky ukazují, že v rámci klasifikace jsou klasické metody schopné dosahovat velmi dobré přesnosti, která se vyrovná neuronovým sítím, a to v mnohem kratším čase, avšak neuronové sítě jsou u většiny datových sad přesnější než klasické modely. V případě analýzy topiků vytvářel klasický model LDA kvalitnější topiky, avšak neuronový model byl v některých případech schopen lépe shlukovat analyzované dokumenty a kvalitou topiků nebyl na tolik vzdálen metodě LDA. Práce tedy představuje zajímavou alternativu ke klasickému modelu LDA.cs
dc.description.abstractThis diploma thesis is concerning with text classification and text topic analysis. The aim was to first write and experimentally compare classic and neural models for mentioned disciplines. Total of six datasets were acquired for the purpose of experimentation. Five classical models and seven neural network architectures were used for the experiments. Model LDA and experimental autoencoder, created as part of this thesis which was using weights of learned autoencoder as topic model, were compared in case of topic analysis. The results show that in case of classification classical methods can achieve very good accuracy that can be compared to neural networks and with much less required time however neural networks are more accurate than classical models. In case of topic analysis, the classical model LDA was creating better topics however neural model was in some cases capable of better clustering of analyzed documents and its topic quality was not very distant from LDA method. This thesis introduces an interesting alternative to classical model LDA.en
dc.description.department460 - Katedra informatikycs
dc.description.resultvýborněcs
dc.format.extent3058882 bytes
dc.format.mimetypeapplication/pdf
dc.identifier.otherOSD002
dc.identifier.senderS2724
dc.identifier.thesisULI0012_FEI_N2647_2612T025_2020
dc.identifier.urihttp://hdl.handle.net/10084/140502
dc.language.isocs
dc.publisherVysoká škola báňská - Technická univerzita Ostravacs
dc.rights.accessopenAccess
dc.subjectstrojové učenícs
dc.subjecthluboké učenícs
dc.subjectneuronové sítěcs
dc.subjectanalýza textucs
dc.subjectanalýza topikůcs
dc.subjecttopikycs
dc.subjectautoenkodércs
dc.subjectklasifikace textucs
dc.subjectmachine learningen
dc.subjectdeep learningen
dc.subjectneural networksen
dc.subjecttext analysisen
dc.subjecttopic analysisen
dc.subjecttopicsen
dc.subjectautoencoderen
dc.subjecttext classificationen
dc.thesis.degree-branchInformatika a výpočetní technikacs
dc.thesis.degree-grantorVysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.thesis.degree-levelMagisterský studijní programcs
dc.thesis.degree-nameIng.
dc.thesis.degree-programInformační a komunikační technologiecs
dc.titleAnalýza textu pomocí neuronových sítícs
dc.title.alternativeText Analysis Using Neural Networksen
dc.typeDiplomová prácecs

Files

Original bundle

Now showing 1 - 4 out of 4 results
Loading...
Thumbnail Image
Name:
ULI0012_FEI_N2647_2612T025_2020.pdf
Size:
2.92 MB
Format:
Adobe Portable Document Format
Description:
Text práce
Loading...
Thumbnail Image
Name:
ULI0012_FEI_N2647_2612T025_2020_priloha.zip
Size:
187.97 MB
Format:
Unknown data format
Description:
Příloha
Loading...
Thumbnail Image
Name:
ULI0012_FEI_N2647_2612T025_2020_posudek_vedouci_Platos_Jan.pdf
Size:
55.24 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího – Platoš, Jan
Loading...
Thumbnail Image
Name:
ULI0012_FEI_N2647_2612T025_2020_posudek_oponent_Prokop_Petr.pdf
Size:
55.66 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta – Prokop, Petr