dc.contributor.advisor | Platoš, Jan | |
dc.contributor.author | Hajdík, Marek | |
dc.date.accessioned | 2020-07-20T12:11:58Z | |
dc.date.available | 2020-07-20T12:11:58Z | |
dc.date.issued | 2020 | |
dc.identifier.other | OSD002 | |
dc.identifier.uri | http://hdl.handle.net/10084/140522 | |
dc.description.abstract | Tato diplomová práce se zabývá analýzou sentimentu v textových dokumentech. Cílem bylo popsat vybrané metody, implementovat je a otestovat na vhodných datových sadách. Teoretická část se věnuje problematice zpracování přirozeného jazyka a metodám pro rozpoznání sentimentu. Jsou zde uvedeny úrovně analýzy, příprava textu, možné komplikace a rozdělení metod pro řešení tohoto problému. Dále je stručný popis metod, které v současnosti dosahují nejlepších výsledků při klasifikaci sentimentu a podrobný popis vybraných algoritmů, použitých v praktické části práce. Všechny vybrané algoritmy se řádí do oblasti strojového učení a byly vybrány na základě aktuálních trendů. Praktická část se věnuje detailům implementace vybraných metod a návrhům neuronových sítí. Poté jsou všechny metody ověřeny a porovnány pomocí různých experimentů, jež testují účinek předzpracování textu, optimalizaci hyperparametrů a vliv rozšíření struktur neuronových sítí. Pro provedení experimentů byly vybrány tři datové sady tak, aby ověřily metody při nedostatečném a nadměrném množství dat. | cs |
dc.description.abstract | This thesis deals with the sentiment analysis in text documents. The aim of the thesis was to describe selected methods, to implement them and to test them on appropriately selected datasets. The theoretical part deals with the issue of natural language processing and the description of methods for sentiment recognition. Levels of analysis as well as text preprocessing, possible complications and division of methods for solving this task are presented in this part. There is a also brief description of the methods, that currently achieve the best results in the sentiment classification and detailed description of selected algorithms used in the practical part of the work. All selected algorithms are in the field of machine learning and were selected according to current trends. The practical part is focused on the details of the implementation of selected methods and neural network designs, followed by the verification and comparison of all methods using various experiments. These experiments test the effect of text preprocessing, hyperparameter optimization and the effect of changes in neural network structures. To perform said experiments, three datasets were selected to validate the methods both with insufficient and excessive amount of data given. | en |
dc.format.extent | 2642552 bytes | |
dc.format.mimetype | application/pdf | |
dc.language.iso | cs | |
dc.publisher | Vysoká škola báňská - Technická univerzita Ostrava | cs |
dc.subject | analýza sentimentu | cs |
dc.subject | klasifikace textů | cs |
dc.subject | strojové učení | cs |
dc.subject | zpracování přirozeného jazyka | cs |
dc.subject | neuronové sítě | cs |
dc.subject | FastText | cs |
dc.subject | SDCA | cs |
dc.subject | Averaged perceptron | cs |
dc.subject | LSTM | cs |
dc.subject | konvoluční sítě | cs |
dc.subject | předzpracování textu | cs |
dc.subject | ML .NET | cs |
dc.subject | TensorFlow | cs |
dc.subject | sentiment analysis | en |
dc.subject | text classification | en |
dc.subject | machine learning | en |
dc.subject | natural language processing | en |
dc.subject | FastText | en |
dc.subject | SDCA | en |
dc.subject | Averaged perceptron | en |
dc.subject | LSTM | en |
dc.subject | convolutional neural networks | en |
dc.subject | text preprocessing | en |
dc.subject | ML .NET | en |
dc.subject | TensorFlow | en |
dc.title | Analýza sentimentů v textech | cs |
dc.title.alternative | Sentiment Analysis in Text | en |
dc.type | Diplomová práce | cs |
dc.contributor.referee | Krömer, Pavel | |
dc.date.accepted | 2020-06-24 | |
dc.thesis.degree-name | Ing. | |
dc.thesis.degree-level | Magisterský studijní program | cs |
dc.thesis.degree-grantor | Vysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatiky | cs |
dc.description.department | 460 - Katedra informatiky | cs |
dc.thesis.degree-program | Informační a komunikační technologie | cs |
dc.thesis.degree-branch | Informatika a výpočetní technika | cs |
dc.description.result | výborně | cs |
dc.identifier.sender | S2724 | |
dc.identifier.thesis | HAJ0136_FEI_N2647_2612T025_2020 | |
dc.rights.access | openAccess | |