dc.contributor.advisor | Krömer, Pavel | |
dc.contributor.author | Hanuš, Marek | |
dc.date.accessioned | 2023-06-23T08:44:04Z | |
dc.date.available | 2023-06-23T08:44:04Z | |
dc.date.issued | 2023 | |
dc.identifier.other | OSD002 | |
dc.identifier.uri | http://hdl.handle.net/10084/150111 | |
dc.description.abstract | Tato diplomová práce se zabývá zpracováním přirozeného jazyka za účelem klasifikace textových dokumentů. Pro trénování klasifikátorů byly zvoleny datové kolekce získané ze stránek WikiCFP a DBWorld. Úvod práce se zabývá získáním těchto dat, jejich základní analýzou a předzpracováním za účelem vytvoření očištěné datové sady. Následuje podrobný popis metod pro vytvoření vektorové reprezentace textu a přehled vhodných modelů pro automatickou klasifikaci, a to od klasických přístupů, přes neuronové sítě až po aktuální state-of-the-art techniky. Vybrané modely z jednotlivých kategorií byly implementovány a otestovány nad specifikovanými datovými zdroji. Výsledky jsou podrobně analyzovány, vizualizovány a zhodnoceny. Vytvořené modely byly implementovány do praktické webové aplikace. | cs |
dc.description.abstract | This thesis focuses on natural language processing for classification of text documents. For classifier training were selected data collections obtained from WikiCFP and DBWorld. The introduction of the thesis deals with the acquisition of these data, their basic analysis and preprocessing to create a clean dataset. This is followed by a detailed description of the methods for creating a vector representation of the text and an overview of suitable models for automatic classification, ranging from classical approaches, through neural networks to current state-of-the-art techniques. Selected models from each category have been implemented and tested over specified data sources. The next part of the work deals with testing on specified data sources. Results are analysed, visualised, and evaluated. Created models have been implemented to practical web application. | en |
dc.format.extent | 2754217 bytes | |
dc.format.mimetype | application/pdf | |
dc.language.iso | cs | |
dc.publisher | Vysoká škola báňská – Technická univerzita Ostrava | cs |
dc.subject | klasifikace textu | cs |
dc.subject | zpracování přirozeného jazyka | cs |
dc.subject | strojové učení | cs |
dc.subject | neuronové sítě | cs |
dc.subject | hluboké učení | cs |
dc.subject | webová aplikace | cs |
dc.subject | anonce konferencí | cs |
dc.subject | WikiCFP | cs |
dc.subject | DBWorld | cs |
dc.subject | text classification | en |
dc.subject | natural language processing | en |
dc.subject | machine learning | en |
dc.subject | neural networks | en |
dc.subject | artificial neural networks | en |
dc.subject | deep learning | en |
dc.subject | web application | en |
dc.subject | Call for Papers | en |
dc.subject | WikiCFP | en |
dc.subject | DBWorld | en |
dc.title | CFP Search: vyhledávání v Call for Papers | cs |
dc.title.alternative | CFP Search: search in Call for Papers | en |
dc.type | Diplomová práce | cs |
dc.contributor.referee | Uher, Vojtěch | |
dc.date.accepted | 2023-05-31 | |
dc.thesis.degree-name | Ing. | |
dc.thesis.degree-level | Magisterský studijní program | cs |
dc.thesis.degree-grantor | Vysoká škola báňská – Technická univerzita Ostrava. Fakulta elektrotechniky a informatiky | cs |
dc.description.department | 460 - Katedra informatiky | cs |
dc.thesis.degree-program | Informační a komunikační technologie | cs |
dc.thesis.degree-branch | Informatika a výpočetní technika | cs |
dc.description.result | velmi dobře | cs |
dc.identifier.sender | S2724 | |
dc.identifier.thesis | HAN0261_FEI_N2647_2612T025_2023 | |
dc.rights.access | openAccess | |