Zobrazit minimální záznam

dc.contributor.advisorKrömer, Pavel
dc.contributor.authorHanuš, Marek
dc.date.accessioned2023-06-23T08:44:04Z
dc.date.available2023-06-23T08:44:04Z
dc.date.issued2023
dc.identifier.otherOSD002
dc.identifier.urihttp://hdl.handle.net/10084/150111
dc.description.abstractTato diplomová práce se zabývá zpracováním přirozeného jazyka za účelem klasifikace textových dokumentů. Pro trénování klasifikátorů byly zvoleny datové kolekce získané ze stránek WikiCFP a DBWorld. Úvod práce se zabývá získáním těchto dat, jejich základní analýzou a předzpracováním za účelem vytvoření očištěné datové sady. Následuje podrobný popis metod pro vytvoření vektorové reprezentace textu a přehled vhodných modelů pro automatickou klasifikaci, a to od klasických přístupů, přes neuronové sítě až po aktuální state-of-the-art techniky. Vybrané modely z jednotlivých kategorií byly implementovány a otestovány nad specifikovanými datovými zdroji. Výsledky jsou podrobně analyzovány, vizualizovány a zhodnoceny. Vytvořené modely byly implementovány do praktické webové aplikace.cs
dc.description.abstractThis thesis focuses on natural language processing for classification of text documents. For classifier training were selected data collections obtained from WikiCFP and DBWorld. The introduction of the thesis deals with the acquisition of these data, their basic analysis and preprocessing to create a clean dataset. This is followed by a detailed description of the methods for creating a vector representation of the text and an overview of suitable models for automatic classification, ranging from classical approaches, through neural networks to current state-of-the-art techniques. Selected models from each category have been implemented and tested over specified data sources. The next part of the work deals with testing on specified data sources. Results are analysed, visualised, and evaluated. Created models have been implemented to practical web application.en
dc.format.extent2754217 bytes
dc.format.mimetypeapplication/pdf
dc.language.isocs
dc.publisherVysoká škola báňská – Technická univerzita Ostravacs
dc.subjectklasifikace textucs
dc.subjectzpracování přirozeného jazykacs
dc.subjectstrojové učenícs
dc.subjectneuronové sítěcs
dc.subjecthluboké učenícs
dc.subjectwebová aplikacecs
dc.subjectanonce konferencícs
dc.subjectWikiCFPcs
dc.subjectDBWorldcs
dc.subjecttext classificationen
dc.subjectnatural language processingen
dc.subjectmachine learningen
dc.subjectneural networksen
dc.subjectartificial neural networksen
dc.subjectdeep learningen
dc.subjectweb applicationen
dc.subjectCall for Papersen
dc.subjectWikiCFPen
dc.subjectDBWorlden
dc.titleCFP Search: vyhledávání v Call for Paperscs
dc.title.alternativeCFP Search: search in Call for Papersen
dc.typeDiplomová prácecs
dc.contributor.refereeUher, Vojtěch
dc.date.accepted2023-05-31
dc.thesis.degree-nameIng.
dc.thesis.degree-levelMagisterský studijní programcs
dc.thesis.degree-grantorVysoká škola báňská – Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.description.department460 - Katedra informatikycs
dc.thesis.degree-programInformační a komunikační technologiecs
dc.thesis.degree-branchInformatika a výpočetní technikacs
dc.description.resultvelmi dobřecs
dc.identifier.senderS2724
dc.identifier.thesisHAN0261_FEI_N2647_2612T025_2023
dc.rights.accessopenAccess


Soubory tohoto záznamu

Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam