Zobrazit minimální záznam

dc.contributor.advisorKudělka, Milošcs
dc.contributor.authorBlažek, Ondřejcs
dc.date.accessioned2013-06-26T11:20:25Z
dc.date.available2013-06-26T11:20:25Z
dc.date.issued2013cs
dc.identifier.otherOSD002cs
dc.identifier.urihttp://hdl.handle.net/10084/99015
dc.descriptionImport 26/06/2013cs
dc.description.abstractPředmětem této bakalářské práce je jedna typická úloha vědecké disciplíny zvané dolování z textu (text mining). Konkrétně tedy detekce klíčových slov dokumentů, jenž mohou sloužit například pro rozdělení dokumentů do kategorií. Teoretická část je rozdělena na dvě části, kde část první je věnována základním pojmům a jejich objasnění v této problematice. Jedná se především o způsob, jak vhodně reprezentovat dokumenty ve vektorovém prostoru. Druhá část se věnuje průzkumu existujících metod pro určení kategorií dokumentů a detekci klíčových slov, na jejichž základě jsou především tyto kategorie sloučeny.cs
dc.description.abstractThe subject of this thesis is one typical role of a scientific discipline called text mining. Specifically it is a keyword spotting documents, which can be used for example for the distribution of documents into categories. The theoretical part is divided into two parts where the first part is devoted to the basic concepts and explains them in this issue. This is essentially a way to properly represent documents in a vector space. The second part deals with the exploration of existing methods for determining the categories of documents and keywords detection on the basis of those categories are merged. An important part of the work is its own implementation, which describes the steps of my process. For example we can find here steps to create a vector that will represent the document and clustering a set of documents into a given number of categories, based on their similarity. This clustering is used as a tool for categorization, which subsequently due to frequency analysis, keywords of categories are detected.en
dc.format.extent3873080 bytescs
dc.format.mimetypeapplication/pdfcs
dc.language.isocscs
dc.publisherVysoká škola báňská - Technická univerzita Ostravacs
dc.subjectkategorizace, tématizace, dolování textu, klíčová slovacs
dc.subjectcategorization , thematization , text mining , key wordsen
dc.titleDetekce klíčových slov v odborných článcíchcs
dc.title.alternativeKeywords Detection in Research Papersen
dc.typeBakalářská prácecs
dc.contributor.refereeHorák, Zdeněkcs
dc.date.accepted2013-06-05cs
dc.thesis.degree-nameBc.cs
dc.thesis.degree-levelBakalářský studijní programcs
dc.thesis.degree-grantorVysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.description.department460 - Katedra informatikycs
dc.thesis.degree-programInformační a komunikační technologiecs
dc.thesis.degree-branchInformatika a výpočetní technikacs
dc.description.resultvelmi dobřecs
dc.identifier.senderS2724cs
dc.identifier.thesisBLA0045_FEI_B2647_2612R025_2013
dc.rights.accessopenAccess


Soubory tohoto záznamu

Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam