Obsah webových stránek a jeho efektivní zpracování

dc.contributor.advisorRadecký, Michal
dc.contributor.authorŠkutová, Tereza
dc.contributor.refereeGajdoš, Petr
dc.date.accepted2022-06-01
dc.date.accessioned2022-09-01T07:21:52Z
dc.date.available2022-09-01T07:21:52Z
dc.date.issued2022
dc.description.abstractDiplomová práce ukazuje možnost integrace metod pro zpracování přirozeného jazyka do prostředí prohlížeče pro analýzu obsahu webových stránek. Proces analýzy textu obnáší specifickou sekvenci kroků vycházející ze znalosti jazyka. Z veřejně dostupných dokumentů se extrahují klíčová slova. Nejčetnější termy jsou následně využity při výuce slov pro rozšíření slovní zásoby uživatele přímo v prostředí prohlížeče. Přestože rozšíření nabízí překlad do různých jazyků, tak textová analýza je zaměřena pouze na jazyk anglický, pro který jsou přizpůsobeny také veškeré metody pro zpracování přirozeného jazyka. Kromě sestavení vlastního slovníku nabízí aplikace také automatické testování. Praktická část kromě samotné aplikace zahrnuje také hodnocení aktuálního stavu aplikace a nabízí přehled dalších možných rozšíření pro kvalitnější nabízené služby.cs
dc.description.abstractThe thesis shows the possibility of integrating natural language processing methods into the browser environment for web content analysis. The process of text analysis involves a specific sequence of steps based on the knowledge of the language. Keywords are extracted from publicly available documents. The most frequent terms are then used in word learning to expand the user's vocabulary directly in the browser environment. Although the extension offers translation into different languages, the textual analysis focuses only on the English language, for which all natural language processing methods are also adapted. In addition to building your own dictionary, the application also offers automatic testing. In addition to the application itself, the practical part also includes an evaluation of the current status of the application and offers an overview of further possible extensions for a better quality of the offered services.en
dc.description.department460 - Katedra informatikycs
dc.description.resultvýborněcs
dc.format.extent2272449 bytes
dc.format.mimetypeapplication/pdf
dc.identifier.otherOSD002
dc.identifier.senderS2724
dc.identifier.thesisSKU0084_FEI_N2647_2612T025_2022
dc.identifier.urihttp://hdl.handle.net/10084/147504
dc.language.isocs
dc.publisherVysoká škola báňská – Technická univerzita Ostravacs
dc.rights.accessopenAccess
dc.subjectanalýza textu, HTML, lemmatizace, NLP, překladač, rozšíření prohlížeče, slovní zásoba, stematizace, stop slovo, sumarizace, tokenizace, vyhledávání, webcs
dc.subjectbrowser extension, HTML, lemmatization, NLP, search, stematization, stop word, summarization, text analysis, tokenization, translator, vocabulary, weben
dc.thesis.degree-branchInformatika a výpočetní technikacs
dc.thesis.degree-grantorVysoká škola báňská – Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.thesis.degree-levelMagisterský studijní programcs
dc.thesis.degree-nameIng.
dc.thesis.degree-programInformační a komunikační technologiecs
dc.titleObsah webových stránek a jeho efektivní zpracovánícs
dc.title.alternativeWebpage Content and Its Effective Processingen
dc.typeDiplomová prácecs

Files

Original bundle

Now showing 1 - 5 out of 5 results
Loading...
Thumbnail Image
Name:
SKU0084_FEI_N2647_2612T025_2022.pdf
Size:
2.17 MB
Format:
Adobe Portable Document Format
Description:
Text práce
Loading...
Thumbnail Image
Name:
SKU0084_FEI_N2647_2612T025_2022_zadani.pdf
Size:
46.92 KB
Format:
Adobe Portable Document Format
Description:
Zadání
Loading...
Thumbnail Image
Name:
SKU0084_FEI_N2647_2612T025_2022_priloha.zip
Size:
1.47 MB
Format:
Unknown data format
Description:
Příloha
Loading...
Thumbnail Image
Name:
SKU0084_FEI_N2647_2612T025_2022_posudek_vedouci_Radecky_Michal.pdf
Size:
55.27 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího – Radecký, Michal
Loading...
Thumbnail Image
Name:
SKU0084_FEI_N2647_2612T025_2022_posudek_oponent_Gajdos_Petr.pdf
Size:
55.57 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta – Gajdoš, Petr