Obsah webových stránek a jeho efektivní zpracování
| dc.contributor.advisor | Radecký, Michal | |
| dc.contributor.author | Škutová, Tereza | |
| dc.contributor.referee | Gajdoš, Petr | |
| dc.date.accepted | 2022-06-01 | |
| dc.date.accessioned | 2022-09-01T07:21:52Z | |
| dc.date.available | 2022-09-01T07:21:52Z | |
| dc.date.issued | 2022 | |
| dc.description.abstract | Diplomová práce ukazuje možnost integrace metod pro zpracování přirozeného jazyka do prostředí prohlížeče pro analýzu obsahu webových stránek. Proces analýzy textu obnáší specifickou sekvenci kroků vycházející ze znalosti jazyka. Z veřejně dostupných dokumentů se extrahují klíčová slova. Nejčetnější termy jsou následně využity při výuce slov pro rozšíření slovní zásoby uživatele přímo v prostředí prohlížeče. Přestože rozšíření nabízí překlad do různých jazyků, tak textová analýza je zaměřena pouze na jazyk anglický, pro který jsou přizpůsobeny také veškeré metody pro zpracování přirozeného jazyka. Kromě sestavení vlastního slovníku nabízí aplikace také automatické testování. Praktická část kromě samotné aplikace zahrnuje také hodnocení aktuálního stavu aplikace a nabízí přehled dalších možných rozšíření pro kvalitnější nabízené služby. | cs |
| dc.description.abstract | The thesis shows the possibility of integrating natural language processing methods into the browser environment for web content analysis. The process of text analysis involves a specific sequence of steps based on the knowledge of the language. Keywords are extracted from publicly available documents. The most frequent terms are then used in word learning to expand the user's vocabulary directly in the browser environment. Although the extension offers translation into different languages, the textual analysis focuses only on the English language, for which all natural language processing methods are also adapted. In addition to building your own dictionary, the application also offers automatic testing. In addition to the application itself, the practical part also includes an evaluation of the current status of the application and offers an overview of further possible extensions for a better quality of the offered services. | en |
| dc.description.department | 460 - Katedra informatiky | cs |
| dc.description.result | výborně | cs |
| dc.format.extent | 2272449 bytes | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.other | OSD002 | |
| dc.identifier.sender | S2724 | |
| dc.identifier.thesis | SKU0084_FEI_N2647_2612T025_2022 | |
| dc.identifier.uri | http://hdl.handle.net/10084/147504 | |
| dc.language.iso | cs | |
| dc.publisher | Vysoká škola báňská – Technická univerzita Ostrava | cs |
| dc.rights.access | openAccess | |
| dc.subject | analýza textu, HTML, lemmatizace, NLP, překladač, rozšíření prohlížeče, slovní zásoba, stematizace, stop slovo, sumarizace, tokenizace, vyhledávání, web | cs |
| dc.subject | browser extension, HTML, lemmatization, NLP, search, stematization, stop word, summarization, text analysis, tokenization, translator, vocabulary, web | en |
| dc.thesis.degree-branch | Informatika a výpočetní technika | cs |
| dc.thesis.degree-grantor | Vysoká škola báňská – Technická univerzita Ostrava. Fakulta elektrotechniky a informatiky | cs |
| dc.thesis.degree-level | Magisterský studijní program | cs |
| dc.thesis.degree-name | Ing. | |
| dc.thesis.degree-program | Informační a komunikační technologie | cs |
| dc.title | Obsah webových stránek a jeho efektivní zpracování | cs |
| dc.title.alternative | Webpage Content and Its Effective Processing | en |
| dc.type | Diplomová práce | cs |
Files
Original bundle
1 - 5 out of 5 results
Loading...
- Name:
- SKU0084_FEI_N2647_2612T025_2022.pdf
- Size:
- 2.17 MB
- Format:
- Adobe Portable Document Format
- Description:
- Text práce
Loading...
- Name:
- SKU0084_FEI_N2647_2612T025_2022_zadani.pdf
- Size:
- 46.92 KB
- Format:
- Adobe Portable Document Format
- Description:
- Zadání
Loading...
- Name:
- SKU0084_FEI_N2647_2612T025_2022_priloha.zip
- Size:
- 1.47 MB
- Format:
- Unknown data format
- Description:
- Příloha
Loading...
- Name:
- SKU0084_FEI_N2647_2612T025_2022_posudek_vedouci_Radecky_Michal.pdf
- Size:
- 55.27 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího – Radecký, Michal
Loading...
- Name:
- SKU0084_FEI_N2647_2612T025_2022_posudek_oponent_Gajdos_Petr.pdf
- Size:
- 55.57 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta – Gajdoš, Petr