dc.contributor.advisor | Plucar, Jan | |
dc.contributor.author | Siažík, Daniel | |
dc.date.accessioned | 2025-06-23T11:50:31Z | |
dc.date.available | 2025-06-23T11:50:31Z | |
dc.date.issued | 2025 | |
dc.identifier.other | OSD002 | |
dc.identifier.uri | http://hdl.handle.net/10084/157107 | |
dc.description.abstract | Tato diplomová práce se zabývá návrhem a implementací systému pro automatizovaný monitoring a kategorizaci stránek temného webu. Hlavním cílem je vytvoření efektivního webového crawleru schopného procházet a analyzovat skrytý obsah sítě TOR. Systém umožňuje nejen kontinuální sledování dostupnosti stránek, ale také jejich kategorizaci na základě obsahu a extrakci klíčových artefaktů, jako jsou kryptoměnové adresy.
Kategorizace obsahu je realizována pomocí jazykového modelu, který automaticky třídí stránky do tematických skupin. Veškeré získané informace jsou ukládány do databáze a vizualizovány prostřednictvím webového rozhraní, které umožňuje efektivní vyhledávání a analýzu. Výsledky provedeného monitoringu a analýzy jsou detailně popsány v této práci, včetně přehledu nalezených stránek, klasifikace obsahu a identifikovaných kryptoměnových adres. | cs |
dc.description.abstract | This thesis focuses on the design and implementation of a system for automated monitoring and categorization of dark web pages. The primary goal is to develop an efficient web crawler capable of traversing and analyzing hidden content within the TOR network. The system enables not only continuous monitoring of website availability but also categorization based on content and extraction of key artifacts such as cryptocurrency addresses.
Content categorization is performed using a language model that automatically classifies pages into thematic groups. All collected information is stored in a database and visualized through a web interface, allowing efficient search and analysis. The results of the monitoring and analysis are described in detail in this thesis, including an overview of the discovered pages, content classification, and identified cryptocurrency addresses. | en |
dc.format.extent | 3140445 bytes | |
dc.format.mimetype | application/pdf | |
dc.language.iso | cs | |
dc.publisher | Vysoká škola báňská – Technická univerzita Ostrava | cs |
dc.subject | Temný web | cs |
dc.subject | crawler | cs |
dc.subject | TOR | cs |
dc.subject | kryptoměnové adresy | cs |
dc.subject | kategorizace obsahu | cs |
dc.subject | Dark web | en |
dc.subject | crawler | en |
dc.subject | TOR | en |
dc.subject | cryptocurrency addresses | en |
dc.subject | content categorization | en |
dc.title | Agregátor stránek temného webu s automatickou detekcí a kategorizací obsahu | cs |
dc.title.alternative | Dark Web Page Aggregator with Automated Content Detection and Categorization | en |
dc.type | Diplomová práce | cs |
dc.contributor.referee | Rečka, Radovan | |
dc.date.accepted | 2025-06-04 | |
dc.thesis.degree-name | Ing. | |
dc.thesis.degree-level | Magisterský studijní program | cs |
dc.thesis.degree-grantor | Vysoká škola báňská – Technická univerzita Ostrava. Fakulta elektrotechniky a informatiky | cs |
dc.description.department | 460 - Katedra informatiky | cs |
dc.thesis.degree-program | Informační a komunikační bezpečnost | cs |
dc.description.result | výborně | cs |
dc.identifier.sender | S2724 | |
dc.identifier.thesis | SIA0009_FEI_N0612A140004_2025 | |
dc.rights.access | openAccess | |