Vyhledávání nelegálního obsahu na internetu
| dc.contributor.advisor | Snášel, Václav | cs |
| dc.contributor.author | Skanderová, Lenka | cs |
| dc.contributor.referee | Kudělka, Miloš | cs |
| dc.date.accepted | 2011-06-06 | cs |
| dc.date.accessioned | 2011-07-01T02:11:27Z | |
| dc.date.available | 2011-07-01T02:11:27Z | |
| dc.date.issued | 2011 | cs |
| dc.description | Import 04/07/2011 | cs |
| dc.description | Z důvodu ochrany citlivých údajů je plný text nepřístupný. | |
| dc.description.abstract | Vyhledávání nelegálního obsahu na Internetu se soustřeďuje na analýzu webových stránek s dětskou pornografií. Jedná se o analýzu textu. Ve své diplomové práci zkoumám, jak se stránky s dětskou pornografií odlišují od ostatních webových stránek. Zaměřuji se na vyhledání charakteristických slov, která se zde objevují, a na jejich četnosti. K tomuto účelu jsem vytvořila vlastní software, který je schopen extrahovat ze stránek slova a seřadit je podle četností. Dále jsem použila metody shlukování a Jaccardův koeficient podobnosti. Vycházela jsem z hypotézy, že stránky s dětskou pornografií mají zcela unikátní slovník, který v jiných typech webu nenajdeme. Správnost této hypotézy potvrzují všechny výsledky, jichž jsem svými pokusy dosáhla. Vyhledávání nelegálního obsahu na Internetu se velkou měrou opírá o článek Wai H. Ho, Paul A. Watters, Statistical and Structural Approaches to Filtering Internet Pornography; IEEE International Conference on Systems, Man and Cybernetics, 2004, jenž zároveň slouží i jako další nepřímý důkaz mé hypotézy. Věřím, že má diplomová práce může pomoci v boji proti dětské pornografii. | cs |
| dc.description.abstract | Searching of Malicious Content Retrieval is aimed at analysis of web pages with child pornography. The thing is analysis of text. In my thesis I look about differences between pages with child pornography and other web pages. I put mind to searching of typically words and their frequencies. To the effect I have designed own software, which can extract words from pages and orded them by their frequencies. Next I have used methods of clustering and Jaccard similarity coeficient. I have started from the hypothesis that pages with child pornography contain unique vocabulary, which is not engaged otherwhere. All my achieved results confirm my hypothesis. The great pillar of Malicious Content Retrieval is the article Wai H. Ho, Paul A. Watters, Statistical and Structural Approaches to Filtering Internet Pornography; IEEE International Conference on Systems, Man and Cybernetics, 2004, which is the next proof of my hypothesis. I believe my thesis can help in the fight against child pornography. | en |
| dc.description.department | 460 - Katedra informatiky | cs |
| dc.description.result | dobře | cs |
| dc.format.extent | 988341 bytes | cs |
| dc.format.mimetype | application/pdf | cs |
| dc.identifier.other | OSD002 | cs |
| dc.identifier.sender | S2724 | cs |
| dc.identifier.thesis | SKA206_FEI_N2647_2612T025_2011 | |
| dc.identifier.uri | http://hdl.handle.net/10084/87110 | |
| dc.language.iso | cs | cs |
| dc.publisher | Vysoká škola báňská - Technická univerzita Ostrava | cs |
| dc.rights.access | openAccess | |
| dc.subject | dětská pornografie | cs |
| dc.subject | diplomová práce | cs |
| dc.subject | Vyhledávání nelegálního obsahu na Internetu | cs |
| dc.subject | webové stránky | cs |
| dc.subject | analýza textu | cs |
| dc.subject | četnost | cs |
| dc.subject | nelegální obsah | cs |
| dc.subject | shlukování | cs |
| dc.subject | Jaccardův koeficient podobnosti | cs |
| dc.subject | child pornography | en |
| dc.subject | thesis | en |
| dc.subject | Malicious Content Retrieval | en |
| dc.subject | web pages | en |
| dc.subject | text analysis | en |
| dc.subject | frequency | en |
| dc.subject | illegal content | en |
| dc.subject | clustering | en |
| dc.subject | Jaccard similarity coeficient | en |
| dc.thesis.degree-branch | Informatika a výpočetní technika | cs |
| dc.thesis.degree-grantor | Vysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatiky | cs |
| dc.thesis.degree-level | Magisterský studijní program | cs |
| dc.thesis.degree-name | Ing. | cs |
| dc.thesis.degree-program | Informační a komunikační technologie | cs |
| dc.title | Vyhledávání nelegálního obsahu na internetu | cs |
| dc.title.alternative | Malicious Content Retrieval | en |
| dc.type | Diplomová práce | cs |
Files
Original bundle
1 - 4 out of 4 results
Loading...
- Name:
- SKA206_FEI_N2647_2612T025_2011.pdf
- Size:
- 965.18 KB
- Format:
- Adobe Portable Document Format
Loading...
- Name:
- SKA206_FEI_N2647_2612T025_2011_zadani.pdf
- Size:
- 707.08 KB
- Format:
- Adobe Portable Document Format
Loading...
- Name:
- SKA206_FEI_N2647_2612T025_2011_posudek_vedouci_Snasel_Vaclav.pdf
- Size:
- 48.17 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího – Snášel, Václav
Loading...
- Name:
- SKA206_FEI_N2647_2612T025_2011_posudek_oponent_Kudelka_Milos.pdf
- Size:
- 51.55 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta – Kudělka, Miloš