Vyhledávání nelegálního obsahu na internetu

dc.contributor.advisorSnášel, Václavcs
dc.contributor.authorSkanderová, Lenkacs
dc.contributor.refereeKudělka, Milošcs
dc.date.accepted2011-06-06cs
dc.date.accessioned2011-07-01T02:11:27Z
dc.date.available2011-07-01T02:11:27Z
dc.date.issued2011cs
dc.descriptionImport 04/07/2011cs
dc.descriptionZ důvodu ochrany citlivých údajů je plný text nepřístupný.
dc.description.abstractVyhledávání nelegálního obsahu na Internetu se soustřeďuje na analýzu webových stránek s dětskou pornografií. Jedná se o analýzu textu. Ve své diplomové práci zkoumám, jak se stránky s dětskou pornografií odlišují od ostatních webových stránek. Zaměřuji se na vyhledání charakteristických slov, která se zde objevují, a na jejich četnosti. K tomuto účelu jsem vytvořila vlastní software, který je schopen extrahovat ze stránek slova a seřadit je podle četností. Dále jsem použila metody shlukování a Jaccardův koeficient podobnosti. Vycházela jsem z hypotézy, že stránky s dětskou pornografií mají zcela unikátní slovník, který v jiných typech webu nenajdeme. Správnost této hypotézy potvrzují všechny výsledky, jichž jsem svými pokusy dosáhla. Vyhledávání nelegálního obsahu na Internetu se velkou měrou opírá o článek Wai H. Ho, Paul A. Watters, Statistical and Structural Approaches to Filtering Internet Pornography; IEEE International Conference on Systems, Man and Cybernetics, 2004, jenž zároveň slouží i jako další nepřímý důkaz mé hypotézy. Věřím, že má diplomová práce může pomoci v boji proti dětské pornografii.cs
dc.description.abstractSearching of Malicious Content Retrieval is aimed at analysis of web pages with child pornography. The thing is analysis of text. In my thesis I look about differences between pages with child pornography and other web pages. I put mind to searching of typically words and their frequencies. To the effect I have designed own software, which can extract words from pages and orded them by their frequencies. Next I have used methods of clustering and Jaccard similarity coeficient. I have started from the hypothesis that pages with child pornography contain unique vocabulary, which is not engaged otherwhere. All my achieved results confirm my hypothesis. The great pillar of Malicious Content Retrieval is the article Wai H. Ho, Paul A. Watters, Statistical and Structural Approaches to Filtering Internet Pornography; IEEE International Conference on Systems, Man and Cybernetics, 2004, which is the next proof of my hypothesis. I believe my thesis can help in the fight against child pornography.en
dc.description.department460 - Katedra informatikycs
dc.description.resultdobřecs
dc.format.extent988341 bytescs
dc.format.mimetypeapplication/pdfcs
dc.identifier.otherOSD002cs
dc.identifier.senderS2724cs
dc.identifier.thesisSKA206_FEI_N2647_2612T025_2011
dc.identifier.urihttp://hdl.handle.net/10084/87110
dc.language.isocscs
dc.publisherVysoká škola báňská - Technická univerzita Ostravacs
dc.rights.accessopenAccess
dc.subjectdětská pornografiecs
dc.subjectdiplomová prácecs
dc.subjectVyhledávání nelegálního obsahu na Internetucs
dc.subjectwebové stránkycs
dc.subjectanalýza textucs
dc.subjectčetnostcs
dc.subjectnelegální obsahcs
dc.subjectshlukovánícs
dc.subjectJaccardův koeficient podobnostics
dc.subjectchild pornographyen
dc.subjectthesisen
dc.subjectMalicious Content Retrievalen
dc.subjectweb pagesen
dc.subjecttext analysisen
dc.subjectfrequencyen
dc.subjectillegal contenten
dc.subjectclusteringen
dc.subjectJaccard similarity coeficienten
dc.thesis.degree-branchInformatika a výpočetní technikacs
dc.thesis.degree-grantorVysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.thesis.degree-levelMagisterský studijní programcs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-programInformační a komunikační technologiecs
dc.titleVyhledávání nelegálního obsahu na internetucs
dc.title.alternativeMalicious Content Retrievalen
dc.typeDiplomová prácecs

Files

Original bundle

Now showing 1 - 4 out of 4 results
Loading...
Thumbnail Image
Name:
SKA206_FEI_N2647_2612T025_2011.pdf
Size:
965.18 KB
Format:
Adobe Portable Document Format
Loading...
Thumbnail Image
Name:
SKA206_FEI_N2647_2612T025_2011_zadani.pdf
Size:
707.08 KB
Format:
Adobe Portable Document Format
Loading...
Thumbnail Image
Name:
SKA206_FEI_N2647_2612T025_2011_posudek_vedouci_Snasel_Vaclav.pdf
Size:
48.17 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího – Snášel, Václav
Loading...
Thumbnail Image
Name:
SKA206_FEI_N2647_2612T025_2011_posudek_oponent_Kudelka_Milos.pdf
Size:
51.55 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta – Kudělka, Miloš