Zobrazit minimální záznam

dc.contributor.advisorDráždilová, Pavlaen
dc.contributor.authorSuchánek, Jindřichen
dc.date.accessioned2009-09-01T20:17:45Z
dc.date.available2009-09-01T20:17:45Z
dc.date.issued2009en
dc.identifier.otherOSD002cs
dc.identifier.urihttp://hdl.handle.net/10084/75352
dc.description.abstractTato bakalářská práce se zabývá extrakcí dat z blogů na Internetu, jejich analýzou a zpracováním výsledků do grafové podoby. V první části práce byl vytvořen program, který příspěvky získané z blogů ukládá do XML souborů. Ty pak obsahují titulek, odkaz na příspěvek, autora, datum, odkazy a tělo příspěvku. Druhá část práce se zabývá zpracováním těchto souborů. Jejich analýza je vizualizována sloupcovými a koláčovými diagramy a orientovanými grafy. Následně je vypočítána podobnost mezi jednotlivými příspěvky pomocí vzorce pro kosinovou podobnost a vztah podobnosti mezi texty je pak použit jako cena hrany v neorientovaném grafu.cs
dc.description.abstractThis bachelor’s thesis is concerned with data extraction from blogs on the Internet, their analysis and its processing into the form of graphs. In the first part of the thesis, a program was created which saves the entries acquired from blogs to XML files. These files then include the title, a link to the entry, the author, date, links and the body of the entry. The second part of the thesis deals with processing these files. Their analysis is visualized using column and pie diagrams and directed graphs. The similarity is then calculated between separate entries using the formula for Cosine similarity and the similarity between texts is then used as the edge value in an undirected graph.en
dc.format29 l. : il. + 1 CDcs
dc.language.isocsen
dc.publisherVysoká škola báňská - Technická univerzita Ostravacs
dc.subjectpříspěvekcs
dc.subjectXMLcs
dc.subjectgrafcs
dc.subjectpodobnostcs
dc.subjectextrakcecs
dc.subjectblogcs
dc.subjectextractionen
dc.subjectsimilarityen
dc.subjectentryen
dc.subjectblogen
dc.subjectXMLen
dc.subjectgraphen
dc.titlePodobnost dokumentů na Webucs
dc.title.alternativeWeb document similarityen
dc.typeBakalářská prácecs
dc.identifier.signature200905059cs
dc.identifier.locationÚK/Sklad diplomových pracícs
dc.contributor.refereeMartinovič, Janen
dc.date.accepted2009-06-11en
dc.thesis.degree-nameBc.en
dc.thesis.degree-levelBakalářský studijní programcs
dc.thesis.degree-grantorVysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.description.categoryPrezenčnícs
dc.description.department456 - Katedra informatikyen
dc.thesis.degree-programInformační technologiecs
dc.thesis.degree-branchInformatika a výpočetní technikacs
dc.description.resultvelmi dobřecs
dc.identifier.senderS2724cs
dc.identifier.thesisSUC143_FEI_B2646_2612R025_2009en


Soubory tohoto záznamu

SouboryVelikostFormátZobrazit

K tomuto záznamu nejsou připojeny žádné soubory.

Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam