Zobrazit minimální záznam

dc.contributor.advisorKrátký, Michalcs
dc.contributor.authorNedbálek, Alešcs
dc.date.accessioned2013-06-26T11:16:40Z
dc.date.available2013-06-26T11:16:40Z
dc.date.issued2013cs
dc.identifier.otherOSD002cs
dc.identifier.urihttp://hdl.handle.net/10084/98593
dc.descriptionImport 26/06/2013cs
dc.description.abstractRostoucí trend zpracování velkého množství dat vede k distribuci zátězě na více výpocětních uzlů a vzniku škálovatelných distribuovaných datových struktur - SDDS. Rozlozění dat umožňuje jejich paralelní zpracování, zvýšení propustnosti a duplicita dat mezi uzly můzě zajistit dostupnost při selhání. Těchto vlastností je trěba u aplikací s důrazem na dostupnost a s velkým počtem klientů. V práci uvádíme shrnutí vlastností jednotlivých SDDS s popisem distribuce a rozložení dat mezi uzly. Uvedené struktury lze rozdělit podle použitého konceptu distribuce na lineárně hashované a stromové datové struktury. V rámci vývoje navrhujeme podle pravidel dodržovaných SDDS vlastní koncept se způsobem distribuce a rozlozění pohledu na data. Celý koncept je implementován v jazyce C++. Serializaci volání metod a komunikaci jsme zpočátku chtěli prěvzít z verějně dostupných API knihoven. Následně jsme se však rozhodli pro vlastní implementaci. Navrhli a implementovali jsme metodu vzdáleného volání metod za pomoci dvou příkazů Command a ResultSet. Síťovou komunikaci testujeme na TCP a UDP protokolech. Datové struktury R-strom a B-strom k testům byly dodány z databázového systému QuickDB[24] implementovaného skupinou databázové systémy z katedry Informatiky. Implementace s sebou přinesla i mnoho problémů a různých rěšení společně s testy (serializaci přístupu, síťové prostrědí, vlákna). Výsledkem implementace je aplikace vícevláknového serveru a klienta s možností využití pro různé datové struktury. Reálné použití našla aplikace v projektu SGS Detekce plagiovaných dokumentů . Přístup k aplikaci zajišťuje webový klient v ASP.NET. Testy síťové komunikace nám ukázaly omezení v propustnosti reálné sítě. Na závěr jsme provedli testy vzniklé aplikace DDS a embedded rěšení pro B-strom a R-strom. Bohuzěl se v testech projevil vliv virtualizace prostrědí a nedostatek hardwarových prostrědků. Nedosáhli jsme prědpokládaných násobků propustnosti při replikaci dat. I prěs tyto nesnáze jsou výsledky zajímavé. Při vkládání se projevilo snízění propustnosti s rostoucí replikací dat. Výsledky bodových dotazů poukázaly na úměrný růst propustnosti s počtem replikací a rozsahové dotazy se částečně přiblížily propustnosti embedded rěšení.cs
dc.description.abstractThe growing trend of processing large amounts of data leads to the distribution load among multiple nodes and creation of scalable distributed data structures - SDDS. The distribution of data allows parallel processing, increase throughput and duplication data between nodes can ensure availability in the case of failure. These properties are necessary for applications with an emphasis on accessibility and a large number of clients. In this work we present the summary of each SDDS with a description of the distribution and data decomposition between nodes. These structures can be divided according to the concept used for linear hash and tree data structures. Development suggested the rules and we followed them to create own concepts SDDS. Decomposition and the distribution of view on the data, we propose own solution. The whole concept is implement in the C++ language. Serializing a call method and communication we want take from publicly available API libraries. Then we decided for their own implementation. We have designed and implemented a method for remote method calls using two commands Command and ResultSet. Testing communication on TCP and UDP protocols. Data structures like R-tree and B-tree for testing were supplied. Implementation has also brought many problems and different solutions together with tests (serializing access, network environment, threads). The result of the implementation is a multi-threaded server application and client enable to use various data structures. The real utilization found the application in to the project SGS Detection plagiarism documents. Access to the application provides a web client in ASP.NET. Tests of the network communication have shown us bandwidth constraints in a real network. Finally, we conducted tests of SDDS and embedded solutions for the B-tree and R-tree. Unfortunately, demonstrated in tests virtualization environment and lack of hardware resources. We did not achieve the expected throughput with scalable data replication. Despite these difficulties the results are interesting. When inserting data we decreases permeability with increase data replication. Results of the point queries referred to the proportional grow throughput with the numbers of data duplicity and the range querys are quite approximate to throughput embedded solutions.en
dc.format.extent14066740 bytescs
dc.format.mimetypeapplication/pdfcs
dc.language.isocscs
dc.publisherVysoká škola báňská - Technická univerzita Ostravacs
dc.subjectlineární hashcs
dc.subjectstromové datové strukturycs
dc.subjectdistribuované datové strukturycs
dc.subjectmasivně paralelní zpracování datcs
dc.subjectR-stromcs
dc.subjectB-stromcs
dc.subjectLinear hashen
dc.subjectTree data structuresen
dc.subjectDistributed data structuresen
dc.subjectMassive parallel data managementen
dc.subjectR-treeen
dc.subjectB-treeen
dc.titleDistribuované datové struktury pro masivně paralelní zpracování datcs
dc.title.alternativeDistributed Data Structures for Parallel Data Managementen
dc.typeDiplomová prácecs
dc.contributor.refereeBača, Radimcs
dc.date.accepted2013-06-11cs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-levelMagisterský studijní programcs
dc.thesis.degree-grantorVysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.description.department460 - Katedra informatikycs
dc.thesis.degree-programInformační a komunikační technologiecs
dc.thesis.degree-branchInformatika a výpočetní technikacs
dc.description.resultvýborněcs
dc.identifier.senderS2724cs
dc.identifier.thesisNED082_FEI_N2647_2612T025_2013
dc.rights.accessopenAccess


Soubory tohoto záznamu

Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam