dc.contributor.advisor | Krátký, Michal | cs |
dc.contributor.author | Nedbálek, Aleš | cs |
dc.date.accessioned | 2013-06-26T11:16:40Z | |
dc.date.available | 2013-06-26T11:16:40Z | |
dc.date.issued | 2013 | cs |
dc.identifier.other | OSD002 | cs |
dc.identifier.uri | http://hdl.handle.net/10084/98593 | |
dc.description | Import 26/06/2013 | cs |
dc.description.abstract | Rostoucí trend zpracování velkého množství dat vede k distribuci zátězě na více výpocětních uzlů a vzniku škálovatelných distribuovaných datových struktur - SDDS. Rozlozění
dat umožňuje jejich paralelní zpracování, zvýšení propustnosti a duplicita dat mezi uzly
můzě zajistit dostupnost při selhání. Těchto vlastností je trěba u aplikací s důrazem na
dostupnost a s velkým počtem klientů.
V práci uvádíme shrnutí vlastností jednotlivých SDDS s popisem distribuce a rozložení
dat mezi uzly. Uvedené struktury lze rozdělit podle použitého konceptu distribuce na
lineárně hashované a stromové datové struktury.
V rámci vývoje navrhujeme podle pravidel dodržovaných SDDS vlastní koncept se způsobem distribuce a rozlozění pohledu na data. Celý koncept je implementován v jazyce
C++. Serializaci volání metod a komunikaci jsme zpočátku chtěli prěvzít z verějně dostupných API knihoven. Následně jsme se však rozhodli pro vlastní implementaci. Navrhli
a implementovali jsme metodu vzdáleného volání metod za pomoci dvou příkazů
Command a ResultSet. Síťovou komunikaci testujeme na TCP a UDP protokolech. Datové
struktury R-strom a B-strom k testům byly dodány z databázového systému QuickDB[24]
implementovaného skupinou databázové systémy z katedry Informatiky. Implementace
s sebou přinesla i mnoho problémů a různých rěšení společně s testy (serializaci přístupu,
síťové prostrědí, vlákna).
Výsledkem implementace je aplikace vícevláknového serveru a klienta s možností využití pro různé datové struktury. Reálné použití našla aplikace v projektu SGS Detekce
plagiovaných dokumentů . Přístup k aplikaci zajišťuje webový klient v ASP.NET. Testy
síťové komunikace nám ukázaly omezení v propustnosti reálné sítě.
Na závěr jsme provedli testy vzniklé aplikace DDS a embedded rěšení pro B-strom a R-strom.
Bohuzěl se v testech projevil vliv virtualizace prostrědí a nedostatek hardwarových prostrědků. Nedosáhli jsme prědpokládaných násobků propustnosti při replikaci
dat. I prěs tyto nesnáze jsou výsledky zajímavé. Při vkládání se projevilo snízění propustnosti
s rostoucí replikací dat. Výsledky bodových dotazů poukázaly na úměrný růst
propustnosti s počtem replikací a rozsahové dotazy se částečně přiblížily propustnosti
embedded rěšení. | cs |
dc.description.abstract | The growing trend of processing large amounts of data leads to the distribution load
among multiple nodes and creation of scalable distributed data structures - SDDS. The
distribution of data allows parallel processing, increase throughput and duplication data
between nodes can ensure availability in the case of failure. These properties are necessary
for applications with an emphasis on accessibility and a large number of clients.
In this work we present the summary of each SDDS with a description of the distribution
and data decomposition between nodes. These structures can be divided according to the
concept used for linear hash and tree data structures.
Development suggested the rules and we followed them to create own concepts SDDS.
Decomposition and the distribution of view on the data, we propose own solution. The
whole concept is implement in the C++ language. Serializing a call method and communication
we want take from publicly available API libraries. Then we decided for their
own implementation. We have designed and implemented a method for remote method
calls using two commands Command and ResultSet. Testing communication on TCP and
UDP protocols. Data structures like R-tree and B-tree for testing were supplied. Implementation
has also brought many problems and different solutions together with tests
(serializing access, network environment, threads).
The result of the implementation is a multi-threaded server application and client enable
to use various data structures. The real utilization found the application in to the project
SGS Detection plagiarism documents. Access to the application provides a web client in
ASP.NET. Tests of the network communication have shown us bandwidth constraints in
a real network.
Finally, we conducted tests of SDDS and embedded solutions for the B-tree and R-tree.
Unfortunately, demonstrated in tests virtualization environment and lack of hardware
resources. We did not achieve the expected throughput with scalable data replication.
Despite these difficulties the results are interesting. When inserting data we decreases
permeability with increase data replication. Results of the point queries referred to the
proportional grow throughput with the numbers of data duplicity and the range querys
are quite approximate to throughput embedded solutions. | en |
dc.format.extent | 14066740 bytes | cs |
dc.format.mimetype | application/pdf | cs |
dc.language.iso | cs | cs |
dc.publisher | Vysoká škola báňská - Technická univerzita Ostrava | cs |
dc.subject | lineární hash | cs |
dc.subject | stromové datové struktury | cs |
dc.subject | distribuované datové struktury | cs |
dc.subject | masivně paralelní zpracování dat | cs |
dc.subject | R-strom | cs |
dc.subject | B-strom | cs |
dc.subject | Linear hash | en |
dc.subject | Tree data structures | en |
dc.subject | Distributed data structures | en |
dc.subject | Massive parallel
data management | en |
dc.subject | R-tree | en |
dc.subject | B-tree | en |
dc.title | Distribuované datové struktury pro masivně paralelní zpracování dat | cs |
dc.title.alternative | Distributed Data Structures for Parallel Data Management | en |
dc.type | Diplomová práce | cs |
dc.contributor.referee | Bača, Radim | cs |
dc.date.accepted | 2013-06-11 | cs |
dc.thesis.degree-name | Ing. | cs |
dc.thesis.degree-level | Magisterský studijní program | cs |
dc.thesis.degree-grantor | Vysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatiky | cs |
dc.description.department | 460 - Katedra informatiky | cs |
dc.thesis.degree-program | Informační a komunikační technologie | cs |
dc.thesis.degree-branch | Informatika a výpočetní technika | cs |
dc.description.result | výborně | cs |
dc.identifier.sender | S2724 | cs |
dc.identifier.thesis | NED082_FEI_N2647_2612T025_2013 | |
dc.rights.access | openAccess | |