dc.contributor.advisor | Krátký, Michal | cs |
dc.contributor.author | Chovanec, Peter | cs |
dc.date.accessioned | 2016-04-18T07:42:08Z | |
dc.date.available | 2016-04-18T07:42:08Z | |
dc.date.issued | 2015 | cs |
dc.identifier.other | OSD002 | cs |
dc.identifier.uri | http://hdl.handle.net/10084/111490 | |
dc.description | Import 02/11/2016 | cs |
dc.description | Import 18/04/2016 | cs |
dc.description.abstract | Viacrozmerné prístupové metódy sa v posledných rokoch stali veľmi populárne. Podporujú základné funkcie (insert, update, delete a bodové dotazovanie) a častokrát podporujú aj iné typy dotazov, ako sú rozsahové dotazy, podobnostné dotazy a podobne. Viacrozmerné prístupové metódy možno deliť na stromové prístupové metódy a mriežkové prístupové metódy. Mriežkové prístupové metódy sú silne závislé na distribúcii dát; majú extrémne zlý worst-case scenario pre pamäťovú réžiu a pre časovú zložitosť operácií insert, update a delete. Z týchto dôvodov, stromové prístupové metódy dominujú nad mriežkovými. Aj keď stromové prístupové metódy prekonávajú mriežkové prístupové metódy pri vykonávaní spomenutých operácií, spracovanie rozsahových dotazov sa ukázalo byť neefektívne v mnohých prípadoch.
V tejto práci sa zameriavame na spracovanie viacrozmerných rozsahových dotazov bez nutnosti sekvenčného prechodu celou dátovou kolekciou. Problémom rozsahového dotazu pomocou algoritmu prehľadávania do hĺbky je náhodné pristupovanie k uzlom dátovej štruktúry. Tento problém nastáva hlavne v prípade, keď sú uzly čítané z pevného disku. Ďalšie problémy stromových prístupových metód sa objavujú so zvyšujúcou sa dimenziou indexovaného priestoru. V takomto prípade listové uzly vyhovujúce dotazu častokrát neobsahujú žiadne relevantné dáta. Keď znížime počet prístupov k uzlom pri spracovaní rozsahového dotazu, znížime taktiež dobu spracovania dotazu bez ohľadu na to, či sú uzly uložené v hlavnej pamäti alebo na pevnom disku.
Táto práca popisuje tri techniky znižujúce počet prístupov k uzlom pri spracovaní rozsahového dotazu. Prvá z nich je optimalizácia diskových prístupov pomocou prefetch techník. Pri druhej technike sa zameriavame na optimalizáciu spracovania viacnásobných rozsahových dotazov, inak povedané na spracovanie sekvencie rozsahových dotazov pomocou jediného prechodu stromu. Tretia technika umožňuje efektívnejšie spracovanie špeciálneho typu rozsahového dotazu, takzvaného úzkeho rozsahového dotazu, s použitím signatúr. Vzhľadom na to, že R-strom je najbežnejšou viacrozmernou dátovou štruktúrou, spomenuté techniky sú prezentované najmä na ňom. | cs |
dc.description.abstract | Multidimensional access methods have become very popular in recent years. They support basic operations (insert, delete, update, and point query) and they often support other query types like the multidimensional range query, similarity queries and so on. Multidimensional access methods can be classified as tree access methods and grid access methods. The grid access methods are highly dependent on the distribution of the data; they have the extremely bad worstcase scenario for the space overhead and the time complexity of the operations insert, update, and delete. Therefore, tree access methods dominate over them. Although tree access methods overcome grid access methods in the case of those operations, query processing have been shown to be inefficient in many cases.
In this thesis, we aim our effort at the processing of the multidimensional range query without necessity of a sequential scan through a complete data collection. However, when a depth-first range query algorithm of a data structure is applied, nodes of the data structure are randomly accessed. It is especially a problem when the nodes are read from the secondary storage. Moreover, other issues of the tree access methods appear when the dimensionality of a space is increased, as a result, many leaf nodes matched by the algorithm do not include any relevant data. When we reduce the number of nodes accessed during range query processing, we reduce the query processing time regardless the nodes are stored in the main memory or in the secondary storage.
This thesis describes three techniques reducing the number of nodes accessed during a range query is processed. The first one is an optimization of disk accesses by prefetch techniques. In the second technique, we focus on an optimization of multiple range query processing, i.e. processing a sequence of range queries using one tree traversal. The third technique enables more efficient processing of a special kind of the range query, the narrow range query, using signatures. Since the R-tree is the most common multidimensional data structure, presented techniques are especially applied on the R-tree. | en |
dc.format | 153 s. : il. | cs |
dc.format.extent | 2376963 bytes | cs |
dc.format.mimetype | application/pdf | cs |
dc.language.iso | en | cs |
dc.publisher | Vysoká škola báňská - Technická univerzita Ostrava | cs |
dc.subject | viacrozmerné prístupové metódy, spracovanie rozsahových dotazov, R-strom, prefetch techniky, viacnásobné rozsahové dotazy, signatúry | cs |
dc.subject | multidimensional access methods, range query processing, R-tree, prefetch techniques, multiple range queries, signatures | en |
dc.title | Reduction of disk accesses in multidimensional data structures | en |
dc.title.alternative | Redukce diskových přístupů ve vícerozměrných datových strukturách | cs |
dc.type | Disertační práce | cs |
dc.identifier.signature | 201600084 | cs |
dc.identifier.location | ÚK/Sklad diplomových prací | cs |
dc.contributor.referee | Pokorný, Jaroslav | cs |
dc.contributor.referee | Kudělka, Miloš | cs |
dc.contributor.referee | Kolář, Dušan | cs |
dc.date.accepted | 2016-01-12 | cs |
dc.thesis.degree-name | Ph.D. | cs |
dc.thesis.degree-level | Doktorský studijní program | cs |
dc.thesis.degree-grantor | Vysoká škola báňská - Technická univerzita Ostrava. Fakulta elektrotechniky a informatiky | cs |
dc.description.category | Prezenční | cs |
dc.description.department | 460 - Katedra informatiky | cs |
dc.thesis.degree-program | Informatika, komunikační technologie a aplikovaná matematika | cs |
dc.thesis.degree-branch | Informatika | cs |
dc.description.result | vyhověl | cs |
dc.identifier.sender | S2724 | cs |
dc.identifier.thesis | CHO247_FEI_P1807_1801V001_2015 | |
dc.rights.access | openAccess | |