Zobrazit minimální záznam

dc.contributor.advisorPlatoš, Jan
dc.contributor.authorMichalco, Dominik
dc.date.accessioned2025-06-23T11:50:00Z
dc.date.available2025-06-23T11:50:00Z
dc.date.issued2025
dc.identifier.otherOSD002
dc.identifier.urihttp://hdl.handle.net/10084/156980
dc.description.abstractThis bachelor thesis investigates the Decision Transformer (DT) model, a recent method that reformulates reinforcement learning (RL) as a sequence modeling problem. Unlike traditional RL approaches that rely on value functions or policy gradients, DT predicts future actions based on full trajectories of states, actions, and desired returns (return-to-go). The thesis first presents the theoretical foundations of reinforcement learning and Transformer architectures, followed by a detailed examination of the DT model’s components, architecture, and advantages. Practical application areas are then proposed and evaluated through experiments in a grid-based navigation task and the game 2048. The results highlight the model’s strengths and weaknesses, and offer insights for future research and deployment in real-world settings.en
dc.description.abstractTato bakalářská práce se zabývá modelem Decision Transformer (DT), který představuje moderní přístup k řešení úloh posilovaného učení (reinforcement learning) pomocí sekvenčního modelování. Na rozdíl od tradičních metod RL, které se opírají o odhady hodnot nebo přímou optimalizaci politiky, se DT spoléhá na předchozí trajektorie a predikuje následující akce na základě historie stavů, akcí a požadovaného návratu (return-to-go). Práce nejprve představuje teoretický základ posilovaného učení a architektury Transformer, následuje podrobný popis modelu Decision Transformer, včetně jeho architektury a výhod oproti klasickým metodám. Praktická část se zaměřuje na návrh vhodných oblastí použití a ověření funkčnosti modelu pomocí experimentů v prostředí navigace v mřížce a ve hře 2048. Výsledky ukazují silné i slabé stránky modelu a poskytují doporučení pro jeho další využití v praxi.cs
dc.format.extent2040325 bytes
dc.format.mimetypeapplication/pdf
dc.language.isoen
dc.publisherVysoká škola báňská – Technická univerzita Ostravacs
dc.subjectDecision Transformeren
dc.subjectreinforcement learningen
dc.subjectsequence modelingen
dc.subjectTransformeren
dc.subjectoffline RLen
dc.subjectaction predictionen
dc.subjectdeep learningen
dc.subject2048en
dc.subjectnavigationen
dc.subjectDecision Transformercs
dc.subjectposilované učenícs
dc.subjectsekvenční modelovánícs
dc.subjectTransformercs
dc.subjectoffline RLcs
dc.subjectpredikce akcícs
dc.subjecthluboké učenícs
dc.subject2048cs
dc.subjectnavigacecs
dc.titleDecision Transformer Model and Its Practical Use Casesen
dc.title.alternativeModel Decision Transformer a jeho využití v praxics
dc.title.alternativeModel Decision Transformer a jeho využitie v praxisk
dc.typeBakalářská prácecs
dc.contributor.refereeDráždilová, Pavla
dc.date.accepted2025-06-02
dc.thesis.degree-nameBc.
dc.thesis.degree-levelBakalářský studijní programcs
dc.thesis.degree-grantorVysoká škola báňská – Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.description.department460 - Katedra informatikycs
dc.thesis.degree-programInformatikacs
dc.description.resultvelmi dobřecs
dc.identifier.senderS2724
dc.identifier.thesisMIC0494_FEI_B0613A140014_2025
dc.rights.accessopenAccess


Soubory tohoto záznamu

Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam