dc.contributor.advisor | Platoš, Jan | |
dc.contributor.author | Šavelová, Alžbeta | |
dc.date.accessioned | 2025-06-23T11:48:54Z | |
dc.date.available | 2025-06-23T11:48:54Z | |
dc.date.issued | 2025 | |
dc.identifier.other | OSD002 | |
dc.identifier.uri | http://hdl.handle.net/10084/156733 | |
dc.description.abstract | Tato práce se zabývá metodami přepisu mluvené řeči do textu a trénováním modelu rozpoznávání řeči Whisper pro slovenštinu. Cílem bylo vyvinout model schopný efektivně zpracovávat přirozenou mluvenou slovenštinu s různou délkou věty a rychlostí řeči. K trénování byla použita veřejně dostupná data z projektu Common Voice a vlastní sbírka nahrávek. Data byla pro účely trénování řádně předzpracována. Trénování bylo provedeno pomocí knihovny Transformers. Výsledný model byl vyhodnocen na základě přesnosti rozpoznávání (WER a CER) a ve srovnání s existujícími předtrénovanými modely vykazuje zlepšení v oblasti slovenštiny. | cs |
dc.description.abstract | This thesis deals with methods for transcribing spoken speech into text and training the Whisper speech recognition model for Slovak. The goal was to develop a model capable of efficiently processing natural spoken Slovak with varying sentence length and speech rate. Publicly available data from the Common Voice project and our own collection of recordings were used for training. The data was properly preprocessed for training purposes.The training was performed using the Transformers library. The resulting model was evaluated on the basis of recognition accuracy (WER and CER) and shows improvement in the Slovak domain compared to existing pre-trained models. | en |
dc.format.extent | 4280373 bytes | |
dc.format.mimetype | application/pdf | |
dc.language.iso | sk | |
dc.publisher | Vysoká škola báňská – Technická univerzita Ostrava | cs |
dc.subject | rozpoznávání řeči | cs |
dc.subject | slovenský jazyk | cs |
dc.subject | Whisper | cs |
dc.subject | strojové učení | cs |
dc.subject | zpracování audia | cs |
dc.subject | Hugging Face Transformers | cs |
dc.subject | trénink | cs |
dc.subject | Common Voice | cs |
dc.subject | speech recognition | en |
dc.subject | Slovak language | en |
dc.subject | Whisper | en |
dc.subject | machine learning | en |
dc.subject | audio processing | en |
dc.subject | Hugging Face Transformers | en |
dc.subject | training | en |
dc.subject | Common Voice | en |
dc.title | Prepis zvukových nahrávok do textovej podoby | sk |
dc.title.alternative | Přepis audiozáznamů do textové podoby | cs |
dc.title.alternative | Transcription of Audio Recordings into Text Form | en |
dc.type | Diplomová práce | cs |
dc.contributor.referee | Vašinek, Michal | |
dc.date.accepted | 2025-06-05 | |
dc.thesis.degree-name | Ing. | |
dc.thesis.degree-level | Magisterský studijní program | cs |
dc.thesis.degree-grantor | Vysoká škola báňská – Technická univerzita Ostrava. Fakulta elektrotechniky a informatiky | cs |
dc.description.department | 460 - Katedra informatiky | cs |
dc.thesis.degree-program | Informatika | cs |
dc.description.result | výborně | cs |
dc.identifier.sender | S2724 | |
dc.identifier.thesis | SAV0019_FEI_N0613A140034_2025 | |
dc.rights.access | openAccess | |