Prepis zvukových nahrávok do textovej podoby

Šavelová, Alžbeta

dc.contributor.advisor	Platoš, Jan
dc.contributor.author	Šavelová, Alžbeta
dc.date.accessioned	2025-06-23T11:48:54Z
dc.date.available	2025-06-23T11:48:54Z
dc.date.issued	2025
dc.identifier.other	OSD002
dc.identifier.uri	http://hdl.handle.net/10084/156733
dc.description.abstract	Tato práce se zabývá metodami přepisu mluvené řeči do textu a trénováním modelu rozpoznávání řeči Whisper pro slovenštinu. Cílem bylo vyvinout model schopný efektivně zpracovávat přirozenou mluvenou slovenštinu s různou délkou věty a rychlostí řeči. K trénování byla použita veřejně dostupná data z projektu Common Voice a vlastní sbírka nahrávek. Data byla pro účely trénování řádně předzpracována. Trénování bylo provedeno pomocí knihovny Transformers. Výsledný model byl vyhodnocen na základě přesnosti rozpoznávání (WER a CER) a ve srovnání s existujícími předtrénovanými modely vykazuje zlepšení v oblasti slovenštiny.	cs
dc.description.abstract	This thesis deals with methods for transcribing spoken speech into text and training the Whisper speech recognition model for Slovak. The goal was to develop a model capable of efficiently processing natural spoken Slovak with varying sentence length and speech rate. Publicly available data from the Common Voice project and our own collection of recordings were used for training. The data was properly preprocessed for training purposes.The training was performed using the Transformers library. The resulting model was evaluated on the basis of recognition accuracy (WER and CER) and shows improvement in the Slovak domain compared to existing pre-trained models.	en
dc.format.extent	4280373 bytes
dc.format.mimetype	application/pdf
dc.language.iso	sk
dc.publisher	Vysoká škola báňská – Technická univerzita Ostrava	cs
dc.subject	rozpoznávání řeči	cs
dc.subject	slovenský jazyk	cs
dc.subject	Whisper	cs
dc.subject	strojové učení	cs
dc.subject	zpracování audia	cs
dc.subject	Hugging Face Transformers	cs
dc.subject	trénink	cs
dc.subject	Common Voice	cs
dc.subject	speech recognition	en
dc.subject	Slovak language	en
dc.subject	Whisper	en
dc.subject	machine learning	en
dc.subject	audio processing	en
dc.subject	Hugging Face Transformers	en
dc.subject	training	en
dc.subject	Common Voice	en
dc.title	Prepis zvukových nahrávok do textovej podoby	sk
dc.title.alternative	Přepis audiozáznamů do textové podoby	cs
dc.title.alternative	Transcription of Audio Recordings into Text Form	en
dc.type	Diplomová práce	cs
dc.contributor.referee	Vašinek, Michal
dc.date.accepted	2025-06-05
dc.thesis.degree-name	Ing.
dc.thesis.degree-level	Magisterský studijní program	cs
dc.thesis.degree-grantor	Vysoká škola báňská – Technická univerzita Ostrava. Fakulta elektrotechniky a informatiky	cs
dc.description.department	460 - Katedra informatiky	cs
dc.thesis.degree-program	Informatika	cs
dc.description.result	výborně	cs
dc.identifier.sender	S2724
dc.identifier.thesis	SAV0019_FEI_N0613A140034_2025
dc.rights.access	openAccess