Zobrazit minimální záznam

dc.contributor.advisorPlatoš, Jan
dc.contributor.authorŠavelová, Alžbeta
dc.date.accessioned2025-06-23T11:48:54Z
dc.date.available2025-06-23T11:48:54Z
dc.date.issued2025
dc.identifier.otherOSD002
dc.identifier.urihttp://hdl.handle.net/10084/156733
dc.description.abstractTato práce se zabývá metodami přepisu mluvené řeči do textu a trénováním modelu rozpoznávání řeči Whisper pro slovenštinu. Cílem bylo vyvinout model schopný efektivně zpracovávat přirozenou mluvenou slovenštinu s různou délkou věty a rychlostí řeči. K trénování byla použita veřejně dostupná data z projektu Common Voice a vlastní sbírka nahrávek. Data byla pro účely trénování řádně předzpracována. Trénování bylo provedeno pomocí knihovny Transformers. Výsledný model byl vyhodnocen na základě přesnosti rozpoznávání (WER a CER) a ve srovnání s existujícími předtrénovanými modely vykazuje zlepšení v oblasti slovenštiny.cs
dc.description.abstractThis thesis deals with methods for transcribing spoken speech into text and training the Whisper speech recognition model for Slovak. The goal was to develop a model capable of efficiently processing natural spoken Slovak with varying sentence length and speech rate. Publicly available data from the Common Voice project and our own collection of recordings were used for training. The data was properly preprocessed for training purposes.The training was performed using the Transformers library. The resulting model was evaluated on the basis of recognition accuracy (WER and CER) and shows improvement in the Slovak domain compared to existing pre-trained models.en
dc.format.extent4280373 bytes
dc.format.mimetypeapplication/pdf
dc.language.isosk
dc.publisherVysoká škola báňská – Technická univerzita Ostravacs
dc.subjectrozpoznávání řečics
dc.subjectslovenský jazykcs
dc.subjectWhispercs
dc.subjectstrojové učenícs
dc.subjectzpracování audiacs
dc.subjectHugging Face Transformerscs
dc.subjecttréninkcs
dc.subjectCommon Voicecs
dc.subjectspeech recognitionen
dc.subjectSlovak languageen
dc.subjectWhisperen
dc.subjectmachine learningen
dc.subjectaudio processingen
dc.subjectHugging Face Transformersen
dc.subjecttrainingen
dc.subjectCommon Voiceen
dc.titlePrepis zvukových nahrávok do textovej podobysk
dc.title.alternativePřepis audiozáznamů do textové podobycs
dc.title.alternativeTranscription of Audio Recordings into Text Formen
dc.typeDiplomová prácecs
dc.contributor.refereeVašinek, Michal
dc.date.accepted2025-06-05
dc.thesis.degree-nameIng.
dc.thesis.degree-levelMagisterský studijní programcs
dc.thesis.degree-grantorVysoká škola báňská – Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.description.department460 - Katedra informatikycs
dc.thesis.degree-programInformatikacs
dc.description.resultvýborněcs
dc.identifier.senderS2724
dc.identifier.thesisSAV0019_FEI_N0613A140034_2025
dc.rights.accessopenAccess


Soubory tohoto záznamu

Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam