Prepis zvukových nahrávok do textovej podoby

dc.contributor.advisorPlatoš, Jan
dc.contributor.authorŠavelová, Alžbeta
dc.contributor.refereeVašinek, Michal
dc.date.accepted2025-06-05
dc.date.accessioned2025-06-23T11:48:54Z
dc.date.available2025-06-23T11:48:54Z
dc.date.issued2025
dc.description.abstractTato práce se zabývá metodami přepisu mluvené řeči do textu a trénováním modelu rozpoznávání řeči Whisper pro slovenštinu. Cílem bylo vyvinout model schopný efektivně zpracovávat přirozenou mluvenou slovenštinu s různou délkou věty a rychlostí řeči. K trénování byla použita veřejně dostupná data z projektu Common Voice a vlastní sbírka nahrávek. Data byla pro účely trénování řádně předzpracována. Trénování bylo provedeno pomocí knihovny Transformers. Výsledný model byl vyhodnocen na základě přesnosti rozpoznávání (WER a CER) a ve srovnání s existujícími předtrénovanými modely vykazuje zlepšení v oblasti slovenštiny.cs
dc.description.abstractThis thesis deals with methods for transcribing spoken speech into text and training the Whisper speech recognition model for Slovak. The goal was to develop a model capable of efficiently processing natural spoken Slovak with varying sentence length and speech rate. Publicly available data from the Common Voice project and our own collection of recordings were used for training. The data was properly preprocessed for training purposes.The training was performed using the Transformers library. The resulting model was evaluated on the basis of recognition accuracy (WER and CER) and shows improvement in the Slovak domain compared to existing pre-trained models.en
dc.description.department460 - Katedra informatikycs
dc.description.resultvýborněcs
dc.format.extent4280373 bytes
dc.format.mimetypeapplication/pdf
dc.identifier.otherOSD002
dc.identifier.senderS2724
dc.identifier.thesisSAV0019_FEI_N0613A140034_2025
dc.identifier.urihttp://hdl.handle.net/10084/156733
dc.language.isosk
dc.publisherVysoká škola báňská – Technická univerzita Ostravacs
dc.rights.accessopenAccess
dc.subjectrozpoznávání řečics
dc.subjectslovenský jazykcs
dc.subjectWhispercs
dc.subjectstrojové učenícs
dc.subjectzpracování audiacs
dc.subjectHugging Face Transformerscs
dc.subjecttréninkcs
dc.subjectCommon Voicecs
dc.subjectspeech recognitionen
dc.subjectSlovak languageen
dc.subjectWhisperen
dc.subjectmachine learningen
dc.subjectaudio processingen
dc.subjectHugging Face Transformersen
dc.subjecttrainingen
dc.subjectCommon Voiceen
dc.thesis.degree-grantorVysoká škola báňská – Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.thesis.degree-levelMagisterský studijní programcs
dc.thesis.degree-nameIng.
dc.thesis.degree-programInformatikacs
dc.titlePrepis zvukových nahrávok do textovej podobysk
dc.title.alternativePřepis audiozáznamů do textové podobycs
dc.title.alternativeTranscription of Audio Recordings into Text Formen
dc.typeDiplomová prácecs

Files

Original bundle

Now showing 1 - 5 out of 6 results
Loading...
Thumbnail Image
Name:
SAV0019_FEI_N0613A140034_2025.pdf
Size:
4.08 MB
Format:
Adobe Portable Document Format
Description:
Text práce
Loading...
Thumbnail Image
Name:
SAV0019_FEI_N0613A140034_2025_zadani.pdf
Size:
125.35 KB
Format:
Adobe Portable Document Format
Description:
Zadání
Loading...
Thumbnail Image
Name:
SAV0019_FEI_N0613A140034_2025_priloha.zip
Size:
4.25 MB
Format:
Unknown data format
Description:
Příloha
Loading...
Thumbnail Image
Name:
SAV0019_FEI_N0613A140034_2025_posudek_vedouci_Platos_Jan.pdf
Size:
138.41 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího – Platoš, Jan
Loading...
Thumbnail Image
Name:
SAV0019_FEI_N0613A140034_2025_posudek_oponent_Vasinek_Michal.pdf
Size:
141.72 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta – Vašinek, Michal