dc.contributor.advisor | Svoboda, Radek | |
dc.contributor.author | Jochymek, Lukáš | |
dc.date.accessioned | 2022-09-01T07:20:40Z | |
dc.date.available | 2022-09-01T07:20:40Z | |
dc.date.issued | 2022 | |
dc.identifier.other | OSD002 | |
dc.identifier.uri | http://hdl.handle.net/10084/147359 | |
dc.description.abstract | Cílem této práce bylo otestovat metody přeneseného učení na různých datasetech a poté tyto me-
tody srovnat s jednoduššími metodami strojového učení používanými pro analýzu dat. Jelikož je
analýza textu komplexní obor, vybral jsem pro své experimenty podobor zvaný klasifikace textu.
Experimenty by se neobešly bez dat pro ně vhodných, proto se práce částečné zabývá vhodnou
úpravou dat. Práce se zaměřuje nejen na data v anglickém jazyce, ale také v jazyce českém a
francouzském, díky tomu je možno porovnat výkon jednotlivých modelů a metod pro daný jazyk.
Zajímavé jsou potom výsledky pro jednotlivé přístupy, za zmínku stojí velmi vysoký výkon trans-
former modelů, které i při malém množství trénovacích dat dosahují mnohdy lepších výsledků, než
metody využívající hlubokého učení trénované na datových sadách obsahující statisíce trénovacích
vzorků. | cs |
dc.description.abstract | The aim of this bachelor thesis was to test transfer learning methods on different datasets and then
compare results with simpler machine learning methods. Text analysis is a complex field, so I picked
a subfield called text classification. Experiments need data, therefore I included a part dedicated
to their preprocessing. There is more than one language used in the experiments. Used languages
are English, French and Czech, with more languages I could compare results of each method and
model within the language and without the doubt I could tell which method performs the best for
the language. I would like to mention a very good performance of the transformer models, they can
perform surprisingly well even with small training dataset, in most cases they even outperformed
deep learning methods trained on tens of thousands training samples. | en |
dc.format.extent | 2719097 bytes | |
dc.format.mimetype | application/pdf | |
dc.language.iso | cs | |
dc.publisher | Vysoká škola báňská – Technická univerzita Ostrava | cs |
dc.subject | přenesené učení | cs |
dc.subject | analýza textu | cs |
dc.subject | klasifikace textu | cs |
dc.subject | analýza sentimentu | cs |
dc.subject | strojové učení | cs |
dc.subject | hluboké učení | cs |
dc.subject | transformer modely | cs |
dc.subject | transfer learning | en |
dc.subject | text analysis | en |
dc.subject | text classification | en |
dc.subject | sentiment analysis | en |
dc.subject | machine learning | en |
dc.subject | deep learning | en |
dc.subject | transformer models | en |
dc.title | Transfer learning pro analýzu textových dat | cs |
dc.title.alternative | Transfer Learning for Text Data Analysis | en |
dc.type | Bakalářská práce | cs |
dc.contributor.referee | Platoš, Jan | |
dc.date.accepted | 2022-05-31 | |
dc.thesis.degree-name | Bc. | |
dc.thesis.degree-level | Bakalářský studijní program | cs |
dc.thesis.degree-grantor | Vysoká škola báňská – Technická univerzita Ostrava. Fakulta elektrotechniky a informatiky | cs |
dc.description.department | 460 - Katedra informatiky | cs |
dc.thesis.degree-program | Informatika | cs |
dc.description.result | výborně | cs |
dc.identifier.sender | S2724 | |
dc.identifier.thesis | JOC0027_FEI_B0613A140014_2022 | |
dc.rights.access | openAccess | |