Transfer learning pro analýzu textových dat
| dc.contributor.advisor | Svoboda, Radek | |
| dc.contributor.author | Jochymek, Lukáš | |
| dc.contributor.referee | Platoš, Jan | |
| dc.date.accepted | 2022-05-31 | |
| dc.date.accessioned | 2022-09-01T07:20:40Z | |
| dc.date.available | 2022-09-01T07:20:40Z | |
| dc.date.issued | 2022 | |
| dc.description.abstract | Cílem této práce bylo otestovat metody přeneseného učení na různých datasetech a poté tyto me- tody srovnat s jednoduššími metodami strojového učení používanými pro analýzu dat. Jelikož je analýza textu komplexní obor, vybral jsem pro své experimenty podobor zvaný klasifikace textu. Experimenty by se neobešly bez dat pro ně vhodných, proto se práce částečné zabývá vhodnou úpravou dat. Práce se zaměřuje nejen na data v anglickém jazyce, ale také v jazyce českém a francouzském, díky tomu je možno porovnat výkon jednotlivých modelů a metod pro daný jazyk. Zajímavé jsou potom výsledky pro jednotlivé přístupy, za zmínku stojí velmi vysoký výkon trans- former modelů, které i při malém množství trénovacích dat dosahují mnohdy lepších výsledků, než metody využívající hlubokého učení trénované na datových sadách obsahující statisíce trénovacích vzorků. | cs |
| dc.description.abstract | The aim of this bachelor thesis was to test transfer learning methods on different datasets and then compare results with simpler machine learning methods. Text analysis is a complex field, so I picked a subfield called text classification. Experiments need data, therefore I included a part dedicated to their preprocessing. There is more than one language used in the experiments. Used languages are English, French and Czech, with more languages I could compare results of each method and model within the language and without the doubt I could tell which method performs the best for the language. I would like to mention a very good performance of the transformer models, they can perform surprisingly well even with small training dataset, in most cases they even outperformed deep learning methods trained on tens of thousands training samples. | en |
| dc.description.department | 460 - Katedra informatiky | cs |
| dc.description.result | výborně | cs |
| dc.format.extent | 2719097 bytes | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.other | OSD002 | |
| dc.identifier.sender | S2724 | |
| dc.identifier.thesis | JOC0027_FEI_B0613A140014_2022 | |
| dc.identifier.uri | http://hdl.handle.net/10084/147359 | |
| dc.language.iso | cs | |
| dc.publisher | Vysoká škola báňská – Technická univerzita Ostrava | cs |
| dc.rights.access | openAccess | |
| dc.subject | přenesené učení | cs |
| dc.subject | analýza textu | cs |
| dc.subject | klasifikace textu | cs |
| dc.subject | analýza sentimentu | cs |
| dc.subject | strojové učení | cs |
| dc.subject | hluboké učení | cs |
| dc.subject | transformer modely | cs |
| dc.subject | transfer learning | en |
| dc.subject | text analysis | en |
| dc.subject | text classification | en |
| dc.subject | sentiment analysis | en |
| dc.subject | machine learning | en |
| dc.subject | deep learning | en |
| dc.subject | transformer models | en |
| dc.thesis.degree-grantor | Vysoká škola báňská – Technická univerzita Ostrava. Fakulta elektrotechniky a informatiky | cs |
| dc.thesis.degree-level | Bakalářský studijní program | cs |
| dc.thesis.degree-name | Bc. | |
| dc.thesis.degree-program | Informatika | cs |
| dc.title | Transfer learning pro analýzu textových dat | cs |
| dc.title.alternative | Transfer Learning for Text Data Analysis | en |
| dc.type | Bakalářská práce | cs |
Files
Original bundle
1 - 5 out of 5 results
Loading...
- Name:
- JOC0027_FEI_B0613A140014_2022.pdf
- Size:
- 2.59 MB
- Format:
- Adobe Portable Document Format
- Description:
- Text práce
Loading...
- Name:
- JOC0027_FEI_B0613A140014_2022_zadani.pdf
- Size:
- 46.51 KB
- Format:
- Adobe Portable Document Format
- Description:
- Zadání
Loading...
- Name:
- JOC0027_FEI_B0613A140014_2022_priloha.zip
- Size:
- 96.07 MB
- Format:
- Unknown data format
- Description:
- Příloha
Loading...
- Name:
- JOC0027_FEI_B0613A140014_2022_posudek_vedouci_Svoboda_Radek.pdf
- Size:
- 56.9 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího – Svoboda, Radek
Loading...
- Name:
- JOC0027_FEI_B0613A140014_2022_posudek_oponent_Platos_Jan.pdf
- Size:
- 54.36 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta – Platoš, Jan