Využití pokročilých statistických metod a metod strojového učení při řešení klasifikačních úloh v medicíně

dc.contributor.advisorBriš, Radim
dc.contributor.authorKondé, Adéla
dc.contributor.refereeMichálek, Jaroslav
dc.contributor.refereeVencálek, Ondřej
dc.contributor.refereeVolf, Petr
dc.date.accepted2024-02-14
dc.date.accessioned2024-06-27T17:07:44Z
dc.date.available2024-06-27T17:07:44Z
dc.date.issued2024
dc.description.abstractŘešení klasifikačních úloh je značnou aktuální výzvou napříč vědními odvětvími. V oblasti medicínských výzkumů se nejčastěji setkáváme s požadavkem na sestavení klasifikačního modelu pro predikci úmrtí pacienta, predikci úspěchu léčby nebo klinického stavu pacienta. Disertační práce byla inspirována reálným problémem pocházejícím z praxe Ústavu radiodiagnostického Fakultní nemocnice Ostrava a Lékařské fakulty Ostravské univerzity a jejich požadavku na sestavení predikčního modelu pro stav pacienta po třech měsících od prodělání ischemické cévní mozkové příhody na základě údajů dostupných do 24 hodin od přijetí pacienta. Při řešení těchto reálných problémů potřebuje analytik kvalitní podpůrný materiál, který mu poskytne přehled dostupných (nebo alespoň často používaných) klasifikačních algoritmů a zároveň ho bude umět provést celým procesem sestavení klasifikačního modelu. Žádný nám dostupný materiál (ani anglický, natož český) ovšem nesplňoval kladené nároky na úplnost informací a napříč literaturou, odbornými blogy a diskusními fóry odborné komunity jsme se setkávali s různými doporučeními ohledně aplikace klasifikačních metod a s nejednotností užívané terminologie. Rozhodli jsme se proto vybrat některé z nejčastěji používaných klasifikačních algoritmů z rodiny tradičních statistických metod i metod strojového učení a tuto vnímanou mezeru zaplnit. Práce se nejprve věnuje základním principům řešení klasifikačních úloh, nad kterými je vhodné se zamýšlet, ať už je použit jakýkoliv klasifikační algoritmus. Poté se zaměřuje na vybrané klasifikační metody – logistickou regresi, neuronové sítě a náhodné lesy. U každé metody je popsán její matematický princip, předpoklady použití, možnosti interpretace a transparentnost. Dále je uveden doporučený postup celého procesu sestavování modelu a upozornění na případná specifika, která se na použití dané klasifikační metody vážou. Důraz je kladen na důkladné vysvětlení metodických postupů. Popsané postupy jsou dále využity pro řešení praktického problému predikce stavu pacienta po třech měsících od prodělání ischemické cévní mozkové příhody, který nám byl inspirací. Demonstrované postupy, způsob prezentace výsledků a stručné návody pro implementaci v softwaru R mohou pak dále sloužit čtenářům jako inspirace při řešení vlastních klasifikačních problémů.cs
dc.description.abstractSolving classification problems is a significant current challenge across disciplines. In the field of medical research, we commonly receive a request to build a classification model to predict patient’s death, success of treatment, or patient’s clinical status. The dissertation was inspired by a real problem coming from the practice of the Department of Radiology of the University Hospital Ostrava and the Faculty of Medicine of the University of Ostrava and their desire to build a prediction model for the patient’s clinical status three months after an ischemic stroke based on data available within 24 hours after patient’s admission. To solve these real-world problems, analysts need a supporting material of a high quality that will provide an overview of available (or at least frequently used) classification algorithms and at the same time be able to guide them through the entire process of building a classification model. However, none of the material available to us (not even English, let alone Czech) met the requirements for completeness of information, and across the literature, science blogs and discussion forums of the science community we encountered different recommendations on the application of classification methods and inconsistencies in used terminology. We therefore decided to choose some of the most commonly used classification algorithms from the family of traditional statistical methods and machine learning methods and fill this perceived gap. The thesis first discusses the fundamental principles of solving classification problems, which are worth considering whatever classification algorithm is used. Then, it focuses on selected classification methods – logistic regression, neural networks, and random forests. For each method, its mathematical principle, assumptions, interpretation options, and its level of transparency are described. Also, a recommended procedure for the entire model building process is also provided, as well as a note on any specifics that are relevant to the use of the classification method. The focus is on a thorough explanation of the methodological procedures. Furthermore, the described procedures are used to solve the real-life problem of predicting the patient’s clinical status three months after an ischemic stroke, which inspired us. The demonstrated procedures, the presentation of the results, and the brief instructions for implementation in the R software can then further serve as inspiration for readers to solve their own classification problems.en
dc.description.department470 - Katedra aplikované matematikycs
dc.description.resultvyhovělcs
dc.format.extent1857412 bytes
dc.format.mimetypeapplication/pdf
dc.identifier.otherOSD002
dc.identifier.senderS2724
dc.identifier.thesisVRT0020_FEI_P1807_1103V036_2024
dc.identifier.urihttp://hdl.handle.net/10084/152735
dc.language.isocs
dc.publisherVysoká škola báňská – Technická univerzita Ostravacs
dc.rights.accessopenAccess
dc.subjectKlasifikacecs
dc.subjectPredikcecs
dc.subjectLogistická regresecs
dc.subjectNeuronové sítěcs
dc.subjectNáhodné lesycs
dc.subjectCévní mozková příhodacs
dc.subjectClassificationen
dc.subjectPredictionen
dc.subjectLogistic regressionen
dc.subjectNeural networksen
dc.subjectRandom forestsen
dc.subjectIschemic strokeen
dc.thesis.degree-branchVýpočetní a aplikovaná matematikacs
dc.thesis.degree-grantorVysoká škola báňská – Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.thesis.degree-levelDoktorský studijní programcs
dc.thesis.degree-namePh.D.
dc.thesis.degree-programInformatika, komunikační technologie a aplikovaná matematikacs
dc.titleVyužití pokročilých statistických metod a metod strojového učení při řešení klasifikačních úloh v medicíněcs
dc.title.alternativeEmploying advanced statistical and machine learning methods for solving classification problems in medicineen
dc.typeDisertační prácecs

Files

Original bundle

Now showing 1 - 5 out of 5 results
Loading...
Thumbnail Image
Name:
VRT0020_FEI_P1807_1103V036_2024.pdf
Size:
1.77 MB
Format:
Adobe Portable Document Format
Description:
Text práce
Loading...
Thumbnail Image
Name:
VRT0020_FEI_P1807_1103V036_2024_priloha.zip
Size:
82.67 KB
Format:
Unknown data format
Description:
Příloha
Loading...
Thumbnail Image
Name:
VRT0020_FEI_P1807_1103V036_2024_posudek_oponent_Michalek_Jaroslav.pdf
Size:
153.78 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta – Michálek, Jaroslav
Loading...
Thumbnail Image
Name:
VRT0020_FEI_P1807_1103V036_2024_posudek_oponent_Vencalek_Ondrej.pdf
Size:
154.77 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta – Vencálek, Ondřej
Loading...
Thumbnail Image
Name:
VRT0020_FEI_P1807_1103V036_2024_posudek_oponent_Volf_Petr.pdf
Size:
155 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta – Volf, Petr