Credit Score Prediction Using CART Algorithm in Python
| dc.contributor.advisor | Tichý, Tomáš | |
| dc.contributor.author | Francis, Mathew | |
| dc.contributor.referee | Kresta, Aleš | |
| dc.date.accepted | 2023-05-22 | |
| dc.date.accessioned | 2023-06-23T08:42:03Z | |
| dc.date.available | 2023-06-23T08:42:03Z | |
| dc.date.issued | 2023 | |
| dc.description.abstract | In this thesis, the objective is to create a credit scoring model that can be used by a bank to predict the creditworthiness of new customers. We consider the Home Equity dataset, which contains baseline and loan performance data for over 5,900 home equity loans. To improve the accuracy of scoring from large datasets, several machine learning algorithms can be applied. In this study, we adopted the CART algorithm to build a model that predicts whether the applicant can pay back the loan or not. By using machine learning techniques like CART, we can develop more precise models to help us evaluate the creditworthiness of loan applicants. For this we have used Python for developing the models. Ultimately, accurate credit scoring is critical to the lending process and helps to minimize the risks associated with granting credit. We have developed 4 models in this thesis to predict the credit score the 1st model is data without balancing, 2nd is balanced data model, 3rd random under sampling model and 4th random over sampling the application and the process we have explained in the application part of the thesis also the methods like tuning hyperparameters and important feature selection. We have evaluate the performance of the model using various metrics, including accuracy, precision, recall, and F1-score. After developing and evaluating the results of all the model’s accuracy we found that the balanced data provides us with the highest accuracy prediction of credit scores. The model works best predicting in the form of binary and in the form of credit scores, we have the accuracy as 83% for the test set and 87% for the train set while predicting the binary form and 92 % in case of credit score prediction. There are still ways to improve the accuracy, as the accuracy of the credit score is important. If we can improve the accuracy score of the binary form prediction, we can ultimately improve the accuracy score of the credit scores too. | en |
| dc.description.abstract | V této práci je cílem vytvořit model kreditního scoringu, který může banka použít k predikci bonity nových zákazníků. Bereme v úvahu datový soubor Home Equity, který obsahuje základní údaje a údaje o výkonnosti úvěrů pro více než 5 900 úvěrů na bydlení. Ke zlepšení přesnosti skórování z velkých datových sad lze použít několik algoritmů strojového učení. V této studii jsme použili algoritmus CART, abychom vytvořili model, který předpovídá, zda je žadatel schopen splatit půjčku či nikoli. Pomocí technik strojového učení, jako je CART, můžeme vyvinout přesnější modely, které nám pomohou vyhodnotit bonitu žadatelů o úvěr. K tomu jsme pro vývoj modelů použili Python. V konečném důsledku je přesné hodnocení úvěru rozhodující pro proces půjčování a pomáhá minimalizovat rizika spojená s poskytováním úvěru. V této práci jsme vyvinuli 4 modely pro predikci kreditního skóre, 1. model jsou data bez vyvažování, 2. je vyvážený datový model, 3. náhodný model při vzorkování a 4. náhodný nad vzorkováním aplikace a proces, který jsme vysvětlili v aplikační části v práci také metody jako ladění hyperparametrů a výběr důležitých vlastností. Vyhodnotili jsme výkon modelu pomocí různých metrik, včetně přesnosti, přesnosti, vyvolání a skóre F1. Po vyvinutí a vyhodnocení výsledků veškeré přesnosti modelu jsme zjistili, že vyvážená data nám poskytují nejpřesnější predikci kreditního skóre. Model funguje nejlépe predikcí ve formě binárního a ve formě kreditního skóre, máme přesnost 83 % pro testovací sadu a 87 % pro vlakovou soupravu při predikci binární formy a 92 % v případě predikce kreditního skóre . Stále existují způsoby, jak zlepšit přesnost, protože přesnost kreditního skóre je důležitá. Pokud dokážeme zlepšit skóre přesnosti predikce binárních forem, můžeme nakonec také zlepšit skóre přesnosti kreditních skóre. | cs |
| dc.description.department | 154 - Katedra financí | cs |
| dc.description.result | výborně | cs |
| dc.format.extent | 9481596 bytes | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.other | OSD002 | |
| dc.identifier.sender | S2751 | |
| dc.identifier.thesis | FRA0161_EKF_N0412A050005_2023 | |
| dc.identifier.uri | http://hdl.handle.net/10084/149670 | |
| dc.language.iso | en | |
| dc.publisher | Vysoká škola báňská – Technická univerzita Ostrava | cs |
| dc.rights.access | openAccess | |
| dc.subject | Credit scoring | en |
| dc.subject | predict | en |
| dc.subject | Creditworthiness | en |
| dc.subject | Random over sampling | en |
| dc.subject | Random under sampling | en |
| dc.subject | Balanced data | en |
| dc.subject | Unbalanced data | en |
| dc.subject | CART | en |
| dc.subject | Decision tree | en |
| dc.subject | Customers | en |
| dc.subject | Bank | en |
| dc.subject | Loan | en |
| dc.subject | Accuracy | en |
| dc.subject | evaluation | en |
| dc.subject | Kreditní hodnocení | cs |
| dc.subject | předpovědět | cs |
| dc.subject | bonita | cs |
| dc.subject | Náhodný výběr vzorků | cs |
| dc.subject | Náhodné pod vzorkováním | cs |
| dc.subject | Vyvážená data | cs |
| dc.subject | Nevyvážená data | cs |
| dc.subject | VOZÍK | cs |
| dc.subject | Rozhodovací strom | cs |
| dc.subject | Zákazníci | cs |
| dc.subject | Banka | cs |
| dc.subject | Půjčka | cs |
| dc.subject | Přesnost | cs |
| dc.subject | hodnocení | cs |
| dc.thesis.degree-grantor | Vysoká škola báňská – Technická univerzita Ostrava. Ekonomická fakulta | cs |
| dc.thesis.degree-level | Magisterský studijní program | cs |
| dc.thesis.degree-name | Ing. | |
| dc.thesis.degree-program | Finance | cs |
| dc.title | Credit Score Prediction Using CART Algorithm in Python | en |
| dc.title.alternative | Predikce úvěrového skóre pomocí algoritmu CART v jazyce Python | cs |
| dc.type | Diplomová práce | cs |
Files
Original bundle
1 - 4 out of 4 results
Loading...
- Name:
- FRA0161_EKF_N0412A050005_2023.pdf
- Size:
- 9.04 MB
- Format:
- Adobe Portable Document Format
- Description:
- Text práce
Loading...
- Name:
- FRA0161_EKF_N0412A050005_2023_zadani.pdf
- Size:
- 87.88 KB
- Format:
- Adobe Portable Document Format
- Description:
- Zadání
Loading...
- Name:
- FRA0161_EKF_N0412A050005_2023_posudek_vedouci_Tichy_Tomas.pdf
- Size:
- 144.78 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího – Tichý, Tomáš
Loading...
- Name:
- FRA0161_EKF_N0412A050005_2023_posudek_oponent_Kresta_Ales.pdf
- Size:
- 144.03 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta – Kresta, Aleš