Zobrazit minimální záznam

dc.contributor.advisorKlimsza, Lucjan
dc.contributor.authorOkon, Aleš
dc.date.accessioned2025-06-23T11:47:02Z
dc.date.available2025-06-23T11:47:02Z
dc.date.issued2025
dc.identifier.otherOSD002
dc.identifier.urihttp://hdl.handle.net/10084/156062
dc.description.abstractPráce se zabývá vývojem softwarového řešení pro semi-automatizovanou extrakci environmentálních, sociálních a governance (ESG) aktivit a klíčových hospodářských ukazatelů z podnikových dokumentů. Cílem bylo vytvořit nástroj, jenž využívá moderní techniky umělé inteligence a data miningu k analýze strojově čitelných výročních zpráv a ESG reportů a dokáže z nich extrahovat relevantní informace o ESG aktivitách dle evropského standardu ESRS, zároveň pak vypočítá finanční metriky a kvantifikuje kvalitativní ESG data. Pro účely práce byl sestaven korpus přibližně 30 veřejně dostupných výročních zpráv českých společností z let 2019–2023. Dokumenty byly strojově předzpracovány (extrakce textu z PDF/DOCX, OCR tam, kde bylo nutné), segmentovány do tzv. „chunků“ o max. 50 000 znacích a opatřeny instrukcemi obsahujícími úplný rejstřík témat ESRS. Softwarový prototyp byl implementován v Pythonu s využitím knihoven PyPDF2, python-docx, tkinter a pyperclip, přičemž interakce s velkým jazykovým modelem (GPT-o3) probíhala formou kopírování promptů do schránky. Testování na vybraných dokumentech prokázalo, že model po obdržení kompletního promptu spolehlivě generuje tabulky přiřazující jednotlivá témata ESRS, počítá celkové i dílčí ESG skóre a extrahuje finanční ukazatele (tržby, EBITDA, čistý zisk, celková aktiva, ROA, ROE). Strojová extrakce dosáhla průměrné shody 84 % v porovnání s ruční anotací v tematických kategoriích a 97 % přesnosti v identifikaci číselných údajů. Výsledky potvrzují, že vyvinuté softwarové řešení splňuje jak hlavní výzkumnou otázku – zda lze AI-nástrojem automatizovaně analyzovat a extrahovat klíčové ESG a ekonomické informace z podnikových dokumentů, tak vedlejší otázku, zda je možné kvantifikovat kvalitativní ESG data. Součástí práce jsou doporučení pro manažerskou praxi a návrhy dalšího rozvoje prototypu, včetně plné automatizace API volání, rozšíření metriky hodnocení a nasazení v multilingválním prostředí.cs
dc.description.abstractThe thesis deals with the development of a software solution for the semi-automated extraction of environmental, social, and governance (ESG) activities and key financial indicators from corporate documents. Its aim was to create a tool that leverages modern artificial intelligence and data-mining techniques to analyze machine-readable annual reports and ESG disclosures, extract relevant information on ESG activities in accordance with the European Sustainability Reporting Standards (ESRS), compute financial metrics, and quantify qualitative ESG data. For this purpose, a corpus of approximately 30 publicly available annual reports of Czech companies from 2019 to 2023 was assembled. Documents were preprocessed automatically (text extraction from PDF/DOCX, OCR where necessary), segmented into “chunks” of up to 50,000 characters, and annotated with instructions containing the complete index of ESRS topics. The software prototype was implemented in Python using the PyPDF2, python-docx, tkinter, and pyperclip libraries, with interaction with the large language model (GPT-o3) carried out by copying prompts to the clipboard. Testing on selected documents demonstrated that, once provided with the full prompt, the model reliably generates tables mapping individual ESRS topics, calculates overall and sub-scores for ESG, and extracts financial indicators (revenue, EBITDA, net profit, total assets, ROA, ROE). The automated extraction achieved an average agreement of 84 % with manual annotation in thematic categories and 97 % accuracy in identifying numerical values. The results confirm that the developed software solution satisfies both the primary research question—whether an AI-driven tool can automatically analyze and extract key ESG and financial information from corporate documents—and the secondary question of whether it is possible to quantify qualitative ESG data. The thesis also includes recommendations for managerial practice and proposals for further prototype development, including full automation of API calls, expansion of evaluation metrics, and deployment in a multilingual environment.en
dc.format.extent1269041 bytes
dc.format.mimetypeapplication/pdf
dc.language.isocs
dc.publisherVysoká škola báňská – Technická univerzita Ostravacs
dc.subjectESGcs
dc.subjectESRScs
dc.subjectextrakce datcs
dc.subjectzpracování přirozeného jazykacs
dc.subjectstrojové učenícs
dc.subjectdata miningcs
dc.subjectoptické rozpoznávání znakůcs
dc.subjectvýroční zprávycs
dc.subjectvelké jazykové modelycs
dc.subjectPythoncs
dc.subjectautomatizovaná analýza dokumentůcs
dc.subjecthospodářské ukazatelecs
dc.subjectESGen
dc.subjectESRSen
dc.subjectData extractionen
dc.subjectNatural Language Processingen
dc.subjectMachine Learningen
dc.subjectData miningen
dc.subjectOptical Character Recognitionen
dc.subjectAnnual reportsen
dc.subjectLarge Language Modelsen
dc.subjectPythonen
dc.subjectAutomated document analysisen
dc.subjectFinancial indicatorsen
dc.titleVyužití AI a data miningu k analýze vlivu ESG na hospodářské výsledky podnikucs
dc.title.alternativeUsing AI and Data Mining to Analyze the Impact of ESG on Business Performanceen
dc.typeBakalářská prácecs
dc.contributor.refereeŽižka, Ivo
dc.date.accepted2025-06-02
dc.thesis.degree-nameBc.
dc.thesis.degree-levelBakalářský studijní programcs
dc.thesis.degree-grantorVysoká škola báňská – Technická univerzita Ostrava. Ekonomická fakultacs
dc.description.department115 - Katedra managementucs
dc.thesis.degree-programEkonomika a managementcs
dc.thesis.degree-branchManagementcs
dc.description.resultvelmi dobřecs
dc.identifier.senderS2751
dc.identifier.thesisOKO0006_EKF_B0413A050012_S03_2025
dc.rights.accessopenAccess


Soubory tohoto záznamu

Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam