Simple Camera-based Object Distance Estimation

dc.contributor.advisorBarghi Jond, Hossein
dc.contributor.authorPham, Ngoc Thach
dc.contributor.refereeGaura, Jan
dc.date.accepted2022-08-09
dc.date.accessioned2022-09-01T07:20:06Z
dc.date.available2022-09-01T07:20:06Z
dc.date.issued2022
dc.description.abstractThere has been a quick and effective increase in computer vision research in recent years, and this will continue. Part of this success may be attributed to the adoption and adaptation of Machine Learning methods, while other parts can be attributed to the invention of novel representations and models for specific computer vision challenges, as well as the development of cost-effective solutions. Object detection is one area that has made significant strides in recent years. Object detection has been used in a variety of applications, including robotics, consumer electronics (e.g., smart phones), security, and transportation (e.g., autonomous and assisted driving). In this thesis, the detection task is the first job completed since it enables the acquisition of further information about the identified object as well as about the surrounding scene. Once an instance of an item has been detected, it is possible to gain more information, such as the ability to identify an object and estimated its distance. It is the goal of this study to give a detailed and in-depth explanation of how to find objects and figure out how far apart they are. This thesis is primarily concerned with the creation of object distance measurement and feature extraction algorithms using the You Only Look Once (YOLO) method combined with the Triangle Similarity and Monodepth2 approach for calculating distance with a single fixed camera. The purpose of this thesis is to investigate the detection ability of the method, YOLOv4-tiny, which is one of the most common nowadays. Furthermore, it is more accurate than other detection methods and executes more quickly. The YOLO method outperforms all of the measures we looked at while still delivering a high frame rate for real-time use. Instead of picking the most appealing part of an image, the YOLO technique predicts classes and bounding boxes for the entire image in a single algorithm run. We recommend using a combination of the YOLOv4-tiny and the Triangle Similarity and a very well-known approach called Monodepth2 of the lens camera to estimate the distance between the detected item and the camera. This will allow for a more accurate measurement of the distance. Using the YOLO approach, we detect an object in an image and extract its location and width from the image. This is also known as a virtual image. The items utilized in the tests are photographs of everyday things such as bottles, people, bags, and cars,... By comparing the real and imaginary widths of an object, the triangle similarity approach will be able to determine the focal length of a camera and, as a result, determine the best distance between it and the object. At the end of the process, the linear regression approach is used to forecast the error from the observed distance.en
dc.description.abstractV posledních letech došlo k rychlému a efektivnímu nárůstu výzkumu v oblasti počítačového vidění, který bude pokračovat. Část tohoto úspěchu lze přičíst přijetí a přizpůsobení metod strojového učení, zatímco další část lze přičíst vynálezu nových reprezentací a modelů pro specifické problémy počítačového vidění a také vývoji nákladově efektivních řešení. Detekce objektů je jednou z oblastí, která v posledních letech dosáhla významného pokroku. Detekce objektů se používá v řadě aplikací, včetně robotiky, spotřební elektroniky (např. chytrých telefonů), bezpečnosti a dopravy (např. autonomní a asistované řízení). V této práci je detekční úloha první splněnou úlohou, protože umožňuje získat další informace o identifikovaném objektu i o okolní scéně. Jakmile je instance předmětu detekována, je možné získat další informace, například možnost identifikovat objekt a odhadnout jeho vzdálenost. Cílem této studie je podat podrobný a zevrubný výklad o tom, jak najít objekty a zjistit, jak jsou od sebe vzdáleny. Tato práce se zabývá především vytvořením algoritmů pro měření vzdálenosti objektů a extrakci prvků pomocí metody You Only Look Once (YOLO) v kombinaci s přístupem Triangle Similarity a Monodepth2 pro výpočet vzdálenosti pomocí jedné pevné kamery. Cílem této práce je prozkoumat detekční schopnost metody YOLOv4-tiny, která je v současné době jednou z nejrozšířenějších. Navíc je přesnější než ostatní metody detekce a provádí se rychleji. Metoda YOLO překonává všechna námi zkoumaná opatření a zároveň poskytuje vysokou snímkovou frekvenci pro použití v reálném čase. Namísto výběru nejatraktivnější části snímku předpovídá technika YOLO třídy a ohraničující boxy pro celý snímek v jediném běhu algoritmu. Doporučujeme použít kombinaci YOLOv4-tiny a trojúhelníkové podobnosti a velmi známého přístupu nazvaného Monodepth2 objektivu kamery pro odhad vzdálenosti mezi detekovaným předmětem a kamerou. To umožní přesnější měření vzdálenosti. Pomocí přístupu YOLO detekujeme objekt v obraze a extrahujeme z něj jeho polohu a šířku. Tento obraz je také znám jako virtuální obraz. Předměty využité v testech jsou fotografie věcí každodenní potřeby, jako jsou láhve, lidé, tašky a auta,... Porovnáním skutečné a imaginární šířky předmětu bude přístup založený na trojúhelníkové podobnosti schopen určit ohniskovou vzdálenost fotoaparátu a v důsledku toho určit nejlepší vzdálenost mezi ním a předmětem. Na konci procesu se použije přístup lineární regrese k předpovědi chyby ze zjištěné vzdálenosti.cs
dc.description.department460 - Katedra informatikycs
dc.description.resultdobřecs
dc.format.extent6927499 bytes
dc.format.mimetypeapplication/pdf
dc.identifier.otherOSD002
dc.identifier.senderS2724
dc.identifier.thesisPHA0027_FEI_B2647_2612R025_2022
dc.identifier.urihttp://hdl.handle.net/10084/147257
dc.language.isoen
dc.publisherVysoká škola báňská – Technická univerzita Ostravacs
dc.rights.accessopenAccess
dc.subjectNeural networken
dc.subjectDeep Learningen
dc.subjectObject detectionen
dc.subjectEstimated distanceen
dc.subjectYOLOen
dc.subjectTriangle Similarityen
dc.subjectMonodepth2en
dc.subjectcomputer visionen
dc.subjectreal-timeen
dc.subjectNeuronová síťcs
dc.subjecthluboké učenícs
dc.subjectdetekce objektůcs
dc.subjectodhadovaná vzdálenostcs
dc.subjectYOLOcs
dc.subjecttrojúhelníková podobnostcs
dc.subjectMonodepth2cs
dc.subjectpočítačové viděnícs
dc.subjectreálný čascs
dc.thesis.degree-branchInformatika a výpočetní technikacs
dc.thesis.degree-grantorVysoká škola báňská – Technická univerzita Ostrava. Fakulta elektrotechniky a informatikycs
dc.thesis.degree-levelBakalářský studijní programcs
dc.thesis.degree-nameBc.
dc.thesis.degree-programInformační a komunikační technologiecs
dc.titleSimple Camera-based Object Distance Estimationen
dc.title.alternativeJednoduchý odhad vzdálenosti objektu založený na kamerových záznamechcs
dc.typeBakalářská prácecs

Files

Original bundle

Now showing 1 - 5 out of 5 results
Loading...
Thumbnail Image
Name:
PHA0027_FEI_B2647_2612R025_2022.pdf
Size:
6.61 MB
Format:
Adobe Portable Document Format
Description:
Text práce
Loading...
Thumbnail Image
Name:
PHA0027_FEI_B2647_2612R025_2022_zadani.pdf
Size:
46.55 KB
Format:
Adobe Portable Document Format
Description:
Zadání
Loading...
Thumbnail Image
Name:
PHA0027_FEI_B2647_2612R025_2022_priloha.zip
Size:
21.68 MB
Format:
Unknown data format
Description:
Příloha
Loading...
Thumbnail Image
Name:
PHA0027_FEI_B2647_2612R025_2022_posudek_vedouci_Barghi_Jond_Hossein.pdf
Size:
58.65 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího – Barghi Jond, Hossein
Loading...
Thumbnail Image
Name:
PHA0027_FEI_B2647_2612R025_2022_posudek_oponent_Gaura_Jan.pdf
Size:
53.45 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta – Gaura, Jan