Feature-based Image Interpretation for Lightweight Computer Vision
Granholm, Erik (2015)
Granholm, Erik
Arcada - Nylands svenska yrkeshögskola
2015
Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:amk-2015072113866
https://urn.fi/URN:NBN:fi:amk-2015072113866
Tiivistelmä
Datorseende är ett område inom datavetenskap som innebär att extrahera underliggande
information ur bilddata, med avsikt att kunna agera utg
ående från bildens innehåll.
Människan kan lätt tolka färg och rymdinformation, särskilja för och bakgrund ifrån
varandra samt följa och klassificera objekt och personer från video. Även med ständigt
ökande beräkningskapacitet har datorer svårigheter att
nå nivån av ett två år gammalt
barn. Detta examensarbete utvärderar bildbehandlings algoritmer, samt algoritmer för
upptäckning, beskrivning samt jämförelse av såkallade bildkännetecken. Dylika
algoritmer har även implementerats i ett funktionsbibliotek f
ör självständig och
resurssnål datoseende, som också beskrivs i detta examensarbete. Computer vision is a field in computer science which aims to process, analyse and
understand images in order to extract underlying information from them and to act on the
information. Humans are able to extract information from visual stimuli with appa
rent
ease. We can interpret distances and color information, distinguish fore and background
as well as identify people and classify objects into groups. We can follow moving objects
in a consecutive sequence of images and accurately estimate spatial information from a video. Even with ever increasing processing power, computers have yet to reach the level of a two year old child in many of the applications.
This thesis evaluates image
processing, feature detecting, description and matching algorithms in c
omputer vision
with emphasis on scale invariant feature transform. A new independent and light weight
computer vision library has also been developed implementing some of the described
algorithms. An overview of this library is also provided in this thesis.
information ur bilddata, med avsikt att kunna agera utg
ående från bildens innehåll.
Människan kan lätt tolka färg och rymdinformation, särskilja för och bakgrund ifrån
varandra samt följa och klassificera objekt och personer från video. Även med ständigt
ökande beräkningskapacitet har datorer svårigheter att
nå nivån av ett två år gammalt
barn. Detta examensarbete utvärderar bildbehandlings algoritmer, samt algoritmer för
upptäckning, beskrivning samt jämförelse av såkallade bildkännetecken. Dylika
algoritmer har även implementerats i ett funktionsbibliotek f
ör självständig och
resurssnål datoseende, som också beskrivs i detta examensarbete.
understand images in order to extract underlying information from them and to act on the
information. Humans are able to extract information from visual stimuli with appa
rent
ease. We can interpret distances and color information, distinguish fore and background
as well as identify people and classify objects into groups. We can follow moving objects
in a consecutive sequence of images and accurately estimate spatial information from a video. Even with ever increasing processing power, computers have yet to reach the level of a two year old child in many of the applications.
This thesis evaluates image
processing, feature detecting, description and matching algorithms in c
omputer vision
with emphasis on scale invariant feature transform. A new independent and light weight
computer vision library has also been developed implementing some of the described
algorithms. An overview of this library is also provided in this thesis.