VISIÓ PER COMPUTADOR
La visió per computador percep, reconeix i interpreta automàticament els continguts d’una escena visual.
L’objectiu de la visió per computador és analitzar els continguts visuals adquirits amb sensors d’imatge. Aquests sensors capturen llum o diferents radiacions: càmeres d’espectre visible, infraroig o ultraviolat, microscopis i telescopis, escàners mèdics o industrials 2D i 3D. Les dades que adquireixen són multidimensionals: fotografies, imatges tèrmiques, ultrasòniques o de profunditat, seqüències temporals de vídeo, diferents vistes d’un mateix entorn, representacions tridimensionals voxelitzades de teixits o materials o, fins i tot, núvols de punts.
Les tecnologies combinen el processament d’imatge, les tècniques de classificació basades en aprenentatge automàtic i les arquitectures d’aprenentatge profund per a la interpretació de l’escena i la presa de decisions en contextos d’intel·ligència artificial.
La visió per computador pren un paper fonamental en l’automatització i optimització de processos, ja que la interpretació del contingut de l’escena visual aporta informació semàntica d’alt nivell en entorns intel·ligents i robotitzats.
Típicament, se centra en els següents objectius:
- Processar, detectar, segmentar i analitzar continguts visuals.
- Classificar, reconèixer, identificar i caracteritzar objectes i accions.
- Determinar la trajectòria i la dinàmica d’un objecte en moviment.
- Reconèixer i interpretar escenes i comportaments.
- Mapejar i sincronitzar escenes i continguts visuals, naturals i models sintètics (realitat augmentada).
- Reconèixer gestos humans i anticipar intencions per a entorns computacionals amb interacció visual.