Vés al contingut (premeu Retorn)

Processament d'Imatge i Visió Artificial

Aquest curs proporciona una perspectiva de les tècniques essencials de processat, anàlisi i interpretació d’imatges. El curs està estructurat en funció de la complexitat de la informació extreta de les imatges i del nivell d’interpretació de l’escena. El primer bloc estudia els models útils per a l’extracció inicial d’informació mitjançant una única imatge, en particular els models d’espai vectorial, de morfologia matemàtica i de conjunts de nivells. El segon bloc presenta les eines necessàries per extraure informació simple a partir d’un conjunt d’imatges, que poden provenir de múltiples càmeres o d’una seqüencia de vídeo. El procés d’interpretació de les imatges implica generalment un pas d’agrupament de la informació prèviament extreta. Les tècniques relacionades amb aquest procés de visió a nivell mitjà combinen processos de segmentació, d’agrupament o de seguiment i són el contingut del tercer bloc de l’assignatura. Finalment, els processos de més alt nivell de reconeixement implicats en la interpretació de la informació es presenten en el darrer bloc de l’assignatura en relació amb las tècniques vistes a l’assignatura Aprenentatge Automàtic II.

Desenvolupar la intuïció del comportament dels sistemes audiovisuals i de les característiques dels senyals amb especial èmfasi en els senyals audiovisuals. Presentar els elements fonamentals de la percepció dels senyals audiovisuals. Proporcionar eines addicionals útils per a processar en els dominis temporals i transformats senyals discrets genèrics i audiovisuals. Il·lustrar aplicacions pràctiques del processament de senyals audiovisuals.

Temari
  • Extracció d’informació de nivell baix en imatges aïllades.
    • Filtres lineals (repàs)
    • Filtres no-lineals: Filtres de mediana, bilaterals i no locals
    • Transformades (DFT, DCT, KLT, Multiresolució: piràmides i wavelets)
    • Morfologia matemàtica
    • Mètodes variacionals i conjunts de nivells.
    • Descriptors locals d’imatges (gradients, SIFT, HoG, Patrons locals binaris)
  • Extracció d’informació de nivell baix en múltiples imatges
    • Model de càmera i calibració
    • Processat d’imatges estèreo (correspondència binocular i multivista)
    • Seqüencies de vídeo (Estimació de moviment, càmeres no calibrades)
  • Extracció d’informació de nivell mig:
    • Segmentació (contorns actius, K-means, creixement i fusió de regions, Graphcut, CNN)
    • Agrupament i modelat (Transformada de Hough, Ransac)
    • Seguiment (Filtre de Kalman i de partícules, CNN)
  • Extracció d’informació de nivell alt:
  • Detecció i reconeixement amb tècniques d’aprenentatge

 

Més informació a la guia de l'assignatura

 

TADSE