Artificial Intelligence and Robotics - Intelligenza Artificiale e Robotica

COMPUTER VISION

Obiettivi formativi

OBIETTIVI GENERALI Il corso vuole introdurre lo studente ai concetti fondamentali della visione artificiale e alla costruzione di sistemi autonomi di interpretazione e ricostruzione di una scena tramite immagini e video. Il corso affronta elementi di base di geometria proiettiva ed epipolare, i metodi per la visione 3d e per la visione basata su più viste, e i metodi per la ricostruzione metrica e le metodologie di interpretazione di immagini e video. Inoltre il corso illustra le tecniche principali per il riconoscimento e la segmentazione di immagini e video basati sull’ apprendimento automatico. OBIETTIVI SPECIFICI Conoscenza e Comprensione Il corso stimola la curiosità degli studenti verso nuove metodologie per l’analisi e la generazioni di immagini e di video. Lo studente apprende nuovi concetti che gli permettono di acquisire una conoscenza di base della visione computazionale. Applicare Conoscenza e Comprensione Gli studenti approfondiscono e apprendono linguaggi di programmazione per applicare la conoscenza acquisita. In particolare approfondiscono il linguaggio Python ed apprendono Tensorflow. Quest’ ultimo offre agli studenti la possibilità di programmare applicazioni di deep learning. Usano questa nuovissima tecnologia per realizzare un progetto di riconoscimento di elementi specifici in immagini e video. Capacità critiche e di Giudizio Lo studente acquisisce la capacità di distinguere tra ciò che può realizzare con gli strumenti che ha appreso, come ad esempio generare delle immagini o riconoscere degli oggetti usando tecniche di deep learning, e ciò che è effettivamente richiesto per la realizzazione di un sistema automatico di visione. In tal modo è in grado di elaborare un giudizio critico sui sistemi di visione disponibili allo stato dell’arte e di valutare ciò che si può effettivamente realizzare e ciò che richiede ulteriori avanzamenti nella ricerca. Capacità Comunicative La realizzazione del progetto, come parte del programma di esame, richiede che lo studente lavori e dia un contributo all’ interno di un piccolo gruppo di lavoro. Questo insieme alla soluzione di esercizi in classe, e alle discussioni sui temi più interessanti stimola le capacità comunicative dello studente. Capacità di Apprendimento Oltre alle classiche capacità di apprendimento fornite dallo studio teorico del materiale didattico, le modalità di svolgimento del corso, in particolare le attività progettuali, stimolano lo studente all'approfondimento autonomo di alcuni argomenti presentati nel corso, al lavoro di gruppo, e all'applicazione concreta delle nozioni e delle tecniche apprese durante il corso.

Canale 1

IRENE AMERINI Scheda docente

Programmi - Frequenza - Esami

Programma

1. Image Processing Image Formation and Filtering Frequency analysis Feature Detection and Matching Motion and Optical flow 2. Multiview Geometry Cameras, Multiple Views Projective geometry and camera geometry 3. Deep Learning for Computer Vision Deep Learning for computer vision and basic architectures Object classification and detection, semantic segmentation and instance segmentation Sequence models: RNN, transformers in vision and attention model, action recognition Generative models Monocular depth estimation 4. Computer Vision Security and Forensics Dataset Bias and Adversarial examples Multimedia forensics and deepfake detection

Prerequisiti

Elements of programming (Python), Machine Learning

Testi di riferimento

Suggested (not mandatory) - Computer Vision and Image Processing: «Computer Vision: Algorithms and Applications», Richard Szeliski , 2022 (available for free at: https://szeliski.org/Book/) - MultiView Geometry: “MultiView Geometry in Computer Vision”, Richard Hartley & Andrew Zisserman, Cambridge ed. - Understanding Deep Learning. J.D. Prince, https://udlbook.github.io/udlbook/ - Deep Learning with PyTorch, Eli Stevens, Luca Antiga, Thomas Viehmann - Deep learning: «Deep Learning», Ian Goodfellow , Yoshua Bengio , Aaron Courville (available at: https://www.deeplearningbook.org/) - Scientific papers and articles discussed during the course

Modalità insegnamento

Lectures and tutoring sessions at the computer

Frequenza

non-mandatory attendance

Modalità di esame

● The exam covers the different sections of the course (1-4) ● The assessment of the exam consist of a project + project presentation (worth 1/2) and a final written exam (worth 1/2). ● Final project: Algorithms, objectives and topics for the final project may be freely chosen (a list of topics will be given at the half of the course). ● It requires a project abstract to be presented at the end of the course and approved by the instructors ● Groups from 1 to 3 people

Modalità di erogazione

In presence lectures and tutoring sessions at the computer