Controllo intelligente per sistemi in rete - IDSIA
Area scientifica
Controllo intelligente per sistemi in rete
Area leaders:
SUPSI Image Focus
Apprendimento per rinforzo basato su grafi in ambienti strutturati
La ricerca si concentra sugli avanzamenti metodologici per valorizzare le rappresentazioni neurali basate su grafi nel contesto dell'apprendimento per rinforzo. L’obiettivo principale è sviluppare un quadro teorico per supportare l’apprendimento di politiche componibili, intese come unità computazionali a livello di nodo, che contribuiscono al processo decisionale elaborando informazioni in modo integrato e interagendo con un insieme di altre politiche, condividendo parametri comuni e scambiando messaggi lungo alcune connessioni.
Grazie a questo approccio modulare è possibile sfruttare la struttura intrinseca del sistema edi riutilizzare gli stessi moduli per affrontare problemi differenti.
Principali ambiti di ricerca:
- Comprensione teorica dell’espressività delle politiche componibili basate sul message passing. I metodi esistenti per la progettazione di politiche componibili non hanno una giustificazione o garanzia teorica; è necessario inquadrare correttamente il problema per fondare le scelte progettuali su basi teoriche solide.
- Astrazione spazio-temporale con rappresentazioni gerarchiche.
L’apprendimento di politiche locali a livello di attuatori rende l’astrazione spazio-temporale più complessa. Questo problema viene affrontato introducendo rappresentazioni grafiche gerarchiche e multilivello che implementano in modo naturale architetture di apprendimento per rinforzo gerarchico. - Controllo di agenti metamorfici.
La maggior parte dei metodi esistenti si concentra su contesti in cui la struttura degli agenti è fissa e non varia nel tempo. La ricerca consente invece agli agenti di modificare autonomamente la propria morfologia e di sviluppare algoritmi per la progettazione automatica e l’apprendimento su grafi.
Ottimizzazione combinatoria e intelligenza artificiale per la pianificazione e il controllo intelligenti
La progettazione, la pianificazione e la gestione di sistemi interconnessi comportano complessi problemi decisionali e di controllo. La sinergia tra ottimizzazione combinatoria e intelligenza artificiale consente lo sviluppo di metodi di soluzione più scalabili e accurati, guidati da sfide emergenti quali l’elettrificazione industriale, la digitalizzazione e la sostenibilità.
Dal punto di vista metodologico, l’intelligenza artificiale supporta la configurazione automatica degli algoritmi di ottimizzazione, guida l’esplorazione dei processi di ricerca e individua soluzioni promettenti. Il machine learning facilita la decomposizione di problemi su larga scala, mentre le tecniche di regressione basate su AI permettono di approssimare in modo efficiente fenomeni non lineari complessi, abilitando metodi di ottimizzazione senza derivata. Inoltre, l’ottimizzazione combinatoria – attraverso formulazioni convesse, robuste e a numeri interi misti – offre strumenti solidi e affidabili per migliorare l’addestramento dei modelli di AI e la taratura dei parametri, superando gli approcci euristici tradizionali.
Controllo ottimale e auto-adattamento delle macchine industriali
Oltre all’uso di algoritmi standard di apprendimento attivo (come l’Ottimizzazione Bayesiana), IDSIA ha introdotto nuovi algoritmi, come l’ottimizzazione basata sulle preferenze, in cui al decisore viene chiesto di esprimere iterativamente soltanto una preferenza qualitativa a coppie (ad esempio, “questo è meglio di quello”) tra due vettori decisionali candidati. Questo approccio è particolarmente efficace quando la funzione obiettivo non è quantificabile, perché di natura qualitativa o perché coinvolge diversi obiettivi con priorità non definite. Tali metodi sfruttano la naturale capacità umana di confrontare due opzioni alternative piuttosto che assegnare "valutazioni assolute" e includono una nuova formazione di Preferential Bayesian Optimization basata su processi skew-gaussian, con risultati superiori agli algoritmi di ottimizzazione bayesiana basati su preferenze allo stato dell’arte.
Queste metodologie sono state applicate con successo in attività di sigillatura robotica e di assemblaggio; nella calibrazione degli iper-parametri per un’implementazione efficiente di leggi di controllo predittivo basate su modelli (anche embedded); e in diversi progetti applicati finanziati da Innosuisse e dall’UE per la calibrazione dei parametri delle macchine in: taglio laser ad alta potenza (in collaborazione con Bystronic AG); foratura ed elettroerosione a filo (in collaborazione con Georg Fischer Ltd); e laser a impulsi ultracorti per la manifattura e la lavorazione ad alta precisione (in collaborazione con CSEM, BHF e FEMTOPrint SA).
Rappresentazioni spazio-temporali relazionali per la previsione e il controllo
Principali sfide di ricerca:
- Progettazione di agenti di apprendimento con bias induttivi architetturali che consentano l’acquisizione di rappresentazioni spazio-temporali attraverso l’interazione sequenziale con l’ambiente, nell’ambito dell’apprendimento per rinforzo model-free.
- Sviluppo di rappresentazioni spazio-temporali relazionali per l’analisi di serie temporali, con applicazioni alla previsione e all’imputazione di serie temporali multivariate ad alta dimensionalità. In questo contesto, i framework neurali a grafo spazio-temporali vengono estesi al trattamento di serie temporali multivariate generiche, come quelle generate da reti di sensori.
- Integrazione di questi approcci nell’apprendimento per rinforzo model-based, in cui il processo di apprendimento della politica è supportato da un modello spazio-temporale dell’ambiente appreso e rappresentato come grafo.
Biofisica computazionale
IDSIA ospita anche un’unità di biofisica computazionale (CBU) che applica un’ampia gamma di tecniche computazionali molecolari e multiscala per lo studio di sistemi biologici complessi. L’attività di ricerca dell’unità si concentra su ambiti quali i sistemi di drug delivery e la progettazione e ottimizzazione di nanoparticelle, lo screening virtuale in silico basato sulla struttura e sui ligandi, lo studio dei meccanismi d’azione dei farmaci e l’auto-assemblaggio di biopolimeri.