Nell’ambito della ricerca fisica, c’è un enigma cruciale da risolvere: spiegare come le proprietà collettive sorgano dalle interazioni microscopiche.
Le interazioni, infatti, costituiscono i mattoni fondamentali di quasi tutte le teorie fisiche e sono descritte da termini polinomiali nell’azione. L’approccio tradizionale consiste nel derivare questi termini dai processi elementari e poi utilizzare il modello risultante per fare previsioni sull’intero sistema.
Ma cosa succede se i processi sottostanti sono sconosciuti?
È possibile invertire l’approccio e apprendere l’azione microscopica osservando l’intero sistema? In uno studio recente, i ricercatori hanno utilizzato reti neurali invertibili per apprendere prima la distribuzione dei dati osservati.
Attraverso la scelta di una non linearità adeguata per la funzione di attivazione neuronale, sono stati in grado di calcolare l’azione dai pesi del modello addestrato; un linguaggio diagrammatico esprime il cambiamento dell’azione da strato a strato.
Questo processo ha rivelato come la rete costruisca gerarchicamente le interazioni tramite trasformazioni non lineari delle relazioni in coppia. L’approccio è stato testato su dataset simulati di teorie interagenti e su un dataset di immagini consolidato (MNIST).
La rete riproduce in modo coerente una vasta classe di distribuzioni unimodali; al di fuori di questa classe, individua teorie efficaci che approssimano le statistiche dei dati fino al terzo cumulante.
Gli autori mostrano esplicitamente come la profondità della rete e la quantità di dati migliorino congiuntamente l’accordo tra il modello appreso e quello vero.
Questo lavoro dimostra come sfruttare il potere dell’apprendimento automatico per estrarre in modo trasparente modelli microscopici dai dati.