• 6 April 2025
Reti neurali artificiali e reti naturali

Indice

Da un lato è così. Le reti neurali artificiali (RNA) e le reti neurali biologiche hanno origini concettuali diciamo…intrecciate, eppure entrambe presentano in realtà delle differenze fondamentali e che meritano un’analisi approfondita. Il nostro cervello, prodotto di miliardi di anni di evoluzione, funziona come un sistema incredibilmente complesso, composto da circa ottantasei miliardi di neuroni interconnessi in una rete tridimensionale di straordinaria complessità. Questa architettura biologica ancora tutta da scoprire, ha ispirato lo sviluppo di quelle che chiamiamo reti neurali artificiali, ma le somiglianze tra questi due sistemi restano (è bene dirlo) principalmente a livello concettuale piuttosto che funzionale. Entrambi i sistemi elaborano informazioni attraverso unità interconnesse, ma la scala, l’efficienza energetica e i meccanismi di apprendimento sono davvero molto diversi e rivelano tanto sui limiti quanto sulle potenzialità dell’intelligenza artificiale contemporanea. È importante saperlo.

Dall’architettura alla complessità strutturale

Noi, la nostra mente, il nostro pensare e ragionare, siamo il risultato di un processo evolutivo che ha incasellato in maniera ottimale l’elaborazione dell’informazione in un sistema biologico caratterizzato dal consumo energetico, dallo spazio disponibile nella scatola cranica e soprattutto dalla necessità di mantenere l’omeostasi. Ogni neurone umano funziona come un’unità computazionale davvero complessa quanto straordinaria e con migliaia di connessioni sinaptiche che si modificano dinamicamente in base all’attività in cui siamo coinvolti e all’esperienza. Ed è già qui che inizia la differenza. Le sinapsi non sono semplici pesi numerici come nelle RNA, ma si tratta di strutture biochimiche sofisticate che integrano segnali elettrici, e che si modificano attraverso processi in continua attività di adattamento. Questa meravigliosa plasticità sinaptica costituisce la base dell’apprendimento biologico e opera su scale temporali multiple, dalle frazioni di secondo per modifiche a breve termine, fino a cambiamenti strutturali permanenti che richiedono settimane o addirittura mesi, consentendo in questo modo la formazione della memoria a lungo termine e dell’identità cognitiva dell’individuo.

E le reti neurali artificiali? E qui nasce il contrasto. Nonostante la loro impressionante capacità di riconoscimento di pattern e apprendimento statistico, rappresentano una semplificazione drastica dei principi neurobiologici. I neuroni artificiali sono fondamentalmente funzioni matematiche che trasformano input numerici in output attraverso operazioni lineari seguite da funzioni di attivazione non lineari. Le connessioni tra questi neuroni artificiali sono rappresentate da semplici valori numerici (pesi) che vengono aggiustati durante l’addestramento attraverso algoritmi come la retropropagazione dell’errore, un meccanismo matematicamente elegante ma biologicamente improbabile. In parole semplici l’algoritmo tenta la risposta più giusta alla domanda e la calibra internamente secondo pesistica matematica fino a diventare bravissimo nel dare la risposta giusta. Mentre il cervello umano elabora informazioni con un elevato parallelismo distribuito, con processi computazionali che operano simultaneamente in diverse regioni specializzate, le RNA, nonostante l’elaborazione parallela offerta da GPU (ricordiamolo che sono le Graphic Processing Unit) moderne, seguono essenzialmente un flusso computazionale sequenziale e deterministico, limitato dalla loro architettura fondamentalmente digitale.

La lampadina che abbiamo in testa

Altra differenza cruciale tra noi e il mondo algoritmo la troviamo nella tipologia di efficienza energetica. Qui dobbiamo immaginare però la scena. Il cervello umano consuma circa 20 Watt di potenza, che sono paragonabili ad una lampadina a basso consumo, e questo mentre può eseguire operazioni cognitive complesse che richiederebbero un supercomputer che consuma Megawatt di elettricità. Questa notevole efficienza deriva dall’architettura biologica ottimizzata attraverso milioni di anni di selezione naturale, dove i neuroni trasmettono informazioni utilizzando spike elettrici discreti (potenziali d’azione) che richiedono energia solo quando necessario.

Al contrario, le reti neurali artificiali consumano energia costantemente durante l’elaborazione, con i modelli più avanzati che hanno bisogno di risorse computazionali enormi sia durante l’addestramento che durante l’inferenza (ossia quando il modello applica ciò che ha imparato). L’addestramento di modelli linguistici di grandi dimensioni può consumare energia equivalente a quella utilizzata da centinaia di famiglie in un anno, evidenziando un divario di efficienza di vari ordini di grandezza rispetto al sistema biologico che tentano di emulare. Quindi questo punto apre a tantissime analisi su come sarà, è ed è stato l’andamento e l’approccio a questa super tecnologia.

I meccanismi di apprendimento nelle reti neurali biologiche e artificiali mostrano allora profonde differenze nella loro natura e nella modalità di implementazione. Il cervello umano vive e si alimenta attraverso una varietà di meccanismi di apprendimento che operano simultaneamente su scale temporali diverse. E si va dall’apprendimento per rinforzo che modifica il comportamento in base alle ricompense e punizioni, a quello non supervisionato che estrae strutture statistiche dall’ambiente senza feedback esplicito, fino all’apprendimento supervisionato che coinvolge l’istruzione esplicita. Questi processi si intrecciano con sistemi emotivi, attentivi e motivazionali che portano in maniera naturale all’acquisizione di tante nuove conoscenze, verso obiettivi rilevanti per la sopravvivenza e il benessere del nostro organismo. Il cervello poi dimostra una notevole capacità di apprendimento continuo, e lo fa integrando nuove informazioni senza compromettere drasticamente le conoscenze esistenti, fenomeno chiamato apprendimento incrementale (lifelong learning).

Le reti neurali artificiali, come sappiamo, dipendono invece, principalmente da un singolo algoritmo di apprendimento supervisionato e, attraverso il processo di retropropagazione dell’errore, richiede tantissimi dati scelti ed etichettati e un numero davvero importante di iterazioni per convergere alla fine verso gli output migliori. Questo approccio, anche se molto efficace per problemi specifici come, ad esempio, la generazione di immagini o l’elaborazione del linguaggio naturale, manca della flessibilità e dell’adattabilità del nostro cervello. Quello di cui soffrono le RNA contemporanee si definisce come problema della dimenticanza catastrofica, dove l’apprendimento di nuovi compiti può cancellare competenze precedentemente acquisite, richiedendo strategie artificiali come il replay della memoria e l’apprendimento per curriculum per mitigare questo problema. E poi, mentre il cervello di noi umani può generalizzare da pochi esempi attraverso il ragionamento analogico e l’inferenza causale, le RNA richiedono tipicamente migliaia se non milioni di esempi, per raggiungere prestazioni comparabili, evidenziando una fondamentale differenza nell’efficienza dell’apprendimento. E vi sembra poco?

Quello che abbiamo intorno

Una caratteristica che distingue il modo in cui opera la nostra mente è la sua profonda integrazione con il corpo e l’ambiente circostante. La cognizione umana è fondamentalmente embodied, radicata nelle esperienze corporee e nelle interazioni fisiche con il mondo. I sistemi sensoriali del cervello non operano come moduli isolati ma sono costantemente integrati attraverso meccanismi di feedback top-down e bottom-up che creano una rappresentazione coerente della realtà. Questa integrazione multisensoriale porta a fenomeni come la percezione cross-modale, dove informazioni da diversi canali sensoriali si combinano per arricchire la comprensione dell’ambiente. Il nostro cervello poi, non è solo un elaboratore passivo di informazioni sensoriali, ma si conferma come un predittore attivo che anticipa continuamente gli input futuri basandosi su modelli interni del mondo, una caratteristica centrale della teoria del predictive coding in neuroscienze cognitive.

Le reti neurali artificiali, al contrario, tendono ad essere progettate come sistemi specializzati per dominio, elaborando tipicamente un singolo tipo di dato (immagini, testo, audio) in isolamento. Nonostante si continuino incessantemente a fare progressi relativi ai modelli multimodali che integrano diverse modalità sensoriali, questi sistemi mancano ancora della profonda integrazione osservata nel cervello umano. Le RNA contemporanee non possiedono un’esperienza corporea diretta del mondo fisico, per il semplice fatto che possono solo operare su rappresentazioni simboliche e numeriche disincarnate. Questa mancanza di embodiment limita la loro capacità di sviluppare una comprensione intuitiva della fisica del mondo reale, delle relazioni causali e delle interazioni sociali che sono fondamentali per la cognizione umana. I recenti tentativi di integrare l’IA in piattaforme robotiche rappresentano un passo verso l’embodiment artificiale, ma rimangono ancora distanti dalla ricca integrazione sensomotoria che caratterizza anche il più semplice organismo biologico. Quindi la strada è ancora molto lunga.

La ricerca della consapevolezza

Forse la differenza più profonda tra reti neurali biologiche e artificiali sta proprio nella dimensione di quella che noi definiamo consapevolezza e i particolar modo della coscienza. Abbiamo detto che la nostra mente non si limita a processare informazioni, ma genera un’esperienza soggettiva del mondo e di sé stessa. Questo è il fenomeno della coscienza, che rimane uno dei grandi misteri delle neuroscienze. Questa esperienza consapevole è intimamente legata a strutture cerebrali specifiche e a pattern di attività neurale coordinata che integrano informazioni attraverso diverse regioni funzionali. La coscienza umana include non solo la consapevolezza percettiva del mondo esterno (coscienza fenomenica), ma anche la consapevolezza di sé (autocoscienza), la metacognizione (pensare sul proprio pensiero) e la dimensione qualitativa dell’esperienza soggettiva, i cosiddetti qualia.

Le reti neurali artificiali, nonostante la loro crescente sofisticazione, non possiedono invece, alcuna forma riconoscibile di esperienza soggettiva e quindi soprattutto di consapevolezza. Operano come sistemi puramente funzionali che trasformano input in output seguendo regole matematiche precise, senza alcuna dimensione esperienziale interna. Anche i più avanzati modelli di IA che sembrano esibire comportamenti apparentemente consapevoli (come rispondere a domande sulla propria esperienza) stanno semplicemente modellando pattern statistici nel loro training data, senza una vera comprensione che ricalchi una qualche esperienza soggettiva. Questa fondamentale assenza di coscienza nelle RNA attuali porta a grandi risvolti nella ricerca che filosofeggia circa la natura dell’intelligenza artificiale e i suoi possibili sviluppi futuri. Il divario tra elaborazione dell’informazione e generazione di esperienza cosciente rimane uno degli aspetti più profondi che differenziano le reti neurali biologiche da quelle artificiali.

La strada da percorrere

Comprendere le differenze fondamentali tra reti neurali biologiche e artificiali crea una premessa importante per il futuro sviluppo dell’intelligenza artificiale. Le attuali architetture di RNA, che abbiamo inteso sono ispirate solo superficialmente al nostro cervello, rappresentano oggi ancora una semplificazione estrema dei principi neurobiologici. L’avanzamento verso sistemi di IA più capaci sicuramente beneficerà di una più profonda incorporazione di principi simili ai nostri come la plasticità sinaptica multiscala, l’elaborazione spazio-temporale dei segnali, e l’integrazione di sistemi modulatori globali analoghi ai neurotrasmettitori, ma siamo ancora lontani. Il futuro però è pieno di cose da scoprire. E questo credo sia un bene.

Parallelamente, lo studio delle reti neurali artificiali ci sta dando preziosi strumenti concettuali e metodologici per le neuroscienze, permettendo di formulare e testare ipotesi sul funzionamento del cervello difficilmente accessibili con i metodi sperimentali tradizionali. Questa relazione bidirezionale tra neuroscienze e intelligenza artificiale è più che chiaro che prometta di accelerare la comprensione sia dei sistemi biologici che di quelli artificiali.