Negli ultimi anni, i termini "Intelligenza Artificiale" (AI) e "Machine Learning" (ML) sono diventati sempre più comuni in ambito medico. Tuttavia, per molti, questi concetti rimangono avvolti in un'aura di complessità e mistero. L'obiettivo di questo capitolo è fornire una spiegazione semplice, ma precisa, di cosa sia il Machine Learning e come possa essere applicato nel campo della medicina, rendendo comprensibili i suoi principi fondamentali.
L'Intelligenza Artificiale è un ramo dell'informatica che mira a creare sistemi in grado di svolgere compiti tipicamente associati all'intelligenza umana, come il riconoscimento di immagini, la comprensione del linguaggio naturale e la presa di decisioni. All'interno dell'AI, il Machine Learning è una sotto-disciplina che si occupa di sviluppare algoritmi in grado di "apprendere" dai dati. In altre parole, invece di programmare una soluzione specifica, addestriamo un sistema fornendogli dati ed esempi, in modo che possa imparare autonomamente a risolvere problemi simili in futuro.
Per spiegare il funzionamento del Machine Learning, consideriamo un esempio concreto: insegnare a una macchina a classificare se una banana è matura o acerba. Per farlo, raccogliamo due caratteristiche principali della banana: il colore (quanto è gialla) e la consistenza (quanto è morbida).
Durante la fase di addestramento, forniamo alla macchina molti esempi di banane, indicando per ciascuna se è matura o acerba, insieme alle sue caratteristiche. Ogni banana rappresenta un punto dati, che viene posizionato in un diagramma con due assi: il colore sull'asse X e la consistenza sull'asse Y. Dopo aver fornito un numero sufficiente di esempi, la macchina è in grado di tracciare una linea decisionale che separa le banane mature da quelle acerbe. Questa linea è il "modello" che il sistema ha appreso dai dati.
Dopo l'addestramento, possiamo testare il modello su una nuova banana della quale non conosciamo lo stato di maturazione. Inseriamo i suoi dati (colore e consistenza) e la macchina confronterà questi valori con il modello appreso, prevedendo se la banana è matura o acerba. Questo processo di classificazione è il risultato dell'apprendimento automatico.
Il processo appena descritto rientra nel cosiddetto "apprendimento supervisionato", poiché forniamo alla macchina sia i dati (input) sia le etichette (output), come "matura" o "acerba". Esiste anche una modalità di apprendimento chiamata "non supervisionato", in cui il sistema riceve solo i dati e deve trovare autonomamente delle strutture o correlazioni all'interno di essi. Questo tipo di apprendimento può essere utile, ad esempio, per identificare nuovi gruppi di pazienti con sintomi simili.
È molto semplice capire che più aumenta il numero di esempi (di dati) che forniamo alla macchina, e più il modello diventa preciso, perché la linea decisionale può essere "guidata" da una nube più fitta di pallini nel diagramma.
Esistono, inoltre, diverse metodologie per far evolvere continuamente il modello, ad esempio grazie a misurazioni e relativi feedback, anche successivamente alla fase di addestramento.
Perché la linea decisionale non va a circondare esattamente i pallini delle misurazioni come segue (la curva rossa come alternativa al tratto lineare viola)?
Se la linea si comportasse in questo modo, non si tratterebbe di un confine che generalizza le misurazioni e descrive un andamento: l'apprendimento sarebbe troppo "cucito sui dati" di training. Questo renderebbe il modello poco affidabile per prendere delle decisioni su nuovi dati. Tale fenomeno prende il nome di "overfitting".