Qualsiasi compito risolvibile e facilmente verificabile sarร , prima o poi, conquistato dall'AI
๐๐ฆ๐ณ๐ช๐ง๐ช๐ฆ๐ณโ๐ด ๐๐ข๐ธ (๐๐ข๐ด๐ฐ๐ฏ ๐๐ฆ๐ช, ๐๐ต๐ข๐ฏ๐ง๐ฐ๐ณ๐ฅ)
ร una frase che colpisce. Ma non รจ uno slogan: รจ una chiave di lettura potente per capire dove sta andando davvero lโIntelligenza Artificiale.
Facciamo un passo indietro.
Se vogliamo rendere un LLM estremamente bravo in un certo tipo di compito (ad esempio risolvere problemi di matematica), la โricettaโ oggi รจ sorprendentemente chiara:
1๏ธโฃ raccogli (o sintetizza con lโAI) molti esempi del compito
2๏ธโฃ fai generare al modello piรน risposte
3๏ธโฃ verifica automaticamente ogni risposta e assegnale un punteggio
4๏ธโฃ usa quei punteggi per addestrare ulteriormente il modello (reinforcement learning)
5๏ธโฃ ripeti il cicloโฆ milioni di volte
๐ ๐ค๐๐ฎ๐ป๐ฑ๐ผ ๐พ๐๐ฒ๐๐๐ฎ ๐๐ฒ๐ฟ๐ถ๐ณ๐ถ๐ฐ๐ฎ ๐ฒ ๐ฎ๐๐๐ผ๐บ๐ฎ๐๐ถ๐ฐ๐ฎ ๐ฒ๐ฑ ๐ฒ๐ณ๐ณ๐ถ๐ฐ๐ถ๐ฒ๐ป๐๐ฒ, ๐ถ๐น ๐บ๐ผ๐ฑ๐ฒ๐น๐น๐ผ ๐ฑ๐ถ๐๐ฒ๐ป๐๐ฎ ๐ฒ๐ฐ๐ฐ๐ฒ๐๐ถ๐ผ๐ป๐ฎ๐น๐บ๐ฒ๐ป๐๐ฒ ๐ฏ๐ฟ๐ฎ๐๐ผ.
ร uno dei segreti dietro i cosiddetti โreasoning modelsโ.
๐๐น ๐ฝ๐๐ป๐๐ผ ๐ฐ๐ฟ๐ถ๐๐ถ๐ฐ๐ผ ๐ฒ ๐ถ๐น ๐ฝ๐ฎ๐๐๐ผ ๐ฏ.
Se non riesci a valutare lโoutput in modo rapido, oggettivo e scalabile (senza umani nel loop), lโintero meccanismo si inceppa.
E qui nasce la Verifierโs Law.
Sudoku รจ un esempio banale ma illuminante: verificare una soluzione รจ immediato.
Lo stesso vale per molte attivitร di coding, matematica, giochi digitali, ambienti simulati.
Non a caso, รจ proprio lรฌ che lโAI ha fatto i salti piรน spettacolari.
Jason Wei lo dice senza giri di parole:
๐ฒ๐ถ๐ข๐ญ๐ด๐ช๐ข๐ด๐ช ๐ค๐ฐ๐ฎ๐ฑ๐ช๐ต๐ฐ ๐ณ๐ช๐ด๐ฐ๐ญ๐ท๐ช๐ฃ๐ช๐ญ๐ฆ ๐ฆ ๐ง๐ข๐ค๐ช๐ญ๐ฎ๐ฆ๐ฏ๐ต๐ฆ ๐ท๐ฆ๐ณ๐ช๐ง๐ช๐ค๐ข๐ฃ๐ช๐ญ๐ฆ, ๐ข๐ญ๐ญ๐ข ๐ญ๐ถ๐ฏ๐จ๐ข, ๐ท๐ฆ๐ณ๐ณ๐ข ๐ข๐ถ๐ต๐ฐ๐ฎ๐ข๐ต๐ช๐ป๐ป๐ข๐ต๐ฐ.
Questa โleggeโ apre almeno due domande scomode.
๐น ๐ค๐๐ฎ๐ป๐๐ฒ ๐ฑ๐ฒ๐น๐น๐ฒ ๐ฎ๐๐๐ถ๐๐ถ๐๐ฎ ๐ฐ๐ต๐ฒ ๐๐๐ผ๐น๐ด๐ถ๐ฎ๐บ๐ผ ๐ผ๐ด๐ป๐ถ ๐ด๐ถ๐ผ๐ฟ๐ป๐ผ ๐๐ผ๐ป๐ผ, ๐ถ๐ป ๐ฟ๐ฒ๐ฎ๐น๐๐ฎ, ๐ณ๐ฎ๐ฐ๐ถ๐น๐บ๐ฒ๐ป๐๐ฒ ๐๐ฒ๐ฟ๐ถ๐ณ๐ถ๐ฐ๐ฎ๐ฏ๐ถ๐น๐ถ?
Forse dovremmo iniziare a spostare il nostro lavoro verso compiti meno standardizzabili, meno โmisurabiliโ, piรน umani. Non per nostalgia, ma per strategia.
๐น ๐๐๐ถ๐๐๐ผ๐ป๐ผ ๐ฐ๐ผ๐ป๐๐ฟ๐ผ-๐ฒ๐๐ฒ๐บ๐ฝ๐ถ?
Compiti verificabili che non cedono allโAI?
La Verifierโs Law non รจ un teorema matematico: รจ unโosservazione empirica. E come tale va messa alla prova. I โcigni neriโ potrebbero arrivare.
Una cosa perรฒ รจ giร chiara:
๐ la nuova frontiera non รจ solo fare cose, ma misurarle.
La verifica, la valutazione, la definizione di โcosa รจ giustoโ diventeranno un enorme campo di innovazione.
Cibo per la mente.
E sรฌ: il resto del talk di Jason Wei merita davvero:





