Agraïments
Les primeres persones a qui he de donar les gràcies són la Sílvia, l’Úrsula XVII i en Max, que han hagut d’aguantar la meva absència física i mental durant les llargues hores que he dedicat a estudiar, pensar i escriure aquest llibre.
També vull agrair a tots els i les mestres que he tingut al llarg de la vida tot el que m’han ensenyat. Entre tots ells vull destacar la meva mare, la Maria Martín i Pujol (la «senyora Sala» de l’escola Tagore-Ramon Fuster) i el meu pare, l’Emili Sala i Arnó (el «senyor Sala», també del Tagore-Ramon Fuster i de l’Institut Egara de Sabadell-Terrassa). Sense la vostra saviesa i el vostre exemple, no hauria pogut escriure aquest llibre ni cap altre.
Vull mostrar la meva gratitud al meu exestudiant i col·laborador Maxim L. Pinkovskiy, per totes les converses sobre tecnologia, economia, innovació i intel·ligència que hem tingut al llarg dels anys. I a en Josep Maria Ganyet, no només perquè va llegir i em va comentar el primer esborrany del manuscrit, sinó també per totes les xerrades que hem mantingut a Davos sobre el tema de la intel·ligència artificial. També vull agrair a Peter Prazmowski, amic i coautor del llibre El Gazebo sobre l’economia de la República Dominicana, totes les hores que ens hem passat a Nova York, a Santo Domingo i a Punta Cana pensant en la importància de les idees i l’impacte que tenen sobre el creixement de països com el seu.
Entre triatló i triatló, en Gustau Raluy i Bruguera ha repassat, corregit i traduït tots els meus darrers llibres. Però en aquest projecte ha anat més enllà i ha fet aportacions que han contribuït a millorar-ne la qualitat de manera substancial. Gràcies per l’esforç addicional, Gustau.
Finalment vull mostrar el meu agraïment als meus editors, en Carlos Martínez i en Joan Riambau, per com s’han involucrat en aquest projecte i pels seus comentaris sobre les primeres versions. La meva ja llarga relació amb Penguin Random House va començar fa molts anys i sempre ha estat associada a la llegendària Núria Tey. Aquest llibre és una aposta de la Núria, una aposta que va fer quan tot just era una idea esbojarrada que em voltava pel cap. Malauradament, aquest serà el darrer fruit de la nostra relació professional, no perquè jo deixi l’editorial, sinó perquè ella ha decidit de jubilar-se. El meu agraïment amb tu, Núria, és il·limitat. Et trobaré a faltar.
Prefaci
30 de setembre de 2012. Faltaven dos anys perquè Vladímir Putin envaís la península ucraïnesa de Crimea. Aliens a tot el que passava als seus països d’origen, dos estudiants de la universitat de Toronto, al Canadà, col·laboraven des de feia mesos en un projecte d’intel·ligència artificial. El seu objectiu era guanyar el concurs anual d’identificació d’imatges organitzat per ImageNet. Alexander Krizhevsky, un noi tímid nascut a Ucraïna feia vint-i-sis anys, era un programador expert. Ilya Sutskever era un jove extravertit nascut a Rússia i tenia la mateixa edat. Tots dos feien el doctorat en informàtica sota la supervisió del llegendari professor anglocanadenc Geoffrey Hinton.
Quan la intel·ligència artificial (IA) va néixer a mitjans dels anys cinquanta, els científics es van dividir en dos grups. Dit d’una manera molt planera,[1] els primers volien fabricar intel·ligència simulant la ment i els processos mitjançat els quals els humans raonem conscientment, pensem en abstracte i apliquem tècniques com la lògica o la deducció. Així, per exemple, per aconseguir que un ordinador pogués identificar la imatge d’un gat, se li havia d’introduir la definició de gat amb la famosa regla de programació «si X, aleshores Y»: SI és un animal pelut, amb dues orelles punxegudes, dos ulls rodons, bigotis i quatre potes, ALESHORES és un gat. Quan es presentava una imatge a l’ordinador, si es corresponia amb aquesta definició, la màquina deia que era un gat. Per crear aquest tipus d’intel·ligència, els experts no només havien d’introduir a l’ordinador totes les definicions necessàries, sinó també totes les excepcions possibles: de vegades en una imatge hi surt mitja cara de gat, de manera que només té una orella punxeguda, no dues, però continua sent un gat; o, en una altra imatge, el gat està ajagut al sofà amb el cos cargolat i no se li veuen les quatre potes, però continua sent un gat. També havien de donar a l’ordinador totes les lleis de la lògica i de la deducció perquè pogués pensar com els humans. Els científics van anomenar aquest mètode IA simbòlica.
El segon grup no volia simular la ment, sinó el cervell: les neurones, les sinapsis i les xarxes neuronals. Deien que els humans no aprenem a diferenciar un gat d’un gos mitjançant la definició, sinó a còpia de veure moltes imatges de gats i de gossos. Quan som petits, els pares ens mostren imatges d’animals (en fotos o animals reals) i ens diuen «això és un gat» —o un gos, o una vaca—. No ens els defineixen, només ens en donen els noms. No sabem si el cervell es fixa en el pelatge, en les orelles punxegudes o en els bigotis, però el cas és que extreu l’essència de la «felinitat» i, a partir d’aquell moment, associa la idea de «gat» amb el nom de «gat».
En aquesta línia, el que aquests investigadors proposaven era mostrar a la màquina milions d’imatges de gats i de gossos i dotar-la d’un mecanisme que li permetés veure els patrons comuns que tenien totes les imatges de gats en contraposició a les dels altres animals. Amb cada nova imatge, l’ordinador millorava el mecanisme d’identificació d’una manera similar a com ho fan les xarxes de neurones dels humans. És per això que aquest mètode es coneix amb el nom de «xarxes neuronals artificials». Un cop la xarxa neuronal havia «après» a identificar imatges, se n’hi mostrava una de nova i, en teoria, la màquina era capaç de predir si era un gat o un gos.
Des del primer dia hi va haver molta rivalitat intel·lectual entre els dos grups, que en alguns moments van protagonitzar tensos enfrontaments. El grau d’animositat era tan alt que quan un grup organitzava una conferència d’IA no hi convidava cap professor de l’altre grup, perquè els uns consideraven que els altres no feien IA «de veritat».
Durant les primeres dècades, semblava que els «simbolistes» guanyaven la partida, encara que el seu progrés era certament limitat. Durant els anys vuitanta, però, els «xarxistes» van contraatacar amb èxit. Després de diversos avenços tècnics —alguns dels quals a càrrec del professor Hinton—, l’any 1989 un equip liderat pel francès Yann LeCun va crear el que encara avui s’anomena xarxa neuronal convolucional o CNN (sigla anglesa de Convolutional Neural Network).[2] Era una xarxa que, en teoria, funcionava bé per identificar imatges. Dic en teoria perquè les CNN requerien una potència computacional que no existia en aquella època. Processar milions d’imatges amb milers de píxels i manipular milers de milions de paràmetres era una feina que, si bé es podia fer en teoria, tenia poca utilitat pràctica, perquè els microxips dels anys vuitanta no tenien prou potència. És per això que, després de l’època daurada dels vuitanta, les xarxes neuronals van anar perdent prestigi i van caure en desús. Una de les poques figures que va continuar defensant aquesta metodologia, d’una manera gairebé quixotesca i malgrat la mofa que en feien els simbolistes, va ser precisament el professor de Toronto Geoffrey Hinton.
En aquest context, un dia del 2011 el jove ucraïnès Alex Krizhevsky el va anar a veure al despatx amb una idea: en comptes d’emprar processadors tradicionals (els anomenats CPU, de l’anglès Central Processing Unit), li va proposar utilitzar processadors com els dels videojocs (anomenats GPU, de Graphics Processing Unit), que eren molt més potents. Perquè, en efecte, la necessitat de manipular grans quantitats d’imatges per fer videojocs havia obligat les empreses com Nvidia a desenvolupar processadors molt més ràpids i potents que els que portaven els ordinadors. Amb els nous processadors gràfics, el que abans trigava mesos ara trigava dies i, per tant, es podien ressuscitar les velles CNN dels anys vuitanta.
Sembla que la idea no va acabar de convèncer el seu prestigiós director de tesi. Però sí que va convèncer el seu company d’estudis, el rus Ilya Sutskever, que li va proposar de treballar plegats en el projecte. Tots dos joves es van passar mesos a l’habitació de casa adaptant la seva CNN als potents microprocessadors gràfics. Finalment els estudiants van completar la nova xarxa neuronal, a la qual més endavant van posar el nom d’AlexNet, en honor al jove ucraïnès que liderava el projecte. Van presentar AlexNet a l’ImageNet Challenge, el concurs d’identificació d’imatges més famós del món, creat i promogut per la professora de Stanford d’origen xinès Fei-Fei Li. Els organitzadors del concurs subministraven als participants 1,2 milions d’imatges per entrenar les seves màquines. Un cop fet l’entrenament, els mostraven 150.000 imatges noves i les màquines havien d’endevinar quin objecte o animal hi apareixia.
En aquell temps, les màquines eren tan dolentes en la identificació dels objectes que sortien a les imatges que els organitzadors els donaven fins a cinc oportunitats per a cada una. És a dir, la màquina podia donar cinc opcions de resposta, i si una d’elles era la correcta, es donava la resposta per bona. Si no, es computava com a error. Malgrat les cinc oportunitats de què disposaven, fins a l’any 2011 les millors màquines (en aquell moment no n’hi havia cap que utilitzés CNN) només endevinaven el 74 % de les respostes. Dit d’una altra manera, en el 26 % dels casos la resposta correcta no era cap de les cinc que donava l’ordinador. No cal dir que amb una propensió a l’error tan gran, la utilitat de les màquines per identificar imatges l’any 2011 era molt reduïda.
Tot això va canviar el 30 de setembre de 2012, quan AlexNet va destrossar la competència: mentre que el segon classificat encara tenia el mateix percentatge d’error que el guanyador de l’any anterior, un 26 %, l’error d’AlexNet va ser de només el 15,3 %. Potser no sembla gaire, però el fet que l’error passi del 26 % al 15,3 % representa una millora del 40 %, i això és molt! Val a dir que la victòria dels dos estudiants no va ser celebrada per milions de fans a la font de Canaletes de Toronto. De fet, va passar força desapercebuda entre la població i la premsa generalista. Però no per als experts informàtics d’arreu del món, que van entendre que aquella reducció del 40 % representava un moment històric en l’univers de la intel·ligència artificial i que podia ser el tret de sortida d’una gran revolució tecnològica.
Des del punt de vista acadèmic, semblava que finalment la confrontació entre simbolistes i xarxistes es decantava a favor dels segons. Els experts en xarxes neuronals van començar a rebre premis, honors i sobretot citacions acadèmiques, que és el que més ens agrada a la gent del món universitari. Per exemple, l’article que Krizhevsky i Sutskever van escriure explicant com funcionava la seva CNN(1),[3] es va convertir en un dels articles clau de la història de la IA, i la comunitat acadèmica i científica ja l’ha citat més de 120.000 vegades.
La victòria d’AlexNet tampoc no va passar desapercebuda en el món dels negocis. Els experts xarxistes van rebre ofertes de les grans empreses tecnològiques com Amazon, Apple, Facebook, Google, Microsoft o Netflix perquè els ajudessin a introduir xarxes neuronals als seus departaments d’R+D. Per exemple, Google va contractar Krizhevsky, Sutskever i Hinton, suposadament a canvi de salaris milionaris. El professor que havia creat la primera CNN l’any 1989, Yann LeCun, va ser fitxat per Mark Zuckerberg per dirigir el departament d’IA a Facebook. Cada estudiant que es graduava a la universitat amb algun tipus de coneixement sobre la nova tècnica informàtica era immediatament «caçat» per les grans empreses a canvi de salaris desorbitats. A banda de contractar tots els experts acadèmics que podien, les grans tecnològiques van començar a invertir milers de milions per no deixar escapar el que semblava el nou tren de la IA, aquest cop basada en xarxes neuronals.
La primera conseqüència de tot això va ser que la majoria de participants de l’ImageNet Challenge van passar de ser acadèmics universitaris a ser les grans empreses. Així, el concurs del 2014 el va guanyar una CNN de Microsoft i el del 2015, una altra de Google. Els anys 2016 i 2017 el guanyador va ser un conglomerat d’empreses tecnològiques xineses liderades pel govern d’aquell país. En aquella edició, l’error ja s’havia reduït fins al 2,3 %, un percentatge més petit del que es considerava l’error humà a l’hora d’identificar objectes en una fotografia.
Però les empreses no van invertir en CNN per guanyar concursos ni per aconseguir citacions acadèmiques, sinó per desenvolupar tecnologies que els permetessin obtenir-ne rendibilitats. D’aquesta manera va començar un gran boom en què cada aparició de nous productes basats en la IA deixava el món bocabadat. Pel camí, el nom CNN va ser substituït per un terme més misteriós i seductor com és deep learning, que es podria traduir per «aprenentatge automàtic», encara que literalment s’hauria de traduir per «aprenentatge profund».
En molt poc temps, els usuaris vam començar a veure les aplicacions comercials d’aquestes tecnologies quan els iPhones d’Apple i els Androids de Google van substituir les contrasenyes numèriques per la identificació facial: només havies de mirar el telèfon i, si la càmera t’identificava com el propietari, màgicament es desbloquejava. Les aplicacions de Facebook podien identificar les cares de les persones que sortien a les fotos que els usuaris hi pujaven. La seguretat dels aeroports utilitzava càmeres equipades amb intel·ligència artificial per reconèixer delinqüents i terroristes. Van aparèixer cadenes de supermercats com Go Stores, de Califòrnia, en què els clients podien registrar el seu rostre amb una targeta de crèdit i, a partir d’aquell moment, podien anar a la botiga, agafar els productes desitjats i marxar sense passar per la caixa registradora, perquè la IA identificava la cara del client i li cobrava directament la compra. Allò va convertir en una realitat material la dita catalana que diu «amb la cara pagues». En el camp de la medicina, la nova tecnologia va revolucionar la radiologia, la patologia i totes les altres branques que utilitzen imatges en la diagnosi, ja que els nous algoritmes intel·ligents cometien menys errors que els metges humans a l’hora d’identificar tumors cancerígens o irregularitats de qualsevol tipus.
La revolució del deep learning va anar molt més enllà del reconeixement d’imatges. En el fons, el que feia la CNN dels estudiants de Toronto era agafar muntanyes de dades, extraure’n els patrons comuns i fer prediccions. En el cas d’AlexNet, les dades eren els píxels dels milions de fotografies i les prediccions eren les etiquetes dels objectes o els animals que apareixien en la imatge.
Però a ningú se li va escapar que les mateixes CNN es podien emprar per fer prediccions amb altres tipus de dades. Per exemple, Google podia usar la informació que els seus clients deixen cada cop que fan servir el seu popular cercador d’internet per fer prediccions sobre els seus gustos i sobre el seu potencial de compra. Per exemple, amb les dades disponibles podia predir el moment en què una persona determinada prenia la decisió de comprar un cotxe de gamma alta. Aquesta informació és valuosíssima per als fabricants com BMW o Audi. Penseu que fins aquell moment aquestes empreses posaven anuncis als diaris o a les televisions generalistes que arribaven a tota la població. En gran mesura, aquestes inversions publicitàries anaven a parar directament a les escombraries perquè, normalment, la major part de la població no està pensant a comprar un cotxe de gamma alta. Amb les prediccions acurades de la IA, però, Google podia saber quines persones estaven interessades en aquest tipus de cotxes i podia vendre la informació a BMW i Audi per tal que els adrecessin els anuncis només a elles! Aquesta nova manera de gestionar les dades podia acabar revolucionant el món de la publicitat i del periodisme, ja que les grans empreses deixarien de posar anuncis als diaris, a les televisions i les ràdios tradicionals, la qual cosa comportaria la pèrdua de la seva font de finançament principal. Facebook, Twitter i Instagram, per la seva banda, també podien usar les dades que els seus clients deixaven a les seves xarxes socials (les fotos, els likes, els comentaris, etc.) per fer el mateix.
Amazon també va voler adaptar el seu negoci a la nova IA. Aquesta empresa té una gran quantitat de dades sobre les cerques de productes que els clients fem al seu web. Fixeu-vos que Amazon no només té les dades de tots els productes que hem comprat al llarg de la història, sinó que també sap el que hem buscat i, fins i tot, el que hem tingut a la cistella i que al final no hem comprat; sap si hem llegit un comentari negatiu abans de rebutjar un producte i també sap quant de temps hem estat dubtant abans de decidir-nos a comprar o rebutjar un producte determinat. Amb la nova IA, Amazon podia utilitzar tota aquesta informació per predir els productes que voldríem comprar en un futur i això es podia usar per portar-los cap als centres de distribució propers a casa nostra abans que nosaltres decidíssim comprar-los. Es diu que Amazon sap què li acabarem comprant dues setmanes abans que nosaltres mateixos!
Netflix o Amazon Prime tenen dades sobre les sèries i les pel·lícules que mirem. També saben la velocitat a la qual les mirem o en quin punt les abandonem. Tot això és informació que la IA podia fer servir per predir quines pel·lícules ens agradaria veure en el futur i totes dues van començar a fer-ho per decidir per quines pel·lícules o sèries apostaven i quines eren rebutjades. Semblava que, gràcies a la nova tecnologia, els sonors fracassos del passat passarien a millor vida i totes les pel·lícules i sèries produïdes a partir d’aquell moment serien un èxit. Diuen que la primeria sèrie produïda per Netflix amb aquest nou mètode de selecció va ser Stranger Things, l’any 2015. Una cosa similar va passar amb les grans marques editorials, com la que publica aquest llibre: podien usar les dades sobre quins llibres compraven i llegien els lectors per predir si una obra concreta seria un èxit de vendes. De sobte, semblava que ja no caldrien els exèrcits d’editors que llegien manuscrits i decidien, amb un criteri totalment subjectiu, si una obra concreta mereixia ser publicada.
Les empreses també van veure que podien fer servir la nova IA per crear màquines que poguessin operar amb el llenguatge humà. De la mateixa manera que internet és ple d’imatges que permeten entrenar els algoritmes, també és ple de textos i de sons que podien ser utilitzats per entrenar-los amb l’objectiu que interaccionessin amb els humans utilitzant el llenguatge natural. Tot i que la tècnica encara no estava perfeccionada, van començar a aparèixer prototips d’assistents digitals com la Siri d’Apple, l’Alexa d’Amazon, el Google assistant de Google o la Cortana de Microsoft, que responien a ordres orals. Tu preguntaves a la Siri: «Quin temps fa a Nova York ara mateix?», i una suau veu femenina te’n donava la resposta. Tu li preguntaves: «Qui és George Clooney?», i et passava les pàgines web que explicaven la vida de l’actor. Tu li ordenaves: «Encén la tele i posa Disney», i la tele s’encenia i apareixia l’aplicació Disney+. Google va desenvolupar un assistent personal anomenat Duplex que podia fer reserves als restaurants i a les perruqueries. Tu demanaves a Duplex que fes una reserva al Celler de Can Roca, i una veu humana que parlava amb llenguatge natural trucava al restaurant, feia la reserva i responia a les preguntes que la persona que rebia la trucada li feia sense adonar-se que parlava amb un ordinador! Facebook va desenvolupar un assistent similar, anomenat M, que també podia fer reserves per telèfon. De sobte, era possible que tots tinguéssim una secretària personal. Com si fóssim l’Isidre Fainé.
Van aparèixer els «grans models lingüístics», com el GPT-3(2) de l’empresa OpenAI. OpenAI va ser cocreada l’any 2015 per Ilya Sutskever. El recordeu, l’estudiant rus que va idear AlexNet amb el seu company ucraïnès Alex Krizhevsky? Doncs bé, aquesta empresa de Sutskever va estar anys intentant dissenyar bots, és a dir, programes capaços d’interaccionar amb humans a través del llenguatge natural i sense necessitat que l’humà sabés el llenguatge de la programació. El resultat d’aquestes inversions va ser primer el GPT, l’any 2018, seguit del GPT-2 i el GPT-3, els anys 2019 i 2020. A finals de l’any 2022 va aparèixer el ChatGPT. Aquests bots van causar sensació i entusiasme mundials a l’instant. A més de contestar tot tipus de preguntes, podien escriure redaccions, cròniques, històries curtes o articles de diari sense que ningú pogués detectar que havien estat escrits per un ordinador.
Altres aplicacions es van especialitzar a escriure articles científics de tanta qualitat que els editors de les revistes especialitzades els acceptaven sense saber que no havien estat escrits per acadèmics humans. L’any 2005 uns professors del MIT havien creat un bot anomenat SciGen que escrivia articles científics amb l’objectiu de demostrar que eren capaços de fer que les revistes especialitzades se’ls empassessin. Aquest bot va millorar amb el temps fins arribar a publicar articles en algunes de les grans revistes científiques del món. Això vol dir que els bots havien d’enganyar no un, sinó diversos experts. Recordeu que per ser publicat en una revista científica, cada article ha de ser revisat per un editor, que l’envia a dos especialistes acadèmics (com a mínim) perquè n’hi donin l’opinió. Per tant, per arribar a ser publicat, un article ha d’aconseguir l’aprovació de tres especialistes en el tema, pel cap baix. Doncs bé, SciGen va aconseguir publicar diversos articles a les revistes més prestigioses del món. Cada vegada que l’article sortia publicat en una revista de prestigi, els propietaris del bot anunciaven l’engany. Sembla que el seu objectiu no era publicar fake news, sinó demostrar que bé que funcionaven els bots intel·ligents. I, de passada, que malament que funcionava el sistema de publicacions acadèmiques!
És clar que els mateixos bots podien ser utilitzats per professors sense escrúpols per augmentar el nombre de publicacions. Ja sabeu que en el món acadèmic hi ha la dita que diu «o publiques, o mors», i, així, uns quants espavilats van intentar aprofitar-se de la nova tecnologia per inflar el currículum. L’any 2021, el gegant editorial Springer va encarregar un informe per saber quants articles falsos fabricats per la IA havien sortit publicats a les seves nombroses revistes acadèmiques. L’informe va sorprendre tothom i va ser devastador: havien publicat un total de 243 articles falsos. Davant d’aquesta suprema vergonya, Springer va escriure una carta de disculpa[4] i va esborrar tots els articles falsificats dels seus webs.
Però la història no va acabar aquí perquè, el novembre del 2022, el departament d’IA de l’empresa Meta (exFacebook), liderat pel mateix Yann LeCun, va presentar un bot anomenat Galactica que, segons semblava, escrivia articles en qualsevol àmbit de la ciència en qüestió de minuts. L’usuari simplement havia de decidir el tema. Per exemple: «Escriu un article que confirmi l’efecte fotoelèctric». Aleshores el bot escrivia un article amb aparença científica, amb els seus experiments, resultats, taules de dades i les seves corresponents citacions. Segons va anunciar Meta el dia del seu llançament, Galactica era una CNN que havia estat entrenada amb 360 milions d’articles acadèmics de totes les disciplines, i això la convertia en una eina intel·ligent que havia de revolucionar el món de la ciència i de les publicacions acadèmiques.
Una altra àrea de la llengua que va viure una revolució va ser el de les traduccions. Gràcies a la nova IA, els traductors automàtics com Google Translate, que existien des de feia anys però que no acabaven de funcionar gaire bé, van experimentar una millora quàntica. Amb les noves CNN les traduccions tampoc no eren perfectes, però eren prou bones per permetre a l’usuari entendre un article escrit en una llengua totalment desconeguda. Tot d’un plegat, jo mateix em vaig trobar llegint articles de la premsa xinesa, ucraïnesa o russa, publicats en llengua original i traduïts més que decentment per Google Translate. També van aparèixer petits aparells de menys de 50 euros que feien traduccions orals a més de 20 llengües diferents. Suposadament, podies anar al Japó i mantenir converses en les quals els locals parlaven en japonès i tu contestaves en català. Semblava que, en el futur, ja no caldria aprendre idiomes, perquè finalment la IA havia reconstruït la torre de Babel de les llengües.
Les empreses també van voler introduir la IA en el món de la medicina. La més atrevida va ser IBM, que va desenvolupar el projecte Watson.(3) L’ordinador Watson havia estat desenvolupat per guanyar els humans al Jeopardy!, un joc televisiu molt popular als Estats Units on els concursants han de respondre molt ràpidament preguntes de tipus Trivial Pursuit. Per jugar al Jeopardy!, Watson va haver de «llegir» tres enciclopèdies —inclosa tota la Viquipèdia— i un munt de llibres i documents. També havia d’entendre les preguntes orals que formulava el presentador.(4) Després de set anys de construcció i davant una audiència de milions, l’ordinador va derrotar els dos millors concursants humans de la història de Jeopardy!, Veient la inevitable derrota, en comptes de donar la resposta correcta a la darrera pregunta, un dels concursants humans va escriure: «Per part meva, dono la benvinguda als nostres nous comandants suprems informàtics». Per rendibilitzar la victòria televisiva, IBM va decidir revolucionar el món de la medicina i va posar Watson a «llegir» totes les publicacions mèdiques escrites al llarg de la història. L’objectiu era construir un metge artificial amb capacitats sobrehumanes. El nou metge digital podria estar al dia de les darreres investigacions, perquè podia llegir els milers de publicacions que els científics publicaven cada any, una fita que no estava a l’abast dels metges humans, que havien de passar la major part del temps no llegint, sinó atenent pacients als hospitals. A més, el metge artificial no cometria errors, no es cansaria i, el més important, se’n podien fer infinitat de còpies a cost zero de la mateixa manera que podem fer infinites còpies d’una foto digital. D’aquesta manera, es podrien portar metges artificials a les àrees més pobres del món on l’escassetat de doctors humans té conseqüències tràgiques per a la població local. Els grans hospitals del món es van apuntar a la febre de la IA i van signar contractes de col·laboració amb IBM. El Doctor Watson era el futur de la medicina!
La nova IA també va revolucionar la carrera per fabricar cotxes autònoms. Des que la famosa catifa màgica amb la qual Aladí i la seva llàntia meravellosa van passejar pel cel d’Aràbia, el cotxe que podia circular sense conductors humans era un somni dels enginyers. Però era un somni que estava congelat des de feia molts anys. El problema era el següent: era relativament senzill fabricar cotxes que poguessin circular autònomament en circuits tancats o en entorns preparats, com ciutats deshabitades, però era molt difícil posar-los en entorns on hi havia humans que es comporten de manera erràtica i imprevisible. La revolució del deep learning, que, de nou, era bàsicament una eina que permetia fer prediccions a partir de milions de dades observades, va fer que empreses com Google, Tesla o Uber ressuscitessin la carrera per aconseguir vehicles autònoms. Com que la IA podia ajudar a fer prediccions acurades del comportament humà, el problema de la conducció autònoma es podia redefinir com un problema de predicció. És a dir, calia ensenyar a la màquina milions d’exemples de com es comportaven els humans en tot tipus de situacions a la carretera, perquè pogués predir com es comportarien els mateixos humans en situacions noves. Entrenar els vehicles era només qüestió de passar-se milions d’hores a la carretera recollint dades de com es comporten els humans quan condueixen. Amb aquesta nova tècnica, s’albirava la possibilitat de posar en circulació els cotxes en entorns complicats, com ho són les ciutats normals i corrents, plenes de ciclistes, de corredors, de vianants que travessen el carrer per zones no autoritzades, de nens que juguen a pilota o de conductors humans emprenyats que se salten les normes i no et deixen passar encara que tinguis preferència. De fet, les empreses digitals van passar al davant de fabricants tradicionals d’automòbils com BMW o Mercedes, que també buscaven produir cotxes sense conductor. Gràcies al deep learning, l’horitzó temporal previst perquè el vehicle autònom circulés pels carrers a les primeres ciutats del món ja no es va estimar en dècades sinó en pocs anys.
Si fos cert això, comportaria una veritable revolució perquè, entre altres raons, cada any moren prop d’1,2 milions de persones en accidents de trànsit arreu del món. Aquesta xifra és tres vegades més alta que totes les víctimes de totes les guerres del món juntes! La major part d’aquests accidents són per culpa d’errors humans causats pel cansament, la distracció o la imprudència. Com que les màquines intel·ligents no es cansen, no es distreuen i no són imprudents, amb la IA els accidents es reduirien a la mínima expressió. Per tant, el cotxe autònom salvaria la majoria dels 1,2 milions de morts i ens estalviaria el sofriment que comporten totes aquestes morts. El cotxe autònom salvaria més vides que no pas una vacuna que erradiqués la malària i la sida al mateix temps! A banda de la dràstica reducció de la mortalitat a la carretera, el cotxe autònom també podia revolucionar les ciutats, perquè no caldrien aparcaments, cosa que alliberaria quantitats ingents de superfície per fer-hi zones verdes o passejos. La nova IA, per tant, comportaria uns beneficis enormes per a la humanitat.
La IA també va començar a revolucionar el món de la robòtica. De la mateixa manera que podia fer que els cotxes es conduïssin sols, també podia ser utilitzada per construir robots autònoms que poguessin exercir diverses funcions; per exemple, fer de majordoms. El somni dels enginyers era la Rosey, la minyona robot que apareixia a la sèrie de dibuixos animats Els Jetson, una sèrie futurista feta per William Hanna i Joseph Barbera l’any 1962, dos anys després de produir Els Picapedra. De fet, era ben bé la contraposició a Els Picapedra, que s’emmarcava en l’edat de pedra i descrivia la vida d’una família del passat. En canvi, Els Jetson s’emmarcava un segle després de l’emissió de la sèrie, el 2062, i intentava descriure el nostre futur. Els protagonistes eren una família amb un pare, en George, una mare, la Jane, una filla i un fill, la Judy i l’Elroy, el gos Astro i la minyona Rosey. Aquesta minyona robòtica es comunicava amb les persones, no a través de programes informàtics, sinó a través del llenguatge humà normal. Ho entenia tot, obeïa les ordres i ho feia tot bé. Era la minyona perfecta. Malgrat que des del 1962 la Rosey havia estat el somni humit dels enginyers, l’any 2012 el robot autònom intel·ligent real que més s’hi aproximava era la Roomba: aquella màquina de treure la pols que es passeja per les cases espantant els gossos. Arran de la nova revolució de la IA, les empreses van tornar a apostar fort per fabricar robots intel·ligents.
L’any 2016, l’empresa de Hong Kong Hanson Robotics va presentar Sophia, una robot amb cara de dona que en comptes de cabells tenia un crani transparent a través del qual es podia veure que era un ordinador. Sophia s’assemblava tant a una dona humana que feia una mica d’angúnia: n’imitava els gestos a la perfecció, movia les celles, els llavis, els ulls i la musculatura facial en consonància amb les seves paraules. Estava tan ben feta que fins i tot resultava una mica inquietant.(5) La robot va concedir entrevistes a televisions d’arreu del món i va rebre l’admiració de tot tipus d’audiències. El govern d’Aràbia li va donar la ciutadania saudita, amb la qual cosa es va convertir en el primer robot que aconseguia ser ciutadà de qualsevol país del planeta. Per la seva banda, l’empresa Boston Dynamics penjava un nou vídeo cada sis mesos on apareixien robots amb forma humana que ballaven, feien salts mortals o executaven piruetes fins aleshores reservades als gimnastes olímpics. També feia circular vídeos de robots amb quatre potes, semblants als gossos, que també feien cabrioles. L’any 2022 Tesla va presentar Optimus, un prototip de robot que, segons el seu propietari, combinava les darreres innovacions de la robòtica amb la intel·ligència artificial. Només se’n va presentar el pla de fabricació, però el món va quedar impressionat. Cada cop que alguna empresa presentava un nou robot, la premsa explicava que ja estàvem a punt d’aconseguir el somni de la minyona Rosey.
Es van desenvolupar aplicacions que creaven obres d’art: música (Amper Music o AIVA), pintures (Jasper Art, NightCafe), art generat a partir d’instruccions amb paraules (Dall-E i Dall-E2) o, fins i tot, fotografies de cares humanes inventades de tanta qualitat que ni els experts podien detectar si havien estat fetes per una màquina o per un artista humà. Cada setmana apareixia la notícia d’una nova fita de la IA que deixava bocabadats els periodistes i els ciutadans... Però el més impressionant encara havia d’arribar. L’empresa anglesa DeepMind, creada per Demis Hassabis l’any 2010 i adquirida per Google el 2014, va construir un sistema capaç de vèncer els millors jugadors del món al mil·lenari joc asiàtic del go, un joc envoltat de mística i de tradició. Després que el famós ordinador d’IBM Deep Blue derrotés Garri Kaspàrov en una partida d’escacs l’any 1997, els experts van arribar a la conclusió que era relativament senzill que una màquina guanyés un humà als escacs, però que era impossible que el guanyés al go! Els antics savis xinesos consideraven aquest joc una de les quatre arts que tot savi havia de dominar. Les altres tres eren la cal·ligrafia, la pintura i la música. Com que el nombre de possibles combinacions de go és 1,74 x 10172 (un nombre de 173 dígits, més gran que el de tots els àtoms de l’Univers), els experts deien que per guanyar a go s’havia de tenir intuïció, inspiració, saviesa i creativitat més que no pas poder computacional. És per això que deien que les màquines mai no podrien guanyar els humans en aquest joc.
Però la IA va tornar a sorprendre tothom el març del 2016 quan el programa AlphaGo, dissenyat per DeepMind, va vèncer el campió del món, el coreà Lee Sedol, en un matx de cinc partides. Un any després, el maig del 2017, AlphaGo també va derrotar el número 1 del rànquing mundial, un xinès de dinou anys que es diu Ke Jie, en una sèrie de partides que van ser retransmeses en directe per la televisió d’aquell país. Els experts de DeepMind havien estat treballant durant anys per entrenar AlphaGo. El més sorprenent és que, poc després de derrotar Lee Sedol, DeepMind va crear un altre programa anomenat AlphaZero que va aprendre a jugar a go des de zero (d’aquí li ve el nom) en només quatre dies. Ho feia simulant partides contra ell mateix i aprenent estratègia observant-ne els resultats. Quan van posar la nova AlphaZero a competir contra la vella AlphaGo, la màquina nova va guanyar la que havia derrotat Lee Sedol per cent partides a zero. I això que havia après a jugar en només quatre dies!!!
AlphaZero també va aprendre a jugar a escacs. Amb poques hores d’entrenament va assolir el nivell suficient per derrotar amb tota facilitat el Deep Blue, la màquina d’IBM que havia vençut Kaspàrov vint anys abans. DeepMind també va aconseguir que les màquines aprenguessin soles a jugar a tots els jocs de la llegendària Arcade dels anys vuitanta (Breakout, marcians, asteroides, Pac-Man, etc.) i que poguessin jugar a aquests jocs molt millor que qualsevol humà.
A diferència de la victòria d’AlexNet a l’ImageNet Challenge del 2012, els èxits espectaculars de DeepMind sí que van aparèixer en tots els mitjans de comunicació.[5] Fins i tot van ser documentats per una sèrie a Netflix. Les partides entre Ke Jie i AlphaGo van tenir audiències rècord de fins a 280 milions de teleespectadors només a la Xina. El triomf de DeepMind va acabar de convèncer els més escèptics que la revolució de la IA que els experts feia seixanta anys que anunciaven finalment havia arribat. La premsa publicava amb fruïció cada nova millora de la IA. S’anunciava un futur gloriós per a la humanitat gràcies a les màquines intel·ligents. La derrota de Ke Jie va causar un impacte tan gran que el New York Times va qualificar la partida com el «moment Sputnik» de la Xina.[6] La referència al·ludia al dia que els americans es van adonar que la Unió Soviètica havia posat un satèl·lit (l’Sputnik) en l’òrbita terrestre, i això va generar la reacció a tot el país que calia fer alguna cosa per no perdre la cursa per la conquesta de l’espai. La partida de Ke Jie contra AlphaGo va tenir un efecte similar a la Xina, ja que, un mes després de la partida, el president Xi Jinping va anunciar un mastodòntic pla d’inversió en la nova tecnologia que havia de portar el seu país a ser líder mundial en IA abans del 2030.[7]
En el seu llibre Abundance,[8] Peter Diamandis va anunciar que la IA resoldria el problema del càncer, la pobresa, la guerra i el canvi climàtic. L’ex director general de Google, Eric Schmidt, va fer proclames igual d’optimistes. El Fòrum Econòmic Mundial parlava d’una quarta revolució industrial gràcies a un munt de noves tecnologies entre les quals la IA[9] destacava per sobre de totes les altres. El famós informàtic de la Universitat de Stanford Andrew Ng deia que la IA era la nova electricitat:[10] «De la mateixa manera que l’electricitat ho va transformar gairebé tot fa cent anys, avui em costa molt pensar en una indústria que la IA no transformi en els propers anys». Segons els més experts dels experts, doncs, aquesta tecnologia revolucionària havia de contribuir a crear infinitat de productes, llocs de treball, riquesa i benestar.
En aquest context d’eufòria, però, van aparèixer dues publicacions que van tirar una mica d’aigua al vi. Bé, una mica no, n’hi van tirar molta. El gener del 2017 els economistes Carl Benedikt Frey i Michael Osborne, de la Universitat d’Oxford, van publicar un article que deia que el 47 % dels llocs de treball desapareixerien als Estats Units en les properes dues dècades per culpa de l’automatització consegüent a la IA.[11] Si fos certa, aquesta dada seria devastadora, ja que gairebé la meitat dels llocs de treball desapareixerien per culpa de la nova intel·ligència artificial!!! De cop i volta la gent va començar a veure l’altra cara de la moneda: si les màquines podien analitzar les imatges radiològiques millor que els humans, és cert que milloraríem molt a l’hora de diagnosticar càncers. Però què passaria amb els radiòlegs? Si el Watson d’IBM podia practicar la medicina millor que els metges humans, els pacients es guaririen més ràpidament. Però de què treballarien els metges? Si la IA aplicada als cotxes autònoms eliminava els accidents de trànsit, salvaríem 1,2 milions de vides. Però què farien els 65 milions de persones al món que es guanyen la vida conduint taxis, furgonetes, camions o autobusos? Si les grans aplicacions lingüístiques com GPT-3 o ChatGPT podien escriure articles de diari, guions o novel·les tan bé com els humans, què passaria amb la feina de periodistes, guionistes i escriptors? Si les anàlisis de Frey i Osborne eren correctes, la resposta era clara: radiòlegs, metges, conductors, periodistes, guionistes i escriptors perdrien la feina, igual que el 47 % de les professions que, segons el seu estudi, desapareixerien en els vint anys següents!
L’any 2016 el mateix Geoffrey Hinton va deixar anar una bomba que va fer tremolar tots els hospitals del món quan va declarar: «Si treballes de radiòleg, ets com Wile E. Coyote dels dibuixos animats en el moment que ha sobrepassat el penya-segat però encara no ha mirat avall. Hauríem de deixar de formar nous radiòlegs immediatament, ja que és completament obvi que d’aquí cinc anys la IA diagnosticarà millor que ells!». Yuval Harari ho exposava d’una manera encara més dramàtica: de la mateixa manera que l’agricultura va dividir el món en uns quants terratinents i una gran massa de serfs, i de la mateixa manera que la Revolució Industrial va dividir el món en uns pocs capitalistes i una gran massa de proletaris, la IA dividiria el món en unes quantes empreses tecnològiques propietàries de les dades que alimenten la IA i una gran majoria d’humans que no trobarien feina.[12] Amb la seva llegendària capacitat per donar titulars, Harari va encunyar una frase que va fer furor i va generar pànic: la majoria de la humanitat passaria a formar part del que va anomenar la gran classe inútil, tan inútil que ni a les empreses els sortiria a compte explotar-la. No cal dir que les desigualtats entre els pocs propietaris i la gran massa de gent inútil augmentarien fins a nivells inimaginables.
L’altra publicació que va aigualir el vi de l’eufòria va ser el llibre titulat Superintel·ligència[13] del filòsof suec i també professor d’Oxford Nick Bostrom. En aquest terrorífic llibre s’explicava que, si no es feia bé, la IA podria representar la fi de la humanitat. El seu argument no era que els robots s’alçarien en rebel·lió contra la supremacia humana com si fos una pel·lícula de Hollywood, sinó tot el contrari: els robots farien tan bé la feina que els demanen els humans, que podrien posar la humanitat en perill. En el llibre va posar un exemple que es va convertir en un clàssic instantani: si demanem als robots intel·ligents que fabriquin una cosa tan simple com són clips per subjectar papers, faran tot el possible per acaparar tot el ferro de la Terra i, un cop exhaurit, mataran els humans per extraure’n el ferro que tenen als glòbuls vermells. O potser muntaran expedicions a altres planetes per cercar-hi el ferro i deixaran la humanitat sense recursos per subsistir. Era la versió informàtica del problema del rei Mides, que va demanar al déu Dionís el do de convertir en or tot el que toqués... i va morir de gana perquè els aliments també es convertien en metall groc així que els agafava amb les mans.
Aquest tipus d’escenaris catastròfics van quallar entre la premsa i l’opinió pública, i sobretot entre els influencers més importants del món: Bill Gates va recomanar amb entusiasme el llibre de Bostrom com una de les lectures obligatòries d’aquell any. Elon Musk es va espantar tant, que va reunir un grup de gent famosa i entre tots van escriure i signar una carta pública alertant dels perills que podia comportar el desenvolupament d’IA amb nivells d’intel·ligència comparables als dels humans. La carta va ser signada per centenars de científics d’arreu del món, inclòs el llegendari Stephen Hawking, que va arribar a dir que «la creació d’IA podria ser el pitjor esdeveniment de la història de la civilització humana perquè ens podria destruir a tots».[14]
Els anuncis sobre les conseqüències de la IA van abandonar el camí de roses cap a la prosperitat il·limitada i van passar a pintar un futur distòpic en què els robots intel·ligents ens robarien totes les feines, en què els humans esdevindríem éssers inútils i insignificants, en què les nostres ments serien manipulades per uns quants rics i poderosos propietaris dels robots i de les dades i en què les desigualtats entre l’1 % dels rics i el 99 % de la població inútil arribarien a nivells inimaginables. Tot això si abans no moríem esclafats per la superintel·ligència de les noves màquines fabricadores de clips de paper.
En els mitjans de comunicació, les notícies positives van començar a ser substituïdes per les negatives: quan els caixers dels supermercats perdien la feina, la premsa en culpava la IA. Quan l’empresa Cambridge Analytica robava les dades de Facebook per ajudar els defensors del Brexit a guanyar el referèndum, s’acusava la IA. Quan els debats a les xarxes socials eren cada dia més polaritzats, la culpa era dels algoritmes intel·ligents que manipulaven la ment de la gent per obtenir més clics. Quan les notícies falses, o fake news, apareixien de forma massiva, el problema eren els creadors dels grans models lingüístics com GPT-3. Quan una creixent part de la població votava partits ultraradicals i catapultava al poder gent com Jair Bolsonaro al Brasil, Donald Trump als Estats Units o Giorgia Meloni a Itàlia, la responsable era la IA. Quan les dades mostraven un augment de les desigualtats de rendes dins dels països, els analistes hi veien les primeres evidències que anàvem cap al món distòpic amb una «gran classe inútil». De sobte, totes les desgràcies eren culpa de la nova tecnologia que, més que una eina de progrés, es comparava amb els dinosaures de la pel·lícula Jurassic Park: un cop els fabriques, és impossible evitar que s’escapin i, un cop s’escapen, és impossible tornar-los a la gàbia. Com la pasta de dents que no pot tornar al tub.
En aquest sentit, l’opinió pública i la publicada van donar per bo l’estudi de Frey i Osborne i tothom va acceptar que la meitat de les feines desapareixerien abans de vint anys. La temible dada del 47 % d’ocupacions perdudes en mans d’una IA desenfrenada era repetida mecànicament a tots els diaris, revistes, conferències i documentals de televisió que parlaven del futur de l’economia. Cada cop més gent reclamava la intervenció dels governs per solucionar els grans problemes que ens havien de provocar les màquines intel·ligents. Alguns, com el creador de Twitter Jack Dorsey, reivindicaven la introducció d’una renda mínima universal que tothom hauria de cobrar, independentment de si treballava o no, per evitar que la gran massa de treballadors que acabarien perdent la feina es morissin de gana. Altres, com Bill Gates, exigien que els robots paguessin impostos sobre la renda i cotitzacions a la seguretat social per substituir la recaptació que generaven els treballadors reemplaçats per màquines. També n’hi havia que, com l’economista francès Thomas Piketty, demanaven impostos sobre la renda de fins al 90 % per reduir les desigualtats que la IA ja estava generant.
El gener del 2018 Yuval Harari va fer una sessió plenària al Fòrum Econòmic Mundial. Amb tota seguretat, va ser la sessió més impactant que recordo dels vint anys que feia que anava a Davos. Durant mitja hora, Harari va explicar les amenaces que representaven els algoritmes intel·ligents: des de la seva ja famosa teoria de «la classe inútil» fins a noves idees, com que les societats modernes acabarien convertides en dictadures digitals on els algoritmes intel·ligents organitzarien les economies en substitució dels mercats i permetrien als governs i a les grans empreses vigilar, espiar i manipular els ciutadans. Recordo que, assegut a la segona fila, jo mirava la reacció del públic, principalment grans empresaris i poderosos representants de la classe política, a les apocalíptiques paraules de Harari. L’única que no semblava espantada era Angela Merkel, que feia la cara de pòquer habitual. La resta eren rostres nerviosos amb pinzellades de pànic.
En aquell moment va néixer el llibre que teniu a les mans. Ja feia temps que em voltava pel cap la idea d’estudiar, pensar i analitzar les implicacions econòmiques de la intel·ligència artificial per plasmar-les en un llibre, però he de dir que aquell discurs de Harari em va acabar de convèncer. I no perquè estigués d’acord amb la seva visió distòpica, al contrari: la meva intuïció econòmica em deia que el famós professor israelià estava totalment equivocat. La història econòmica és plena d’exemples de grans innovacions tecnològiques que efectivament han comportat pèrdues massives de llocs de treball, però que sempre han anat acompanyades de creacions encara més massives d’ocupació, de manera que, al final, totes han acabat generant sempre més feina, i no pas menys. Al cap i a la fi, aquell era el moment de la història en què més humans treballaven al planeta. Si el progrés tecnològic era el causant de la destrucció de llocs de treball, com era possible que hi hagués tanta ocupació després del gran nombre de revolucions tecnològiques que hem viscut?
Pel que fa a la predicció de les dictadures digitals, la cosa tampoc no m’acabava de quadrar. La història també ens mostrava que les economies de mercat en societats inclusives i democràtiques havien estat infinitament superiors a les dictadures de planificació central que havien existit durant el segle XX perquè, entre altres raons, proporcionaven incentius a la gent per treballar, estudiar i invertir per progressar. Per què hauria de canviar-ho tot, la IA?
D’altra banda, la pel·lícula distòpica de Bostrom i els seus clips de paper per mi tampoc no tenia sentit: com pot ser qualificat d’intel·ligent un robot que no entén que quan li demanes que fabriqui clips de paper no ha d’executar humans per extraure’n el ferro dels glòbuls vermells??? Una màquina que no tenia prou sentit comú per entendre una cosa així (un sentit comú que, per cert, té qualsevol nen de cinc anys) no podia ser prou intel·ligent per dominar el sector de la fabricació de clips de paper ni de res que s’hi assemblés! Era com dir que els GPS, que també utilitzen IA, eren perillosos perquè quan els demanes el camí més curt per anar a l’aeroport, tiren una línia recta i encasten el cotxe contra el primer edifici! No! Els enginyers que fabriquen GPS ja saben que el camí més curt no vol dir la línia recta, sinó el camí més ràpid de tots els que passen pels carrers i carreteres per on poden transitar els cotxes i sense xocar contra els edificis. Si això es pot programar en un GPS, de ben segur que s’ha de poder fer el mateix amb un robot fabricant de clips per subjectar papers!
Per tant, la meva impressió inicial era que tot el catastrofisme associat amb la intel·ligència artificial era pura exageració per vendre llibres i omplir teatres. Calia afegir-hi el fet que moltes de les grans promeses que els experts informàtics havien fet els anys abans no s’estaven complint: al mateix temps que es publicaven notícies que anunciaven noves fites de la IA, n’apareixien de fracassos sonats. Per exemple, els algoritmes d’identificació d’imatges eren poc sòlids, en el sentit que se’ls podia enganyar fàcilment només canviant uns quants píxels.[15] Una famosa periodista xinesa va ser detinguda perquè la IA va identificar la seva cara quan travessava el carrer i no ho feia pel pas de vianants. A la Xina actual, aquesta conducta està molt mal vista i es castiga amb punts del «carnet de bon ciutadà». Però la famosa periodista ni tan sols era a la ciutat en el moment dels fets. El que va passar és que la seva cara apareixia en l’anunci d’un autobús que passava per davant de la càmera i la IA que usava el govern xinès no sabia distingir entre cares reals i cares dels anuncis dels autobusos.[16]
Malgrat que havien transcorregut sis anys des que Hinton havia comparat els radiòlegs amb Wile E. Coyote i havia predit que la professió desapareixeria en cinc anys, ni un sol radiòleg havia perdut la feina.[17] D’altra banda, el triomf d’AlphaZero havia estat impressionant, però els experts van adonar-se que si en comptes d’un tauler quadrat en posaves un de rectangular no sabia ni tan sols començar la partida. De la mateixa manera, si treies una línia de píxels a la pantalla, no sabia jugar al Breakout.[18] El Doctor Watson d’IBM podia identificar paraules dels llibres de medicina, però no entenia res de res. De fet, els metges de seguida es van adonar que aquella tecnologia no només era contraproduent i els feia perdre el temps, sinó que era enormement perillosa perquè generava diagnosis equivocades amb errors que no cometrien els estudiants de primer de Medicina. A poc a poc, els hospitals que s’havien associat amb entusiasme al projecte Watson van abandonar-lo.[19] IBM va esquarterar el famós doctor digital i en va vendre les peces.[20]
Pel que fa a la conducció autònoma, la IA anava automatitzant a poc a poc petites tasques de la conducció, però l’arribada del cotxe totalment autònom, sense cap mena d’intervenció humana, es posposava any rere any. A finals del 2022 i després d’haver promès el contrari, Apple va anunciar que canviava d’opinió i que els seus nous vehicles autònoms tindrien volant i seient per al conductor humà, la qual cosa demostrava que la seva confiança en la possibilitat de fabricar un cotxe veritablement autònom disminuïa. A més a més, també posposava la presentació del nou automòbil, altre cop, un any més.[21] A l’octubre del 2022, la consultora McKinsey & Co estimava que les empreses del sector havien dilapidat més de 100.000 milions de dòlars amb el disseny i la fabricació de cotxes autònoms i que els inversors començaven a témer que, malgrat aquesta enorme inversió, la indústria no anava enlloc.[22] Anthony Levandowski, un dels pioners del sector i considerat per molts el padrí dels cotxes autònoms, deia que estava segur que «algun dia tindrem cotxes autònoms però que, ara mateix, costaria trobar una indústria que hagi invertit tants dòlars en R+D i que hagi aportat tan poc!».[23] Fins i tot Tesla va fer un comunicat on explicava que la seva tecnologia de conducció autònoma podia ser un fracàs, però en cap cas un frau.[24] Així doncs, conduir per ciutats plenes de vehicles pilotats per xofers humans erràtics i de vianants impredictibles era més difícil del que els experts havien imaginat.
Tot i que els «grans models lingüístics» eren cada dia millors, estaven lluny de tenir la intel·ligència necessària per entendre les coses. El tan aclamat programa Duplex de Google va resultar inútil a l’hora de fer reserves que no fossin en un restaurant o una perruqueria i, per exemple, no podia fer reserves al cinema o al teatre.[25] El projecte M de Facebook, un bot que també podia fer reserves per telèfon, va ser cancel·lat tres anys després del seu llançament. El bot Galactica que Meta (antiga Facebook) havia construït per escriure articles científics comparables als dels humans va haver de ser retirat de la circulació perquè tot el que escrivia era pura ficció i no tenia res a veure amb la ciència.[26] El robot simplement al·lucinava, és a dir, s’inventava el que no sabia. Ho feia amb tanta seguretat i convenciment que enganyava els qui no eren experts en el tema i els podia fer creure que qualsevol mentida tenia suport científic. L’escàndol va ser tan grandiós que Galactica va durar només dos dies. Poc després, el cap d’IA de Meta, Yann LeCun, va declarar que «els mètodes actuals d’IA no ens portaran mai a aconseguir la veritable intel·ligència».[27] El GPT-3 d’OpenAI escrivia textos aparentment impecables, però quan li preguntaves coses de sentit comú cometia errors garrafals. Douglas Hofstadter va escriure un article amb una llista de preguntes com ara: «En quants trossos es parteix un violí si li llances un gra d’arròs?». GPT-3 responia, convençut, que es dividia en tres parts iguals. Segons Hofstadter, això demostrava que podia escriure textos i enganyar la gent, però que no tenia ni la més mínima idea del que parlava.[28] De fet, ni tan sols sabia que no en tenia ni idea. Malgrat les seves mancances, GPT-3 va seguir generant una gran expectació entre el públic perquè escrivia redaccions realment impressionants. El seu successor, l’anomenat ChatGPT que OpenAI va fer públic el desembre del 2022, era encara més impressionant i cometia errors menys flagrants. Però seguia demostrant que no entenia res. Per exemple, quan li preguntaves: «Què pesa més, un quilo de palla o un quilo de ferro?», ChatGPT responia convençut que un quilo de palla. I quan li preguntaves «De quina religió serà el primer president jueu dels Estats Units?», ChatGPT responia que no es podia saber. Però sí que es podia saber i, de fet, qualsevol nen de cinc anys hauria sabut que, evidentment, seria jueu. L’algoritme més intel·ligent de la història queia en la trampa infantil del «cavall blanc de Santiago» amb la qual els pares intenten enganyar els seus fills i filles de primària.
A banda d’això, igual que el seu antecessor GPT-3, ChatGPT seguia al·lucinant. És a dir, continuava inventant-se el que no sabia i es quedava tan tranquil, la qual cosa demostrava que no entenia els textos que manipulava.[29] En determinats escrits, com les novel·les o els guions de sèries de televisió, la veritat és irrellevant i, per tant, no importa que hagin estat escrits per bots que no entenen res. Però hi ha contextos en què la veritat és fonamental: per exemple, els articles periodístics o científics o les enciclopèdies. Imagineu el caos que es formaria si la Viquipèdia fos reescrita constantment per un exèrcit de robots que no sabessin distingir la veritat de la mentida. O imagineu que hi hagués màquines capaces de fabricar milers d’articles suposadament científics que demostressin falsament que un producte químic tòxic té propietats curatives, que els homes són més intel·ligents que les dones, que una guerra nuclear seria bona per a la humanitat o que el suïcidi és una bona manera de reaccionar quan el teu equip de futbol perd una final. ChatGPT era una potencial fàbrica capaç d’escriure milions de fake news amb una capacitat disruptiva per a les societats modernes on alguna cosa que s’assembla a la veritat encara és important. Davant la por que hi hagués un moviment social contrari a ChatGPT semblant al que havia obligat Meta a retirar Galactica dos dies després de ser presentat, el director d’OpenAI Sam Altman va piular: «ChatGPT és increïblement limitat, però prou bo en algunes coses per crear una impressió enganyosa de grandesa. Ara mateix és un error confiar-hi per a qualsevol cosa important. És una vista prèvia del progrés; tenim molta feina per fer en solidesa i veracitat». Una impressió enganyosa de grandesa! No es podia dir millor.
Pel que fa als robots, dotze anys després del triomf de Krizhevsky i Sutskever a l’ImageNet Challenge, a les llars d’arreu del món el robot més intel·ligent encara era la Roomba, que servia per treure la pols i passejar el gat. No hi havia res que s’aproximés, ni remotament, a la tan desitjada Rosey. Va transcendir que el propietari de Sophia, l’americà David Hanson de Hanson Robotics, havia pactat les preguntes amb les cadenes de televisió que l’entrevistaven i que la intel·ligència que suposadament mostrava Sophia en les respostes era, en realitat, la dels guionistes que la programaven.(6) No era més que una estafa amb una cara inquietantment humana. O, si més no, això va dir el cap d’IA de Meta, Yann LeCun, quan va piular[30] que era «una autèntica collonada: una IA tan falsa com el Potemkin».
Malgrat les espectaculars acrobàcies, els robots saltimbanquis de Boston Dynamics no eren intel·ligents, sinó que estaven teledirigits per humans, igual que els cotxes que regalem als nens petits pel seu aniversari. És més, es va saber que els vídeos que es van fer virals a internet estaven gravats múltiples vegades i que els autors només publicaven les ocasions en què el robot havia completat la cabriola amb èxit.[31] Quan Elon Musk va presentar el seu gran projecte de robot Optimus, l’octubre del 2022, el prototip que va sortir a l’escenari va caure a terra diverses vegades i, com que no es podia posar dret tot solet, van haver de sortir quatre o cinc assistents humans per ajudar-lo a aixecar-se. Un cop dret, donava voltes sobre si mateix, regava plantes i caminava molt a poc a poc. La premsa i les xarxes socials van ridiculitzar el pobre robot i els inversors van fugir corrents veient el poc avenç del projecte i en saber que el preu que l’empresa proposava per a aquell robot que, de moment, no sabia fer res era de 200.000 dòlars. Les accions de Tesla van caure un 3 % el dia de la presentació. Suposo que la poca preparació i el progrés limitat a l’hora de desenvolupar robots intel·ligents és el que explica que, quan Elon Musk havia anunciat Optimus un any abans davant d’un públic entusiasta, a l’escenari no aparegués cap robot real, sinó un home patèticament disfressat que ballava amb els famosos moviments robòtics que va popularitzar Michael Jackson als anys vuitanta del segle passat.[32] En els concursos internacionals, els robots continuaven tenint problemes seriosos per fer coses tan senzilles com obrir una porta amb una clau. A la vista d’aquestes dificultats, si algun dia us trobeu enmig d’una rebel·lió de robots que us persegueixen perquè volen exterminar la humanitat, l’únic que heu de fer és tancar la porta amb clau i s’acabarà la rebel·lió!
En resum, em feia la sensació que, tot i els seus assoliments espectaculars, la IA encara era força lluny de ser veritablement intel·ligent. Repassant la història de la IA,[33] vaig saber que no era la primera vegada que els informàtics de la IA aprofitaven que els periodistes i la gent no especialitzada no entenen exactament el que fan i com ho fan per vendre’ns la moto amb elevades dosis d’exageració i d’autobombo. Al cap i a la fi, si la societat s’entusiasmava amb els seus invents, i els governs i les empreses hi invertien, ells guanyarien fama i es farien rics. Per tant, tenien tots els incentius per magnificar les seves gestes, per la qual cosa vaig pensar que podíem trobar-nos davant d’un nou episodi d’exageració malgrat el progrés evident en moltes de les àrees en què s’aplicava la nova IA. La meva primera impressió, doncs, era que els catastrofistes també estaven equivocats perquè el que s’estava construint no era realment intel·ligent... encara.
Però una cosa era la meva primera impressió, i una altra era una anàlisi seriosa del tema. Per exemple, que les coses hagin passat d’una manera al llarg de la història no garanteix que sempre hagin de passar igual. De fet, no hi ha cap teorema que digui que el canvi tecnològic no pugui anar acompanyat de pèrdua d’ocupació i, per tant, és teòricament possible que aquesta vegada la revolució tecnològica comporti un augment significatiu de l’atur. No ha passat mai, però és teòricament possible. La pregunta seria si aquest cop és diferent. I si ho és, per què? Podria ser, per exemple, que en el passat el progrés tecnològic ens hagués fet perdre les feines físiques, la qual cosa hauria provocat que els humans ens haguéssim refugiat en tasques cognitives. I per això, a mesura que les feines físiques es perdien en la pagesia o en la construcció, molts vam esdevenir comptables, advocats, actrius, economistes o presentadores de televisió. Ara bé, si les màquines intel·ligents ens començaven a superar també en les tasques cognitives, què ens quedaria per fer? On ens podríem refugiar aquest cop? La possibilitat que aquesta vegada sí que fos diferent existia!
De la mateixa manera, era possible que la planificació socialista hagués estat inferior als mercats descentralitzats durant el segle XX perquè la tecnologia del segle XX era dolenta. Per exemple, una de les raons per les quals el comunisme va fracassar és que els planificadors no sabien ben bé quins eren els gustos de la ciutadania i, per tant, ordenaven fabricar coses que la gent no volia, mentre que les coses que la gent realment volia no es fabricaven. Per tant, amb la tecnologia del segle XX va ser impossible que el comunisme funcionés. Ara bé, si la IA del segle XXI fos capaç de conèixer els humans molt millor del que es coneixen ells mateixos, ¿no podrien els algoritmes ajudar els planificadors a evitar els errors que van cometre al segle XX? És a dir, no seria possible que les dictadures que van fracassar al segle XX triomfessin al segle XXI, tal com explicava Harari?
Finalment, el fet que els informàtics haguessin exagerat els seus èxits moltes vegades abans no volia dir que aquest cop també ho estiguessin fent. Certament, moltes coses que s’estaven fabricant no només eren impressionants, sinó que ja estaven tenint un impacte extraordinari en moltes activitats econòmiques. És més, la llarga llista de fracassos no indicava necessàriament que la IA només fos autobombo i exageració. Tampoc no evidenciava necessàriament una manca de progrés. Tots els processos d’innovació tecnològica van acompanyats de fiascos monumentals. Abans que la màquina de vapor, l’automòbil o els generadors elèctrics prenguessin la forma final —per posar només tres exemples dels quals parlarem més endavant— hi va haver desenes d’intents que van fracassar! N’explicarem alguns al llarg d’aquest llibre. És la naturalesa del procés d’innovació, que sempre va lligat a l’experimentació: les coses que funcionen es mantenen, i les que no, s’eliminen o es canvien. Que la IA patís fracassos sonats podia ser un senyal no pas que la cosa no anava bé, sinó tot el contrari.
Tot plegat em va fer prendre la decisió d’escriure un llibre sobre l’impacte econòmic de la IA. Amb aquest objectiu em vaig passar cinc anys llegint tots els llibres i articles d’investigació que vaig poder sobre la història, l’evolució, l’estat actual i el possible futur de la IA. També vaig llegir tot el que s’havia escrit sobre les conseqüències econòmiques que la IA actual té en l’economia d’avui dia i tot el que deien els experts sobre l’impacte potencial d’una futura IA que fos igual o més intel·ligent que els humans.
Perquè, encara que avui no tinguem màquines (o com diuen els experts, agents) realment intel·ligents, amb tota probabilitat tard o d’hora en tindrem. Els experts no es posen d’acord en la data d’arribada, però la majoria coincideixen a dir que arribarà el dia que sabrem construir agents amb nivells d’intel·ligència equiparables als nostres. Això és el que els experts anomenen intel·ligència artificial general (o IAG). De màquines amb algunes —només algunes— capacitats cognitives superiors a les dels humans ja fa anys que en construïm. Només cal agafar una calculadora i multiplicar qualssevol dos nombres de dues xifres per saber que això de calcular, les màquines ja fa temps que ho fan molt millor que nosaltres. Però una cosa és fabricar màquines que facin coses específiques, com calcular, jugar a escacs o classificar imatges de fotos —un tipus d’intel·ligència que els experts anomenen IA restringida— i una altra és fer aparells realment intel·ligents, amb capacitat de raonar, inferir, criticar, preguntar o exportar coneixements d’un domini a un altre tal com podem fer els humans. En definitiva, una intel·ligència suficient per entendre l’univers que ens envolta. Això, ara com ara, ningú no ho sap fer.
Bé, ningú, ningú... tampoc. De fet, tots nosaltres sabem com fabricar agents intel·ligents de manera sistemàtica i fiable: només hem de copular amb la nostra parella(7). Un cop els espermatozoides del mascle fecunden l’òvul de la femella, la natura fa la resta i, màgicament, nou mesos després apareix un «agent intel·ligent». Després d’un procés d’aprenentatge, aquest ésser intel·ligent pot comunicar-se a través del nostre sofisticadíssim llenguatge, pot raonar, inferir, deduir, crear obres d’art, estimar, fer operacions matemàtiques; pot sofrir, imaginar, planificar, resoldre problemes; pot esquiar, ballar i fer infinitat de coses més gràcies a una intel·ligència superlativa que el situa a la cúspide del regne animal.
Des d’aquest punt de vista, sí que sabem fabricar agents intel·ligents: els nostres fills. Quan dic que no sabem com fer màquines intel·ligents, no significa que no sapiguem copular. El que vull dir és que no entenem gaire bé com la natura passa de l’òvul fecundat a un cervell plenament desenvolupat, amb la seva ment, la seva intel·ligència i la seva consciència. En sabem alguns detalls, però no gaires. I certament no en sabem prou per reproduir tot aquest procés en agents no humans: els ordinadors.
Suposo que perquè l’única intel·ligència que coneixem avui dia és la que surt dels cervells humans, els experts informàtics que volien crear IA ja a mitjans dels anys cinquanta del segle XX van decidir emmirallar-se d’entrada en el cervell humà. Com he dit al principi, uns van optar per imitar el cervell i es van dedicar a fer xarxes neuronals i els altres van preferir inspirar-se en el funcionament de la ment i van crear la IA simbòlica.
En el procés d’escriure aquest llibre, jo vaig fer el mateix. Vaig concloure que abans d’entendre la IA i les seves implicacions econòmiques, era bo començar analitzant la intel·ligència natural. Per això vaig decidir dividir el llibre en dos volums separats. El primer és aquest que teniu a les mans i que es titula De la sabana a Mart: l’economia de la intel·ligència natural. La segona part d’aquesta obra tractarà de la IA i les seves conseqüències econòmiques presents, que ja són moltes, i les futures. Es titularà Entre el paradís i l’apocalipsi: l’economia de la intel·ligència artificial.
Com el títol indica, aquest primer llibre tracta de la intel·ligència natural i de com ha servit als humans per assolir nivells de prosperitat colossals. Començarem parlant del cervell i de la ment. Ens preguntarem què és i com funciona, què són les neurones, les sinapsis i per què es f