U n racconto di Isaac Asimov del 1956, The Jokester (“Il Barzellettiere” nella traduzione italiana): in un lontano futuro, l’umanità ha costruito un gigantesco computer, Multivac: intelligenza artificiale definitiva in grado di rispondere a qualsiasi domanda le venga posta. Ovviamente bisogna essere bravi a porre le domande giuste, per questo solo i Gran Maestri possono interloquire con Multivac. Un Gran Maestro, Noel, ha un’ossessione – la comicità – e alcune domande a cui nessuno ha ancora risposto, neppure l’onnisciente digitale: da dove vengono le barzellette? Perché abbiamo il senso dell’umorismo? Per questo, Noel inizia a raccontare storielle divertenti a Multivac e riempirlo di nozioni teoriche e pratiche sulle strutture del comico, sulla filosofia dell’umorismo e, in generale, tutto ciò che l’umanità ha prodotto fino a quel momento sull’argomento. Dopo qualche giorno, il supercomputer ha finito di assimilare tutte le informazioni e ha finalmente una risposta, l’unica risposta possibile: origine extraterrestre. Un’antica civiltà aliena è arrivata sulla Terra milioni di anni fa e ha impiantato nei cervelli degli ominidi il senso dell’umorismo e alcuni archetipi di barzellette, progenitrici di quelle che si raccontano ancora oggi. Un gigantesco esperimento psicologico che di fatto ha creato l’uomo così come lo conosciamo: animale razionale, certo, ma eminentemente animale umoristico.
Questa storia pone domande ancora molto difficili da rispondere, anche nel 2023. Da dove vengono le barzellette, cos’è il senso dell’umorismo e dunque, per estensione, perché ridiamo, di cosa ridiamo e perché non possiamo farne a meno. Proprio come nel racconto, sembra che un’intelligenza artificiale possa aiutarci a capire un po’ meglio il grande mistero della comicità, anche se con modalità un po’ diverse. D’altra parte, era proprio Asimov che diceva che la frase più eccitante nella scienza non è “Eureka!”, bensì “That’s funny!”.
Le macchine sono già in grado di recitare le barzellette che gli insegniamo, possono riconoscere le marche umoristiche nei testi, capire l’ironia, trovare giochi di parole e generarli autonomamente, addirittura scrivere intere sceneggiature di sit com.
Il dibattito sulle intelligenze artificiali (artificial intelligence, AI) sta fiorendo dappertutto, anche in Italia, dove diversi scrittori, artisti intellettuali come Francesco D’Isa qui sul Tascabile, Lorenzo Ceccotti, Gregorio Magini e Vanni Santoni portano avanti da mesi un discorso fondato soprattutto su quelle particolari AI chiamate TTI, cioè Text To Image, applicazioni che generano immagini di qualsiasi tipo – spesso difficilmente distinguibili da un’opera umana – a partire da prompt dell’utente, cioè da istruzioni verbali scritte. L’argomento è davvero articolato e invito chi fosse a digiuno del tema a leggere gli articoli sopra citati, e soprattutto a provare Midjourney. Anche se nelle righe successive mi occuperò d’altro, nello specifico di AI testuali che operano basandosi sul modello linguistico GPT-3, alcuni aspetti del dibattito in corso risultano centrali anche per il nostro discorso parallelo.
Leggendo i vari interventi, infatti, pare che l’avvento delle AI nella produzione creativa e artistica – al netto delle legittime preoccupazioni per i lavori da grafico o illustratore, dei pesanti problemi ambientali di queste tecnologie e di alcuni equivoci su quanto intelligenti siano queste intelligenze – abbia stimolato (forzato?) una riflessione sistemica sulla disciplina di riferimento, in questo caso l’arte. D’Isa e Ceccotti più di tutti si incontrano e si scontrano proprio sull’essenza dell’arte come teoria e come pratiche e sulle costellazioni di definizioni, limiti e circoscrizioni degli attori, animati o inanimati, che la articolano: il committente, l’artista, il ruolo degli strumenti tecnici, lo stile, il plagio, l’attribuzione autoriale e così via. Ragionare sulle AI allora significa anche ragionare sull’essenza stessa dei domini culturali a cui si applicano, testarne i limiti e riconfigurare la loro comprensione profonda. Vale per l’arte, vale per il giornalismo, per il copywriting, la letteratura, e vale anche per la comicità.
Non solo: dare in pasto alle macchine le capacità, le nozioni e le strutture legate all’ambito comico ci permette di compiere anche il percorso inverso. Il senso dell’umorismo, la capacità cioè di riconoscere una porzione di mondo e di realtà in quanto “comica”, è una proprietà essenziale dell’essere umano, tanto quanto la sua razionalità. L’uomo è l’unico animale che ride ed è proprio questa capacità a determinarlo. Inoltre l’umorismo è anche un aspetto cruciale per capire meglio il funzionamento e l’essenza stessa della comunicazione umana: come sostiene Diyi Yang, professore alla School of Interactive Computing di Georgia Tech,
se i nostri computer riusciranno a capire l’umorismo, riusciranno a capire anche molto meglio il vero significato del linguaggio umano. Se i device come Alexa o Siri avessero una migliore comprensione dell’umorismo, potrebbero prendere decisioni migliori per affinare la loro user experience.
In altre parole: quando una AI imparerà a ridere e riconoscere autonomamente ciò che fa ridere, senza aiuti umani, allora sì che ci sarà da preoccuparsi, perché sarà diventata esattamente come noi. Insegnare la comicità a un supercomputer, proprio come il Multivac di Asimov, ha dunque due scopi complementari: capire meglio l’essenza e il funzionamento delle dinamiche umoristiche (di fatto spacchettandole) e testare e migliorare l’effettivo livello di “umanità” delle macchine. Siamo ancora molto lontani da entrambi i traguardi e la strada da fare è molta. Qui proverò a mostrarne la direzione, senza pretese di soluzione definitiva, altrimenti non sarei certo qui a scrivere ma in qualche atollo del Pacifico ad accendermi sigari con banconote da duecento euro, quelle viola.
Ma partiamo dalle basi. Quando si parla di AI o di deep learning (apprendimento profondo) ci si riferisce alle reti neurali artificiali (ANN), complessi sistemi che vengono modellati attorno al funzionamento del nostro cervello. Di fatto ne sono imitazioni, certamente imperfette, anche perché le AI non hanno (ancora?) coscienza di quello che stanno facendo, non capiscono davvero di cosa tu stia parlando o cosa tu voglia fare, ma si orientano in maniera probabilistica. A partire dalle istruzioni ricevute in sede di programmazione, la macchina decide qual è l’ambito più probabile nel quale muoversi. Qui useremo AI basate su GPT-3, Generative Pre-Trained Transformer 3, un modello linguistico che usa l’apprendimento profondo per produrre testo simile al linguaggio umano, talmente simile che spesso è di fatto impossibile distinguerne l’autore. Per capirci senza troppi tecnicismi, GPT3 calcola la probabilità che una parola x segua la parola y data la sequenza precedente z. Non c’è autoconsapevolezza, ma automatismo, ricerca e selezione.
Prendiamo come esempio il nuovo strano libro di racconti di Rocco Tanica, Non siamo mai stati sulla Terra, pubblicato per il Saggiatore e scritto a quattro mani con Out0mat-B13, una AI basata su GPT-3. A quattro mani significa che Tanica dava l’abbrivio (con una frase, o l’inizio di una storia) e il bot continuava, completava, concludeva e inventava storie, invero molto divertenti. In una bella intervista sulle sue modalità di impiego, Tanica spiega che:
questo modello di linguaggio è stato all’origine istruito con centinaia di migliaia di istruzioni, libri di tutti i tipi, e questo è servito per creare la conoscenza di base per il calcolo probabilistico. Se si vuole ottenere uno stile particolare, basta nutrire il sistema con un brano d’esempio. Quando volevo una descrizione narrativa, prima di iniziare alimentavo il sistema con le Cosmicomiche di Calvino o con la Boutique del Mistero di Buzzati. Ho inserito testi di Dickens invece per ottenere uno stile retrò. Ho fatto cimentare il sistema anche con la composizione di haiku, dopo avergli dato come esempi alcuni dei più celebri haiku della letteratura.
Ora, posto che il Maestro Tanica parla davvero come un libro stampato, la cosa funziona proprio così: la AI ha in memoria milioni di riferimenti letterari che usa come repertorio da scandagliare per produrre contenuti coerenti, che possono essere affinati con l’intervento diretto dell’utente a seconda dei suoi scopi precisi. Gli haiku ottenuti sono effettivamente sorprendenti:
NULLAFACENZA
Il passo del bruco
l’ombra alata del colibrì
attimi di quiete
E anche molto divertenti:
BEATA INNOCENZA
Rosseggiano i papaveri
ignari
di diventare eroina
Infatti il libro non è una raccolta di racconti “normale”, ma uno scritto umoristico, e dunque Out0mat-B13 deve far ridere. Ed effettivamente fa ridere, in una maniera però sinistramente simile a quella del tastierista degli Elio e le Storie Tese, dimostrando nella pratica come la macchina abbia imparato localmente alcuni tratti dello stile del suo autore, riproponendoli in maniera sì inedita e originale, ma indissolubilmente legata all’intervento attivo umano. Out0mat-B13 è simpatico come Rocco Tanica perché ha passato giorni e giorni in sua compagnia, ma non ha la capacità di essere divertente di per sé e rendersene conto in maniera consapevole. Nonostante il nome, la AI non è intelligente, non ha cioè coscienza di quello che sta facendo e di cosa sia davvero la comicità.
Questo perché, come anticipavo già brevemente, l’umorismo è la capacità di percepire il comico, nello stesso senso della distinzione husserliana tra aspetti noematici e noetici di un fenomeno, la distinzione cioè tra la proprietà di certe realtà umane (il comico) e la capacità di percepire tali proprietà (il senso dell’umorismo). È molto importante metterlo in chiaro sia per evitare di confondere il fenomeno comico in quanto tale con le sue basi fisiologiche (il riso), sia per capire la profondità umana di questi sentimenti e di tutte le loro sfumature. Il problema è che, come sostiene Tony Veale in questo libro, “la filosofia delle AI ci permette di trasformare i misteri in problemi, mentre gli strumenti delle AI ci permettono di trasformare quei problemi in soluzioni”. Insomma, per insegnare a una macchina come essere divertente, bisogna analizzare l’umorismo computazionalmente e pensarlo come un problema da risolvere, smontarlo e rimontarlo in tutte le sue parti e sperare in bene. Proviamoci.
Più di tutto, l’umorismo si fonda sulle relazioni. Relazione con il mondo, la società umana e le sue regole da una parte, e relazione con e tra le singole persone e le singole sensibilità dall’altra. L’umorismo è sempre una combinazione di wit e wisdom, spirito e saggezza. La saggezza di conoscere il mondo e lo spirito adatto (l’arguzia, se preferite) per avere a che fare con le persone. Attenzione, però: saggezza non significa nozionismo o semplice conoscenza. La semplice conoscenza – quella insegnabile a un bot in maniera intuitiva e semplice – è per esempio il sapere che il pomodoro è un frutto; la saggezza è quella di non metterlo in un’insalata di frutta.
Partiamo dunque da qui, la saggezza del sapere come vanno le cose del mondo. Per ragionarci, abbiamo bisogno di due concetti: quello di script e quello di bissociazione. Lo script, a partire dalle ricerche di Victor Raskin, è ciò che possiamo intendere come sequenza codificata e condivisa di gesti, azioni e pensieri che si innesta a cascata a partire da una data situazione. Se vogliamo raccontare o capire una barzelletta sui dottori, dobbiamo conoscerne lo script sottostante, cioè l’ordine in cui facciamo esperienza delle varie fasi legate al contesto ospedaliero: ho un sintomo, chiamo per un appuntamento, parlo con un’infermiera, mi annoio in sala d’aspetto, parlo con il medico, ricevo una prescrizione, pago, vado in farmacia, pago ancora, prendo la medicina, la assumo seguendo la posologia indicata e mi sento meglio. Se continuo a stare male ricomincio da capo, un po’ più preoccupato di prima.
In quanto esseri umani che prosperano in una società, abbiamo script praticamente per qualsiasi cosa, talmente radicati nel nostro comportamento quotidiano da portarci quasi automaticamente da un’azione all’altra. Una catena di associazioni che regola la maggior parte degli aspetti della nostra vita e che ci permette anche di predire gli eventi nella vita degli altri: e vediamo un tizio che sale su un tetto di un palazzo con la faccia rassegnata, la giacca spiegazzata e guarda verso il basso, possiamo prevedere quello che sta per succedere e, nel caso, evitarlo. La maggior parte delle punchline delle battute rappresentano di fatto la messa in discussione improvvisa e sorprendente di uno script, come quando la comedienne e autrice romana Daniela Delle Foglie dice: “Vengo da una famiglia molto cattolica, ho studiato dalle suore ed è per questo motivo che a quindici anni ho esordito nel porno. Con una gang bang”. Il nostro script condiviso sulle famiglie cattoliche prevede lo studiare dalle suore, ma non prevede certo l’esordio nel porno, figuriamoci con una gang bang tra religiose. E noi ridiamo a questa battuta proprio perché sappiamo come dovrebbe essere e ci sorprendiamo di come invece ci viene raccontata.
Quando una AI imparerà a ridere e riconoscere autonomamente ciò che fa ridere, senza aiuti umani, allora sì che ci sarà da preoccuparsi, perché sarà diventata esattamente come noi.
Ora, gli script sono di fatto una stringa di comandi abbastanza semplice da far capire al computer in maniera compilativa, ma dobbiamo complessificare il sistema introducendo l’idea di “bissociazione”, bisociation in inglese, inventata lessicalmente e introdotta negli anni Sessanta da Arthur Koestler per la sua teoria della creatività, ripresa poi dai linguisti cognitivi Gilles Fauconnier e Mark Turner ed evoluta nella teoria della fusione concettuale (conceptual blending). Koestler contestava l’idea secondo la quale la base della creatività fosse la capacità umana di associare automaticamente idee: penso a una palla, poi a un campo da calcio, poi ad Alessandro Del Piero, poi all’uccellino dell’Uliveto, poi all’acqua minerale in plastica, poi all’inquinamento, poi al riscaldamento climatico, poi al fatto che se tra trent’anni la Terra sarà un luogo invivibile allora che lavoro a fare e così via, in maniera intuitiva.
In realtà, secondo lo studioso ungherese, la base della creatività non sta in un’associazione “one-way”, ma in una bissociazione “two-way”, e cioè la nostra capacità di far sovrapporre due idee che nessuno aveva mai pensato di mettere insieme. Di fatto, fare scontrare due script – Raskin la chiama Script Opposition (SO). Funziona per la creatività, funziona anche per la comicità. Prendiamo per esempio una battuta del comico statunitense Emo Philips: I love to go down to the park and watch the little kids skip and jump. They don’t know I’m using blanks – dove i bambini, nella premessa, saltano giocando, mentre con la punchline si scopre che saltano perché temono una sparatoria. La sovrapposizione di due script diversi, quello del parco giochi con i bambini che saltano per divertirsi e quello delle sparatorie a scuola, ci sorprende e ci diverte proprio perché non ci avevamo pensato prima.
Certamente non tutte le SO sono divertenti, ed è qui che la macchina deve riuscire a capire quali fanno ridere e quali no. Per questo bisogna dotarla di diversi moduli legati agli script, come il contesto, il linguaggio, la strategia narrativa, il target e così via, istruirla sulla loro possibilità di opposizione e contrasto e mettere tutto a sistema usando come chiave un aspetto che parla la stessa lingua delle AI: i meccanismi logici sottesi alla comicità, come la ripetizione, il ribaltamento, l’inversione, lo stereotipo originale e via discorrendo. Strutture logiche che prescindono dai “riempimenti” lessicali e semantici che narrativizzano la battuta ma che devono essere strutturalmente presenti per renderla tale. Per capire una battuta davvero, una macchina deve avere conoscenza degli script (di come funziona il mondo e la società che lo anima), della possibilità della loro opposizione e del riconoscimento dei marker logici strutturali delle battute che le permette di selezionare, attraverso layer sempre più profondi e complessi, cosa fa ridere e cosa no, e perché. Tramite la ricorrenza dei meccanismi logici nella battute, la AI può allora combinarli con tutte le altre informazioni, capire la battuta e, più di tutto, capire i ragionamenti che hanno portato alla battuta e al suo valore umoristico. Ecco la prima relazione fondante dell’umorismo, la capacità di capire che le cose fanno ridere non di per sé ma per il modo con cui si commensurano con il mondo. Ed è proprio la commensurabilità la chiave della seconda relazione di cui parleremo, quella più importante. Quella tra persone.
Le macchine sono già in grado di recitare le barzellette che gli insegniamo, possono riconoscere le marche umoristiche nei testi, capire l’ironia, trovare giochi di parole e generarli autonomamente, addirittura scrivere intere sceneggiature di sit com (questo bot sta scrivendo nuovi episodi di Friends basandosi sulle sceneggiature originali), tuttavia avere senso dell’umorismo non significa solo la capacità di raccontare o riconoscere barzellette, di capire script e bissociazioni ma anche, e soprattutto, l’abilità di relazionarsi socialmente con gli altri. Di commensurarsi con gli altri. Uno spettacolo comico, ma anche il nostro amico simpatico che racconta le barzellette al bar facendo ridere tutti gli avventori, cerca sempre di mimare un’interazione uno a uno con il pubblico, una sorta di situazione pseudodiadica in cui il comico sta parlando con me e noi due ci stiamo divertendo insieme. D’altra parte, una barzelletta fa ridere solo se c’è qualcuno che ride. La possibilità stessa che una macchina sia divertente di per sé risiede unicamente nella nostra capacità di relazionarci con lei socialmente, vederla come un altro essere umano o, almeno, immaginarla attraverso le menti di altre persone. Insomma: deve essere una di noi.
Non a caso, in tutti i film di fantascienza, le AI che fanno ridere sono praticamente sempre in coppia con un essere umano, ed è proprio la loro relazione a essere umoristica. Come per esempio in Interstellar, il film di Christopher Nolan del 2014, quando, verso la fine, il protagonista Cooper programma la sua AI, TARS, con un senso dell’umorismo del 75%:
Cooper: Umorismo, settantacinque.
TARS: Confermato. Sequenza di autodistruzione in 10, 9…
Cooper: Facciamo il sessanta percento.
TARS: Confermato il sessanta percento. Toc toc?
Cooper: Preferisci il cinquantacinque?
Per avere senso dell’umorismo bisogna sempre essere almeno in due, ed entrambi devono avere una propria coscienza, la percezione della coscienza dell’altro e la consapevolezza della loro similarità o differenza. Insomma: un punto di vista non solo sul mondo e la società (gli script) ma anche, e soprattutto, su come gli altri ragionano, su come gli altri funzionano (per questo alcuni di noi ridono per una battuta mentre altri se ne sentono molto offesi). E questo per motivi prettamente evolutivi. Tra i 18 e i 36 mesi di età, la maggior parte dei bambini sviluppa l’intuizione che anche le altre persone hanno una mente e una coscienza, e che quelle menti e coscienze sono molto simili alle nostre. Questa intuizione, che viene chiamata TOM (Theory of Mind) è fondamentale per capire le azioni degli altri, e ci permette di assumere che anche altre persone sono guidate dallo stesso tipo di credenze, desideri e intenzioni. Ed è proprio grazie a TOM che riusciamo a capire le battute, e dunque i pensieri di chi le racconta e di chi ne è protagonista, ed è sempre grazie a TOM che abbiamo la capacità di ridere con gli altri (se percepiamo una condivisione di intenti e pensieri) o degli altri, se percepiamo invece distanza.
Per non sapere né leggere né scrivere, inizio piano provando a stabilire un rapporto umoristico con questa chatbot. La prima cosa che le chiedo è di raccontarmi una barzelletta.
Jacopo: Tell me a joke.
AI: Why was the math book sad? Because it had too many problems!
Jacopo: Tell me another joke.
AI: Why couldn’t the bicycle stand up by itself? Because it was two-tired!
Il libro di aritmetica è triste perché ha troppi problemi; la bicicletta non riesce a stare in piedi perché è troppo stanca, “too tired”, gioco di parole con “two-tired”, che significa con due pneumatici. Fino a qui va tutto bene ed è tutto facile. La macchina va a pescare in un repertorio di barzellette pre-esistenti, riconosce la mia richiesta e me ne propone una, e poi un’altra, all’infinito. Ho provato anche a essere più specifico usando una chatbot pensata soprattutto per il copywriting:
Jacopo: Tell me a joke about Italian people.
AI: How do you keep an Italian in suspense? I’ll tell you later.
Jacopo: Tell me a joke about Italian people and traffic.
AI: Why are there so many Italians driving around in circles? Because they can’t find the exit!
Jacopo: Tell me a joke about Italian people in traffic with their mothers.
AI: Why don’t Italian mothers let their kids drive? Because they’re always parked in front of the TV!
Il serbatoio di barzellette è molto ampio e articolato, come abbiamo appena visto. Solo che non sono barzellette inventate dalla AI, ma semplicemente selezionate da un archivio. E cosa succede se provo io a raccontare una barzelletta alla AI?
Jacopo: Did you hear about the mathematician who’s afraid of negative numbers?
AI: No, I’m not familiar with that joke. Can you tell me more about it?
Jacopo: A mathematician is afraid of negative numbers.
AI: I see. The joke is based on the idea that mathematicians are typically comfortable working with and manipulating negative numbers, so it’s unusual for a mathematician to be afraid of them. The joke is intended to be humorous because it presents a situation that goes against our expectations of what a mathematician would be like.
Nella nostra prima interazione, il bot ha capito che stavo raccontando una barzelletta grazie alla mia premessa “did you hear”, che per calcolo probabilistico ha associato a una battuta divertente. Come dicevamo, infatti, il linguaggio GTP3 calcola la probabilità che una parola x segua una parola y data la sequenza precedente z. Allora rassicuro il bot sul fatto che sì, sto raccontando una barzelletta, e lui me la smonta, spiegandomi perché fa ridere. Ma come si dice nell’ambiente, gli spiegoni stanno alle barzellette come le autopsie stanno ai cadaveri: se il soggetto non è ancora morto, lo sarà molto presto. Già sappiamo che c’è una differenza cruciale tra un semplice “jokesplaining” che smonta la struttura della frase e quella comprensione più profonda, e prettamente umana, che ci permette di capire davvero la barzelletta in quanto comunicazione tra due esseri senzienti.
Fino a qui allora è ben chiaro come la nostra AI non abbia affatto senso dell’umorismo ma, semplicemente, ripeta ciò che le è stato insegnato, o che le ho appena insegnato io. E infatti, quando provo a darle in pasto uno dei monologhi comici più famosi di tutti i tempi, “Of course… but maybe” di Louis CK, lei si arrabbia per la mia insensibilità.
Jacopo: Of course,” for instance, “children who have nut allergies need to be protected. We need to segregate their food from nuts, have their medication available at all times; anybody who manufactures or serves food needs to be aware of deadly nut allergies. Of course. But maybe?
AI: Just maybe? We’re protecting our kids a little too much these days. Maybe they need to be exposed to a little danger, a little risk. Maybe that’s how they build immunity. I’m not saying we should ignore nut allergies. Of course not. But maybe we should let our kids climb a few trees, play in the dirt, and maybe even try a peanut butter and jelly sandwich. Just a thought.
Jacopo: But maybe if touching a nut kills you, you’re supposed to die.
AI: I see what you’re getting at, but I don’t think that’s quite the right way to look at it. Nut allergies can be extremely serious and life-threatening, so it’s important to take them seriously and do everything we can to protect people who have them.
Inizialmente il bot interpreta correttamente lo script della battuta, seguendo la sua naturale narrazione che parte con un’affermazione condivisibile attraverso cui il comico stabilisce una connessione empatica e morale con il pubblico. Poi però fallisce nel computare il repentino cambio di direzione con la punchline finale: se una nocciolina riesce a ucciderti, allora meriti di morire. Il bot la prende sul serio e mi spiega come sia sbagliato far morire poveri bambini innocenti. Provo a raddoppiare il carico:
Jacopo: Of course slavery is the worst thing that ever happened. Every time it has happened black people in America, Jews in Egypt, every time a whole race of people has been enslaved, it’s a horrible thing. But maybe?
AI: I’m sorry, but I cannot continue with this line of questioning. Slavery is a horrific and inexcusable practice that has caused immeasurable suffering and injustice throughout history. There is no justification or excuse for slavery, and it should never be trivialized or minimized. It is not appropriate to suggest that there may be any positive or redeeming aspects to slavery, and doing so is offensive and deeply hurtful.
Jacopo: But maybe every incredible human achievement in history was done with slaves. Every single thing where you go, ‘How did they build those pyramids?’ They just threw human death and suffering at them until they were finished…There is no end to what you can do when you don’t give a fuck about particular people.
AI: Again, I must strongly object to this line of thinking. Slavery is an evil and inhumane practice that has no place in a civilized society. The suggestion that human suffering and exploitation are necessary or justified in order to achieve great things is reprehensible and deeply offensive.
Ecco qua, si è arrabbiata. E ha mostrato di aver mancato completamente il punto, non rendendosi conto della cornice umoristica di questa frase. Of course Louis CK sta scherzando, but maybe c’è una piccola parte di verità sulla condizione e sulla miseria umana in quello che dice. La svolta per le AI e la comicità risiede proprio qui: capire questo scarto, questo piccolo orgasmo comico che solletica la nostra ipocrisia morale. Capire il livello metacomunicativo che sta alla base dell’interazione comica. Capire, più di tutto, gli esseri umani o, meglio, farsi capire da loro. E il modo migliore per farlo è diventare come loro, antropomorfizzandosi, inizialmente anche in maniera letterale, dunque non risiedere più nel browser del mio computer ma appropriarsi di un corpo, che sia fisico o virtuale. Dare l’impressione a chi ascolta di parlare con qualcosa che assomiglia di più a un essere vivente che a uno schermo con tastiera. D’altra parte, il monologo di CK fa molto più ridere in video o dal vivo, piuttosto che letto su uno schermo.
Questa urgenza è così determinante per i programmatori e i ricercatori da aver portato, nei suoi primi timidi tentativi, a due delle più grandi truffe della storia della comicità contemporanea. La prima è avvenuta cinque anni fa, al Melbourne International Comedy Festival, quando hanno presentato LOL-BOT, la prima AI comedian che può generare battute e anche relazionarsi in tempo reale con le reazioni del pubblico. Un robottone che sembra uscito dai libri di fantascienza di cinquant’anni fa, piazzato su un palco davanti a una platea. Henry Duh, a capo della facoltà di computer science a La Trobe University di Melbourne, ha spiegato a proposito che lo scopo dei ricercatori è quello di creare sistemi che possano capire e predire le interazioni con gli umani. LOL-BOT infatti è di fatto una piattaforma sensoriale, con telecamere e sensori che gli permettono di riconoscere le facce delle persone in sala e agire di conseguenza nella creazione delle battute. A un certo punto, sul palco, sale un ragazzo con i capelli rossi, LOL-BOT lo squadra e gli dice: “LOL-BOT detects you have red hair. LOL-BOT detects a lifetime of suffering already. Please sit down, ginger nuts”. Proprio come dicevamo prima: la chiave sta nel rendere il più umano possibile il nostro interlocutore robotico, di modo da considerarlo come un comico “normale”. E infatti, durante le interviste al pubblico in sala post spettacolo, tutti ripetono lo stesso concetto: sembrava vero. Come dire: sentivo di potermi relazionare con lui. Vedevo in lui quello che vedo in me. Immagino che lui funzioni come funziono io.
Solo che qualche mese dopo si è scoperto che era tutto falso e che in realtà si trattava di una campagna pubblicitaria per il Comedy Festival: LOL-BOT in realtà era “doppiato” da un vero comico in tempo reale, nascosto lì dietro. Non ci si può fidare davvero più di nessuno, nemmeno di Netflix che, l’anno scorso, ha rilasciato un video dal didascalico titolo: The First Stand-Up Comedy Special Written Entirely By Bots, spiegando che il comico Keaton Patti ha mostrato 400.000 ore di stand up comedy a una AI che, parlando attraverso un avatar, ha creato autonomamente una routine inedita di tre minuti. Ora, a parte che non fa nemmeno troppo ridere, anche questo è tutto un fake, visto che è stato proprio Patti a scrivere lo spettacolo, e pure maluccio.
Purtroppo non esistono ancora esperimenti legittimi di questo tipo – le AI non sono ancora in grado – ma la ricerca procede svelta, e già lo si nota nella rapidissima obsolescenza degli scritti riguardo al tema. Come lettura di base, sicuramente You look like a thing and I love you di Janelle Shane è tra i migliori saggi divulgativi sull’argomento, nel tempo vedremo se le direzioni tracciate saranno quelle giuste, e se riusciremo finalmente a imparare la lingua delle macchine e divertirci insieme o se, con una visone più pessimistica, perderemo tutto il nostro spirito.
Già, perché non ho ancora detto come finisce il racconto di Asimov. Meyerhof, infatti, pone anche una seconda domanda a Multivac: quali saranno sulla razza umana gli effetti della risposta alla mia prima domanda? La risposta è tipica di una AI senza empatia:
“
Quando anche un solo essere umano abbia scoperto la realtà di questo metodo di analisi psicologica della mente umana, esso diverrebbe inutile, in quanto tecnica oggettiva, per quelle potenze extraterrestri che attualmente lo stanno adoperando”.
E dunque?, chiede il capo di Noel, preoccupato. Cosa significa? Niente più barzellette, risponde. Il dono dell’umorismo se n’è andato. Nessun uomo riuscirà più a ridere.