E se in Grand Theft Auto 5 poteste pattugliare le strade di Los Santos e parlare liberamente con gli abitanti? E se questi potessero davvero rispondervi con dialoghi personalizzati e autentici?
Questo è l’obiettivo di Sentient Streets, una nuova mod di GTA 5 basata sulla storia, realizzata dal veterano creatore di mod Bloc, disponibile ora su NexusMods.
In questo gioco i giocatori assumono il ruolo di un poliziotto alle prime armi che indaga su una cospirazione a Los Santos riguardante l’ascesa dell’IA. Nella vita reale, invece, è l’IA che alimenta le conversazioni del mod con gli NPC di tutto il mondo.
“Ho sempre avuto l’idea di creare un mondo virtuale come quello di GTA, ma in una versione in cui fosse possibile interagire e parlare con gli NPC come se fossero persone reali”, ha dichiarato Bloc a GamingPark. In passato ha lavorato a mod per Bannerlord e Skyrim che utilizzavano i Large Language Models (LLM) alimentati dall’intelligenza artificiale, prima di vedere le lamentele sul futuro di questa tecnologia.
“LLM in giochi [have been called] un ‘espediente’ poiché tutto ciò che si poteva fare era parlare con i personaggi e basta”, ha continuato Bloc. “Non ero d’accordo con questa idea, ma il solo fatto di non essere d’accordo non era sufficiente. Così ho voluto dimostrarlo”
Bloc gioca sulla paura dell’IA nella storia del mod, mentre il giocatore affronta un culto mortale che adora un’IA invisibile. Nel corso del gioco, il giocatore avrà conversazioni aperte in tempo reale con circa 30 PNG IA.
“Spero, con questa mod, di essere riuscito a dimostrare che l’utilizzo dell’IA nei videogiochi non significa necessariamente completa casualità e imprevedibilità del gameplay e che i giochi che vogliono raccontare una storia possono anche utilizzare gli LLM per arricchire la loro narrazione con esperienze di gioco di ruolo uniche per i giocatori.”
Le conversazioni dei PNG presenti in Sentient Streets sono alimentate dal Character Engine di Inworld, e Bloc è in grado di utilizzarne diverse caratteristiche in accesso anticipato. Inworld è uno strumento che alimenta l’intelligenza artificiale dei PNG e promette personaggi “capaci di espressioni umane multimodali” secondo il suo sito web. In linea di massima, lo strumento consente agli sviluppatori di creare i personaggi compilando i parametri; il parlato funziona liberamente da lì e integra la tecnologia della società di software di sintesi vocale e text-to-speech ElevenLabs.
“Siamo entusiasti di incorporare la tecnologia vocale in tempo reale di ElevenLabs, che rafforza il nostro già completo sistema off-the-shelf per la creazione di PNG AI generativi”, ha dichiarato Kylan Gibbs, chief product officer di Inworld, in un comunicato stampa per Sentient Streets. “Rispondendo alla richiesta della comunità di migliorare le capacità vocali, facciamo un passo avanti verso la creazione di personaggi più credibili e realistici. Stiamo fornendo agli sviluppatori gli strumenti per andare oltre gli alberi di dialogo e le interazioni scriptate”
Ha dichiarato Mati Staniszewsi, CEO di ElevenLabs: “Combinando il nostro software vocale AI leader del settore con la piattaforma di Inworld, stiamo spingendo i confini delle esperienze di gioco immersive e aggiungendo un ulteriore livello di possibilità ai mondi di gioco”.
“Il nostro strumento multiuso offre un audio parlato di alta qualità ai personaggi AI, incorporando intonazioni e inflessioni simili a quelle umane e adattandosi al contempo alle indicazioni contestuali. Siamo molto entusiasti di questo sviluppo e non vediamo l’ora di vedere come verrà utilizzato dalla comunità degli sviluppatori”
Bloc spiega che l’integrazione con Inworld è stata “piuttosto semplice”, in quanto il software fornisce una serie di funzionalità attese dai giocatori ma non sempre fornite dagli strumenti, come il riconoscimento vocale, le voci dei personaggi e le emozioni.
Il modder ha pubblicato un video di Sentient Streets su YouTube insieme al rilascio della mod e i risultati sono certamente sorprendenti. I giocatori si avvicinano a determinati PNG e, dopo aver ottenuto la loro attenzione, tengono premuto un pulsante per iniziare a parlare in un microfono. L’IA risponde liberamente. All’inizio, Bloc sceglie un agente partner chattando e chiedendo il suo nome e la sua storia; in seguito parla con un sospetto sulla scena di un crimine e può giocare liberamente di ruolo per ottenere informazioni.
Naturalmente non è perfetta. L’intelligenza artificiale impiega un po’ di tempo per elaborare le conversazioni, presenta errori occasionali e a volte ripete. Ma con il perfezionamento, il potenziale di questo tipo di strumento è sorprendente.
La mod di Bloc è stata lanciata con oltre 3000 download in una settimana. Allora, l’IA ha dato risposte strane o divertenti quando è stata usata in scala?
“Anche mentre stavo testando la mod, l’IA mi ha fatto morire dal ridere molte volte con le sue risposte ‘astute’ o le sue reazioni inaspettate”, ha detto Bloc. “Ho visto alcuni streaming di YouTubers che giocavano con la mod. In una conversazione divertente, uno YouTuber stava incolpando il suo partner per un crimine che aveva commesso, ma il capitano dell’IA ha colto la bugia e lo ha accusato di essere un bugiardo. In un’altra conversazione, uno YouTuber parlava con un folle membro di una setta e lo faceva impazzire ponendogli domande del tutto estranee alla sua vita.
“A volte trovo davvero sorprendente sentire l’IA dare risposte molto intelligenti alle mie ovvie domande, ed è sempre divertente vedere come ribaltano la situazione”
Naturalmente, l’uso dell’IA rimane un argomento delicato. Ubisoft ha presentato uno strumento di IA per aiutare la scrittura di sceneggiature all’inizio di quest’anno, in particolare per l’uso di PNG di sfondo, suscitando il timore che possa sottrarre lavoro ai giovani scrittori. Molti attori, nel frattempo, sono scettici sull’IA – soprattutto per l’ascesa di mod deepfake guidate dall’intelligenza artificiale in cui le voci vengono utilizzate senza autorizzazione.
Inworld utilizza una libreria vocale di ElevenLabs e non assume direttamente i doppiatori. Ma ElevenLabs è uno strumento di clonazione dell’IA, già citato da attori interessati. Il suo termini di servizio specifica che gli utenti sono i creatori e i proprietari dei file utilizzati per generare il parlato dell’intelligenza artificiale, oppure hanno il consenso scritto di ogni singola persona identificabile presente nei file. Ma è ancora difficile sapere da dove provengano i dati vocali di ElevenLabs.
“Le voci standard disponibili per impostazione predefinita sulla piattaforma sono generate da algoritmi di IA che campionano le caratteristiche della voce in modo casuale (cioè non imitano o replicano la voce di un individuo specifico) o sono sviluppate attraverso collaborazioni legalmente contrattate e limitate nel tempo con i doppiatori, con la conseguente creazione di nuove voci IA personalizzate”, ha dichiarato un portavoce di ElevenLabs in un comunicato a GamingPark. elevenLabs non offre voci AI sulla piattaforma basate sulla voce di una persona reale senza l’esplicito permesso di quest’ultima”.
“ElevenLabs consente inoltre agli utenti di creare nuove voci AI generate casualmente e di condividerle come parte della Voice Library gestita dalla comunità. Separatamente, gli utenti hanno la possibilità di creare voci clonate per il proprio lavoro, se dispongono dei diritti e delle autorizzazioni per tali voci. Queste voci non possono essere condivise nella Voice Library. Gli utenti che contravvengono ai Termini di servizio sono banditi dalla piattaforma: tutti sono incoraggiati a segnalare i contenuti che ritengono abbiano violato questi termini”
Bloc afferma di aver precedentemente confermato a Inworld di aver selezionato le voci per il suo strumento dalla libreria di voci di ElevenLabs.
Tuttavia, le preoccupazioni generali sull’uso dell’IA nello sviluppo dei videogiochi rimangono. Gli studios dovrebbero “fare attenzione a come utilizzano l’IA”, continua Bloc, in particolare per quanto riguarda l’uso di funzioni di sicurezza e la tutela della privacy.
“Inworld ha allentato le caratteristiche di sicurezza dei modelli linguistici, perché non avrebbe senso che un membro di una setta armata sia super gentile e disponibile mentre parla con te”, ha spiegato Bloc. ci si aspetterebbe che quella persona sia aggressiva, che imprechi contro di voi e che abbia un carattere in cui è difficile trovare un terreno comune”. Tuttavia, questo rilassamento [of the rules] non può funzionare sempre alla grande”
Gli sviluppatori dovranno assicurarsi di trovare un equilibrio tra la caratterizzazione autentica e la fornitura di una voce AI per la tossicità, continua.
“Avere un LLM super severo non è divertente, ma nemmeno avere un LLM terribilmente tossico in un videogioco è divertente o sicuro”, ha detto Bloc. “Questo equilibrio deve essere regolato con attenzione in base alle esigenze del gioco”
Per quanto riguarda i problemi di privacy, Bloc ha detto di aver visto persone antropomorfizzare gli LLM a causa delle loro caratteristiche di conversazione simili a quelle umane. “Questo può portare a problemi di privacy, poiché le persone possono condividere i loro dettagli e informazioni personali con le IA di chat”, ha detto. “Alcuni di questi dati personali possono essere molto problematici per le persone in alcuni Paesi. Credo che le misure per evitare qualsiasi violazione della privacy dovrebbero essere una delle massime priorità degli sviluppatori che lavorano con i modelli linguistici”
Per quanto riguarda le strade senzienti, Bloc ha ricevuto un’ondata di feedback positivi fino ad ora e afferma che i giocatori si innamorano di questo tipo di IA perché amplifica il loro divertimento nel gioco. È convinto che questo tipo di contenuti troverà spazio in futuro nell’industria dei videogiochi, ma non necessariamente da Rockstar.
“Il marchio Grand Theft Auto potrebbe essere il più grande marchio dell’industria videoludica al momento, ma è improbabile che Rockstar cerchi di adattare qualcosa di così nuovo nel suo prossimo titolo”, ha detto Bloc. “Tuttavia, probabilmente in futuro vedremo molti giochi simili a GTA con questa tecnologia, o forse anche grandi mod per GTA 6”
Con GTA 6 in probabile uscita nel prossimo anno, non ci vorrà molto per scoprirlo.