I nuovi video fatti con l’intelligenza artificiale di OpenAI

Con Sora 2 si possono fare anche a partire da persone reali, ed è stato presentato un social network solo per loro

Caricamento player

Sam Altman – il CEO della società OpenAI famosa per ChatGPT – si è fatto mettere sulla Luna vestito da capobanda per annunciare in un video la disponibilità di Sora 2, una nuova versione più evoluta del sistema di intelligenza artificiale per produrre video partendo da semplici indicazioni testuali.

Altman non era davvero sulla Luna né è noto per dirigere bande musicali: l’intero video era stato realizzato proprio con Sora 2 per dimostrarne le capacità, soprattutto nel riprodurre persone reali in contesti virtuali. È la funzione su cui OpenAI punta di più per far diffondere il proprio sistema e per questo ci ha costruito intorno una sorta di social network.

Attraverso un’applicazione, per ora disponibile solo sugli iPhone nel Nordamerica, si possono condividere i video prodotti con Sora 2 e vedere quelli pubblicati da altri account. L’app ricorda Instagram e TikTok, con video che vengono mostrati sulla base delle persone che si seguono e di quelle con cui si hanno maggiori interazioni online. OpenAI dice che il sistema non è stato progettato per far restare il più possibile collegati gli utenti: «L’abbiamo progettata specificamente per massimizzare la creatività, non il consumo», ma sarà necessario un po’ di tempo per capire se sarà questo il caso.

L’app è pensata come un social network in piccolo, dove rimanere in contatto per lo più con la propria cerchia di amici e conoscenti. Anche per questo nella prima fase si potrà accedere al sistema solamente tramite un invito, e ci saranno limitazioni per i minorenni. Il sistema a inviti è stato pensato probabilmente anche per ridurre il traffico sull’applicazione, visto che la generazione dei video richiede molte risorse di calcolo ai centri dati di OpenAI, spesso in difficoltà a causa dell’alta domanda di richieste per ChatGPT.

La nuova versione di Sora 2 è stata pubblicata a circa un anno e mezzo di distanza dalla presentazione della sua prima edizione, che aveva già sorpreso tutti per la capacità di riprodurre brevi video piuttosto realistici, per quanto con errori frequenti e piuttosto evidenti. Il sistema faticava soprattutto nel fare i conti con le leggi della fisica, quindi il modo in cui si muovono gli oggetti, con risultati comici che rendevano spesso meno credibili i video. Il gruppo di sviluppo di Sora 2 ha lavorato per rivedere alcune logiche di funzionamento del modello intervenendo sia sulle fasi di pre-addestramento, dove si usano grandi quantità di dati per far comprendere al sistema funzionamenti e relazioni, sia su quelle di post-addestramento per far specializzare il modello.

Gli sviluppatori di OpenAI hanno spiegato che la revisione ha reso meno “ottimista” il sistema, cioè la tendenza che aveva a piegare le leggi della fisica per raggiungere certi obiettivi: «Per esempio, se un giocatore di basket sbagliava un lancio, la palla si teletrasportava da sola sul canestro. Con Sora 2, se il giocatore non fa canestro, la palla rimbalza e torna indietro» come ci si aspetterebbe in una normale partita di basket. La maggiore accuratezza nel gestire la fisica degli oggetti rende più realistici i video, ma per stessa ammissione di OpenAI ci siano ancora molti casi in cui il sistema fallisce nel produrre simulazioni coerenti.

Rispetto al modello precedente, Sora 2 produce video che contengono suoni ed effetti sonori, che possono essere personalizzati attraverso le indicazioni nelle richieste testuali. Ma la funzione che probabilmente avrà più successo è quella che consente di proporre al modello un video reale e di utilizzarlo come base per produrne uno nuovo di fantasia. Un video di una persona reale può quindi essere usato per produrne una versione virtuale, come quella molto realistica di Sam Altman, per quanto sulla Luna.

OpenAI ritiene che questi “cameo”, come sono chiamati i video con persone reali, stimoleranno la creatività degli utenti e soprattutto potranno essere la base per incentivare l’utilizzo del suo social network. Molto dipenderà comunque da quante persone saranno disposte a spendere qualche dollaro al mese per accedere ai servizi a pagamento. Sora 2 sarà infatti gratuito in una prima fase di lancio, ma con funzionalità limitate che potranno essere sbloccate con la versione a pagamento. Chi utilizza già ChatGPT Pro, la versione del chatbot a pagamento, potrà usare anche Sora 2 Pro.

Le novità annunciate da OpenAI sono state accolte con alcuni dubbi legati alle questioni di privacy e della produzione di video fasulli che mostrano persone reali. La società ha chiarito che i cameo potranno essere realizzati solo sotto espresso consenso delle persone coinvolte, e che sono previsti sistemi per richiedere la rimozione dei contenuti da parte delle persone interessate. Al momento non è previsto che si possano produrre cameo di personaggi pubblici, ma la società non esclude che le regole possano cambiare in futuro.

Altri dubbi sono stati espressi sulla tutela del diritto d’autore. Secondo il Wall Street Journal, OpenAI consente di produrre video ispirati a film e serie tv solitamente protetti dal copyright. Chi detiene i diritti, come gli studi di produzione, dovranno chiedere esplicitamente a OpenAI di far escludere i loro contenuti. L’impiego di materiale protetto da copyright nei sistemi di intelligenza artificiale è discusso da tempo e ha portato a iniziative legali di vario tipo, mostrando quanto il settore sia ancora poco regolamentato.