Seleziona una pagina


Servirà ancora un po’ di pazienza prima di poter conversare con le ultime evoluzioni delle voci ChatGPT mostrate un mese fa in occasione del lancio del nuovo modello GPT-4o. Il riferimento è è al cosiddetto advanced voice mode – ovvero alla modalità avanzata di interazione ancora più naturale e realistica – che lo sviluppatore OpenAI aveva lasciato intendere avrebbe debuttato a breve all’interno del suo modello di AI generativo. Si tratta dello stesso pacchetto di novità che al momento dell’annuncio includeva anche un nuovo timbro vocale per le interazioni vocali, risultato quasi del tutto simile a quello di Scarlett Johansson nel celebre film Her e poi eliminato da OpenAI per evitare grane: originariamente attese per l’estate, le nuove abilità legate alle chat vocali arriveranno in autunno.

Rimandata a settembre

OpenAI ha pubblicato su X un aggiornamento (vedi post sotto) in cui afferma in modo molto trasparente come l’introduzione della modalità di interazione vocale avanzata sia slittata di qualche mese rispetto al previsto. Il calendario originale prevedeva un lancio in fase di test alpha limitato a pochi utenti già a giugno, ma nell’ultima fase antecedente al lancio sono emersi dettagli che il gruppo ha intenzione di affinare prima del rilascio definitivo. Tra questi, ci sono la capacità del modello di linguaggio di rilevare e non procedere con argomenti sensibili e soprattutto il miglioramento della scalabilità dell’infrastruttura per garantire un’esperienza in tempo reale decente anche quando collegati ai server ci sono milioni di utenti contemporaneamente.

Si partirà dunque col test alpha non prima di luglio, per poi raccogliere feedback e opinioni e migliorare il modello e uscire ufficialmente in autunno con gli utenti che hanno sottoscritto l’abbonamento a ChatGPT Plus.

X content

This content can also be viewed on the site it originates from.

Cosa comprende l’advanced voice mode

Anche dopo il lancio, non sarà presente all’appello la voce ritenuta troppo simile a quella di Scarlett Johansson in Her e quindi eliminata per evitare problemi legali. Rimarranno tutte le altre previste, che potranno comprendere il tono e le emozioni dell’interlocutore umano per adattarsi di conseguenza e garantire un’interazione sempre più naturale e coinvolgente. Tra le altre funzioni delle voci ChatGPT avanzate ci sarà anche la possibilità di sfruttare la fotocamera dello smartphone per osservare in tempo reale la visuale attorno all’utente e riconoscere elementi e oggetti.





Fonte