Seleziona una pagina
mercoledì, Feb 28

Automattic come Reddit: i contenuti di WordPress e Tumblr potranno essere usati per addestrare l’IA

da Hardware Upgrade :

Automattic, realtà proprietaria dei servizi WordPress e
Tumblr
, sembra essere pronta a chiudere un accordo con OpenAI e
Midjourney
per consentire l’uso dei contenuti generati dagli utenti
come materiale per l’addestramento dei modelli di intelligenza artificiale
delle due società.

Al momento non è chiaro a quali contenuti e informazioni i modelli IA
potranno accedere, anche se le indiscrezioni al momento in circolazione
riferiscono che tra i primi contatti preliminari tra le parti vi fosse sul
tavolo l’accesso anche a post privati sul blog pubblici, blog eliminati o
sospesi, domande senza risposta, risposte private, post contrassegnati
come espliciti o contenuti di blog di partner premium.

La società intanto ha pubblicato una dichiarazione, “Protecting
user choice
“, in cui spiega le proprie politiche in merito all’uso
dei contenuti da parte dei crawler IA, ma ammette di stare lavorando con
“aziende selezionate” nel campo dell’intelligenza artificiale:

“L’intelligenza artificiale sta rapidamente
trasformando quasi ogni aspetto del nostro mondo, compreso il modo in
cui creiamo e consumiamo contenuti. Noi di Automattic abbiamo sempre
creduto in un web libero e aperto e in una scelta individuale. Come
altre aziende tecnologiche, stiamo seguendo da vicino questi progressi,
compreso come collaborare con le aziende di intelligenza artificiale in
modo da rispettare le preferenze dei nostri utenti.

Con questo in mente, stiamo facendo una serie di cose su WordPress.com e
Tumblr per darti un maggiore controllo sui contenuti che hai
creato.

  • Al momento blocchiamo, per impostazione predefinita, i principali
    crawler di piattaforme AI, compresi quelli delle più grandi aziende
    tecnologiche, e aggiorniamo i nostri elenchi man mano che ne vengono
    lanciati di nuovi.
  • Abbiamo un’impostazione per scoraggiare i motori di ricerca
    dall’indicizzare un sito su WordPress.com e Tumblr. Ciò segnala ai
    motori di ricerca di non eseguire la scansione di quel contenuto o di
    includerlo nei risultati di ricerca.
  • Abbiamo aggiunto impostazioni simili a WordPress.com e Tumblr per
    scoraggiare la scansione da parte delle società di intelligenza
    artificiale. Se già scoraggi l’indicizzazione nei motori di ricerca,
    questa viene abilitata automaticamente.
  • Condivideremo solo i contenuti pubblici ospitati su WordPress.com e
    Tumblr da siti che non hanno rinunciato.

Attualmente non esiste alcuna legge che
imponga ai crawler di seguire queste preferenze, anche se ciò potrebbe
cambiare presto con la legislazione in sospeso nell’Unione Europea.
Indipendentemente dalla posizione geografica, vogliamo fornirti
strumenti che garantiscano il massimo controllo possibile. Poiché le
aziende rispettabili seguono queste impostazioni, rappresentano il
metodo migliore per imporre il modo in cui i contenuti vengono
sottoposti a scansione sul Web.

Stiamo anche lavorando direttamente con aziende selezionate di
intelligenza artificiale purché i loro piani siano in linea con ciò che
interessa alla nostra comunità: attribuzione, rinuncia e controllo. Le
nostre partnership rispetteranno tutte le impostazioni di rinuncia.
Intendiamo inoltre fare un ulteriore passo avanti e aggiornare
regolarmente tutti i partner sulle persone che hanno recentemente
rinunciato e chiedere che i loro contenuti vengano rimossi dalle fonti
passate e dalla formazione futura.”

Gli accordi per la formazione dei modelli IA stanno diventando
un’opportunità redditizia per varie realtà che fino ad ora hanno avuto
difficoltà a trovare una strada parallela e alternativa alla pubblicità
per monetizzare i contenuti degli utenti. Pochi giorni fa avevamo parlato
di Reddit
e del suo accordo con Google del valore di 60 milioni di dollari
all’anno
, e verosimilmente nel corso del futuro immediato
continueremo sempre di più ad assistere a collaborazioni di questo genere.
Questo nuovo paradigma nasconde, però, qualche incognita: fino a che punto
gli utenti saranno inclini allo sfruttamento dei loro contenuti senza che
venga corrisposta loro alcuna ricompensa?

Source link