Il fornitore di servizi internet cinese Baidu ha recentemente aggiornato le sue politiche di accesso ai dati, impedendo a Google e Bing di estrarre contenuti dalla sua piattaforma Baike, simile a Wikipedia. Questa mossa segna un cambiamento significativo nel panorama della gestione dei dati online e si inserisce in un contesto di crescente competizione nel settore della Intelligenza artificiale (AI).
Indice
Le restrizioni implementate da Baidu
Il cambiamento è stato evidenziato nel file robots.txt di Baidu Baike, che ora nega l’accesso ai crawler di Googlebot e Bingbot. Questa decisione è diventata effettiva l’8 agosto e impedisce di fatto a Google e Bing di indicizzare il vasto database di quasi 30 milioni di voci disponibili su Baike, nonostante alcuni subdomini fossero già limitati in precedenza. Prima di questa modifica, entrambi i motori di ricerca avevano libero accesso al contenuto.
Le limitazioni imposte da Baidu nascono dalla crescente necessità di proteggere i dati utilizzati per addestrare i modelli di intelligenza artificiale. Questa azione si pone in continuità con le recenti strategie di altre aziende di tech. Infatti, a luglio, Reddit aveva già bloccato gran parte degli accessi per i motori di ricerca ad eccezione di Google, un passo reso possibile grazie a un accordo finanziario tra le due piattaforme.
Questo cambio di rotta da parte di Baidu riflette la crescente consapevolezza riguardo al valore dei dati nell’era dell’AI. La qualità e la quantità di dataset disponibili sono fondamentali per l’addestramento efficace dei modelli di intelligenza artificiale, rendendo la protezione delle informazioni un elemento cruciale per le aziende. Solo negli ultimi mesi, OpenAI ha siglato accordi simili con Time e il Financial Times per accedere ai rispettivi archivi, dimostrando l’importanza di contenuti di alta qualità per lo sviluppo di tecnologie AI.
PubblicitÃ
In questa nuova realtà , i fornitori di AI e i progettisti di chatbot stanno rafforzando le loro politiche riguardo all’accesso ai dati online. La scelta di Baidu di limitare l’accesso ai suoi contenuti non è solo una questione di controllo, ma piuttosto un tentativo di proteggere risorse preziose in un mercato sempre più competitivo. Con l’intensificarsi della guerra dei dati per alimentare l’intelligenza artificiale, è probabile che altre aziende seguano l’esempio di Baidu, rivedendo le proprie strategie di accesso ai contenuti online.
Il futuro della condivisione dei dati
Man mano che l’industria dell’AI continua a evolversi, si prevede che più aziende riconsiderino le loro politiche di condivisione dei dati, il che potrebbe avere un impatto significativo sulla modalità con cui le informazioni sono indicizzate e accessibili su internet. Allo stesso tempo, collaborazioni strategiche tra provider di contenuti e sviluppatori di AI potrebbero diventare sempre più comuni, poiché entrambe le parti cercano di massimizzare i benefici reciproci in un panorama che diventa rapidamente complesso.
In questo contesto, Baidu non solo protegge il suo contenuto, ma stabilisce un precedente per altre piattaforme che potrebbero seguire il suo passo in un futuro non troppo lontano.