Il 15 agosto 2023, a seguito di un breve periodo di consultazione pubblica, sono entrate in vigore le c.d. “Measures for the Management of Generative Artificial Intelligence Services” (in cinese: 生成式人工智能服务管理暂行办法, le “Misure”), emanate dalla Cyberspace Administration of China (“CAC”) (ovvero l’Autorità cinese competente in materia di supervisione e regolamentazione di Internet, protezione dei dati personali e antitrust), con l’obiettivo principale di dettare regole operative volte a disciplinare lo sviluppo e l’utilizzo sempre più rapido dei sistemi di intelligenza generale generativa[1]. Le Misure sono state predisposte tenendo in considerazione quanto previsto dai “3 pilastri” della disciplina cinese in materia di sicurezza e protezione dei dati: la Cybersecurity Law, la Data Security Law e la Personal Information Protection Law. Il contenuto delle Misure Le Misure si applicano agli sviluppatori e fornitori di sistemi di intelligenza artificiale generativa di testi, immagini, audio, video e altri contenuti destinati ai soggetti che vivono nella Repubblica Popolare Cinese (ad es. Ernie, il chatbot cinese di Baidu analogo a ChatGPT, che genera anche immagini – come Dall-E e Midjourney – e video). Di contro, le società, nonché gli enti pubblici e gli istituti di ricerca che sviluppano e utilizzano, ma che non forniscono a soggetti che vivono nella RPC, servizi e tecnologie di intelligenza artificiale generativa, non sono soggette alle Misure. La normativa prevede che i soggetti che rientrano nell’ambito di applicazione delle Misure devono: Le Misure stabiliscono altresì che i fornitori di sistemi di intelligenza artificiale generativa debbano svolgere attività di elaborazione dei dati di addestramento, quali il pre-addestramento e l’ottimizzazione dell’addestramento, osservando le seguenti prescrizioni: Inoltre, durante il data labeling[3], i fornitori di sistemi di intelligenza artificiale generativa devono formulare regole di etichettatura chiare, specifiche e operative che soddisfino i requisiti previsti dalle Misure, nonché svolgere una valutazione della qualità dell’etichettatura dei dati e condurre una verifica a campione dell’accuratezza dei contenuti etichettati. Per quanto riguarda i dati personali, i fornitori di sistemi di intelligenza artificiale generativa, laddove questi sistemi trattino dati personali, sono considerati responsabili del trattamento. In caso di richieste di cancellazione, modifica e copia dei dati personali da parte degli interessati, i fornitori dei sistemi di intelligenza artificiale generativa devono elaborare la richiesta in modo tempestivo, mettendo altresì a disposizione un meccanismo di reclamo e segnalazione. Conclusioni Le recenti iniziative cinesi non solo rappresentano un momento cruciale nel processo legislativo del paese, ma anticipano di fatto numerosi paesi concorrenti, facendo sì che la normativa cinese vada a costituire non solo un benchmark per un futuro quadro normativo più sistematico e approfondito, ma rappresenti anche un momento di cambiamento notevole nel contesto legislativo globale in materia di intelligenza artificiale. Il legislatore cinese ha mostrato dunque chiaramente la sua determinazione a essere un leader nella regolamentazione di questa tecnologia, aprendo anche il campo a possibili impatti significativi sul futuro sviluppo economico e tecnologico mondiale. Considerata, quindi, la velocità con cui la Cina si sta muovendo, ci si auspica che anche gli altri paesi (e in primis l’Unione europea) si dotino al più presto di adeguate regole che possano garantire dinamiche competitive nel mercato globale. [1] Ovvero di tutti quei modelli o tecnologie analoghe in grado di produrre autonomamente contenuti, testi, video o immagini. [2] Per utenti di sistemi di intelligenza artificiale generativa, ai sensi dell’art. 22 delle Misure, si intendono tutte le persone fisiche e giuridiche che utilizzano sistemi di intelligenza artificiale generativa per generare contenuti. [3] I dati sono disponibili in molte forme diverse come testo, immagini, audio e video. Per arricchire i dati in modo che la macchina possa riconoscerli tramite algoritmi di apprendimento automatico, i dati devono essere etichettati. L’etichettatura dei dati è, pertanto, il processo di identificazione dei dati grezzi in modo da attribuire un significato a diversi tipi di dati al fine di addestrare un modello di apprendimento automatico. Quando i dati vengono etichettati, vengono utilizzati per addestrare algoritmi avanzati per riconoscere i modelli in futuro. L’etichettatura è fondamentalmente contrassegnare i dati o aggiungere metadati per renderli più significativi e informativi in modo che le macchine possano capirli e imparare da essi. Ad esempio, un’etichetta può indicare che nell’immagine è raffigurata una persona o un animale, o un file audio è in quale lingua o per determinare il tipo di azione eseguita in un video.