LA DELICATA DANZA TRA INTELLIGENZA ARTIFICIALE E PRIVACY: L’INDAGINE DEL GARANTE SUL WEBSCRAPING.

Il garante privacy avvia un’istruttoria sui siti web in materia di protezione dal c.d. webscraping: l’estrazione automatica di dati da pagine web. Tutti i siti saranno sottoposti al vaglio dell’autorità.

Nel mondo in costante evoluzione dell’intelligenza artificiale (IA), il Garante per la protezione dei dati personali si adopera per preservare la delicatezza delle informazioni personali in un ambiente digitale sempre più complesso. Un recente sviluppo ha portato l’Autorità a lanciare un’indagine approfondita sulla pratica del webscraping, concentrandosi sulla raccolta massiva di dati personali online per l’addestramento degli algoritmi di IA da parte di terze parti.

Ma cos’è il webscraping? Il webscraping è una tecnica di estrazione automatica di dati da pagine web. In altre parole, si tratta dell’utilizzo di script o software per analizzare il codice HTML di una pagina e estrarre informazioni specifiche, come testo, immagini o link. Questo processo può essere utilizzato per raccogliere dati da siti web in modo efficiente e automatizzato. Tuttavia, è fondamentale rispettare le politiche di utilizzo dei dati e le normative sulla privacy durante il webscraping, poiché tale attività può sollevare questioni etiche e legali riguardanti la raccolta non autorizzata di informazioni.

L’indagine conoscitiva avviata dal Garante mira a valutare l’efficacia delle misure di sicurezza adottate dai siti internet pubblici e privati per impedire il webscraping di dati personali. Il focus è sulle entità operanti in Italia o che offrono servizi sul territorio italiano, ponendo particolare attenzione su coloro che forniscono dati liberamente accessibili, inclusi quelli catturati dagli “spider” dei produttori di algoritmi di IA.

Il contesto attuale vede numerose piattaforme di IA impegnate nella raccolta massiva di dati attraverso il webscraping. Queste piattaforme, per svariate finalità, acquisiscono enormi quantità di dati personali disponibili su siti internet gestiti da soggetti pubblici e privati. Le informazioni, originariamente pubblicate per scopi specifici come la cronaca o la trasparenza amministrativa, diventano oggetto di interesse per l’addestramento degli algoritmi.

Il Garante invita associazioni di categoria, consumatori, esperti e rappresentanti accademici a condividere i loro commenti e contributi sulle misure di sicurezza adottate e potenzialmente adottabili per contrastare la raccolta massiva di dati personali attraverso il webscraping. I pareri possono essere inviati all’indirizzo webscraping@gpdp.it entro 60 giorni dalla pubblicazione dell’avviso di consultazione sul sito dell’Autorità.

L’indagine del Garante mette in luce l’importanza di implementare misure di sicurezza adeguate a proteggere i dati personali. Tra le possibili contromisure si contemplano l’uso di tecniche avanzate di crittografia, il potenziamento dei firewall e la promozione di standard di sicurezza più rigorosi per i siti che gestiscono dati sensibili.

In conclusione, l’indagine del Garante rappresenta un passo significativo verso l’equilibrio tra l’innovazione nell’ambito dell’IA e la salvaguardia della privacy individuale. La cooperazione tra autorità, industria e accademici è essenziale per definire norme e protocolli che assicurino una coesistenza armoniosa tra la crescente potenza dell’IA e il rispetto per la privacy. L’Autorità, a seguito dell’indagine, è pronta ad adottare le misure necessarie, incluso l’intervento d’urgenza, per garantire la tutela dei dati personali in un mondo sempre più interconnesso.

DISCLAIMER: Questo articolo fornisce solo informazioni generali e non costituisce consulenza legale di alcun tipo da parte di Macchi di Cellere Gangemi che non si assume alcuna responsabilità per il contenuto e la correttezza della newsletter. L’autore o il vostro contatto in studio sono a Vostra disposizione per qualsiasi ulteriore chiarimento.