Articolo pubblicato sulla rivista GliAsini.
Come molti certamente ricorderanno, sin dall'avvio della Didattica a Distanza, il 4 marzo 2020, il Ministero dell'Istruzione propose alle scuole la scelta fra due piattaforme EdTech: una di Google e l'altra di Microsoft.
La pagina dedicata alla DaD il 04 Marzo 2020 alle ore 20:30:07
Una recente inchiesta
di Stefano Zoja per “Altreconomia” ha
rivelato le conseguenze di questa sponsorizzazione ministeriale:
ben l'86% delle scuole italiane ha utilizzato per le varie forme
didattica a distanza e didattica integrata che si sono susseguite
negli ultimi due anni la prima piattaforma proposta, Google Suite
for Education. Anche a livello globale, la pandemia ha
raddoppiato la penetrazione di Google nella scuola, che è passata
in pochi mesi da 70 a oltre 150 milioni di utenti.
Da un punto
di vista cibernetico è importante distinguere la DaD, che ha
caratterizzato in questi anni lockdown e quarantene,
dall'integrazione sistematica di strumenti informatici
nell'attività didattica e nella cultura condivisa di un
Paese.
Prima che la pandemia facesse esplodere “il digitale”,
diversi strumenti informatici erano già presenti nella scuola
italiana di ogni ordine e grado: dal registro elettronico alle
chat di classe, fino alla più semplice condivisione di materiali
su supporti off-line e online.
Con la DaD (e la analoga Ddi),
tutta questa varietà di strumenti e canali di comunicazione è
stata sostituita per mesi con una singola piattaforma
centralizzata che, per gli studenti e i docenti costretti a casa,
ha di fatto rimpiazzato l'aula scolastica. Studenti e insegnanti
sono stati costretti a trasferirsi in questo nuovo “spazio
virtuale”, fatto di video conferenze, documenti, presentazioni,
“stream di classe” e filmati YouTube, imparando via via ad
aggirarne i limiti e ignorarne i disservizi per minimizzare
l'impatto sullo svolgimento delle lezioni.
Questa brusca migrazione della didattica non ha però prodotto
né una evoluzione metodologica né uno studio approfondito dei
sistemi cibernetici che la veicolano. Studenti e insegnanti si
sono trasferiti nella nuova scuola virtuale con la stessa
consapevolezza con cui installano un'App di moda, senza
comprenderne a fondo il funzionamento, i Termini del Servizio o
le conseguenze di lungo periodo.
Ma cosa ha ottenuto Google in
cambio di tanta generosa ospitalità? Un'analisi meramente
economica della questione non è sufficiente per
rispondere.
Gli insegnanti che hanno faticosamente imparato a
utilizzare gli strumenti messi a disposizione gratuitamente da
Google continueranno a utilizzarli nella didattica e resisteranno
alla proposta di alternative. Analogamente, gli studenti che li
hanno usati per anni a scuola continueranno a utilizzarli per le
proprie esigenze private e lavorative. Infine, per minimizzare i
costi di formazione interna, anche le aziende italiane saranno
convinte ad adottare gli stessi prodotti.
Ma per Google non si
è trattato semplicemente di conquistare un mercato notoriamente
difficile come la scuola, di ridurre la concorrenza a un ruolo
marginale o di imporre un lock-in fortissimo che avrà gravi
ripercussioni sulla bilancia commerciale del nostro Paese nei
prossimi decenni. Il business model di Google è definito da
Shoshana Zuboff della Harvard Business School come “Capitalismo
di sorveglianza”. Si tratta di un modello d'impresa basato
sull'accumulo di grandi quantità di dati riguardanti ciascun
utente, sulla creazione di accurati profili psicologici e sulla
vendita dei cosiddetti “behavioral futures”, ovvero accurate
previsioni statistiche delle reazioni di singoli individui a
determinati stimoli e informazioni.
Già da prima e al di là del suo ingresso nell'EdTech, Google
raccoglie questi dati attraverso una miriade di servizi e
prodotti: dalle caselle Gmail, dalle ricerche online (di cui
gestisce l'88% in Italia), dai tracciatori di Google Analytics
(oltre l'80% dei siti web italiani e delle App Android), dai
video visualizzati da ciascun utente su YouTube. Attraverso le
App preinstallate nei cellulari Android (il 72%), Google tiene
traccia di ogni chiamata effettuata e ogni sms inviato. E
ovviamente attraverso il browser Google Chrome, usato da oltre il
66% degli italiani, che invia presso la casa madre qualsiasi cosa
venga digitata sulla barra dell'indirizzo, ancor prima che venga
premuto il tasto Invio, le coordinate Gps e molto altro. E
attraverso i diversi servizi cloud, cui aziende e pubbliche
amministrazioni affidano i nostri dati.
Vendendo in
rapidissime aste automatizzate (Real Time Bidding) le previsioni
comportamentali dedotte da tutti dati così raccolti, Google
fattura diverse centinaia di milioni di dollari ogni giorno.
Attraverso AI programmate statisticamente con quegli stessi dati,
determina in tempo reale quali risultati di ricerca proporre a
ciascun utente, quali notizie presentargli, quali video
suggerirgli per massimizzarne l'engagement così come per
orientarne consumi e opinioni.
Fondamentale per il
funzionamento del capitalismo di sorveglianza è la cancellazione
del canale di comunicazione dalla coscienza degli utenti
connessi. Quando video-chiamiamo un amico, viviamo l'esperienza
di un incontro alla finestra, siamo consapevoli della sua
presenza ma il canale di comunicazione ci appare come un mezzo
neutrale e trasparente. Questa percezione soggettiva
dell'incontro è però fallace: da un punto di vista oggettivo la
teleconferenza sostituisce l'incontro, perché ciascuno dei
“partecipanti” guarda e parla a un oggetto che solo
incidentalmente riproduce i suoni e le immagini inviate dagli
altri. Potrebbe alterarli. E infatti li altera in molte
occasioni, ad esempio quando gli chiediamo di sfumare lo sfondo
dietro di noi.
L'automatismo infatti non veicola, ma media la comunicazione.
Fino all'invenzione della scrittura, la condivisione delle
informazioni avveniva esclusivamente in modo sincrono: due o più
persone dovevano incontrarsi in un luogo e condividere
l'esperienza che dava origine all'informazione o metterla in
comune attraverso un linguaggio sufficientemente espressivo.
Un'informazione è infatti una esperienza soggettiva di pensiero
comunicabile che esiste solo nella mente umana di cui entra a far
parte. Con l'invenzione della scrittura, l'uomo ha imparato a
comunicare in modo asincrono, attraverso rappresentazioni
simboliche trasferibili e interpretabili da altri esseri umani.
Nacque così il dato, dal participio passato di dare, ovvero una
rappresentazione di un'informazione che può essere appunto data,
trasmessa ad altri, condivisa con esseri umani lontani nel tempo
o nello spazio. Il dato è una delle possibili rappresentazioni di
un'informazione, impressa su un supporto fisico e interpretabile
dall'uomo.
In un sistema cibernetico i dati svolgono
moltissime funzioni, a seconda degli automatismi che li
scambiano, degli organismi che li producono e del contesto
interpretativo in cui vengono usati. Analizzando la DaD da questa
prospettiva dobbiamo anzitutto distinguere i contenuti dai dati
personali.
I contenuti rappresentano e trasmettono la cultura
di una comunità. Poiché sono sempre espressione consapevole di
almeno un individuo, costituiscono la tipologia di dato più
antica e meglio integrata nella cultura umana e sono
regolamentati da categorie giuridiche consolidate come la libertà
di espressione, il lavoro e il diritto d'autore. Ogni test, ogni
presentazione, ogni schema e ogni rapporto caricato su Google
Classroom da ogni insegnante, così come ogni compito caricato da
ogni studente, costituisce un contenuto ceduto a Google. I
contenuti espressi dai membri di una comunità determinano, da
sempre, la cultura condivisa di quella stessa comunità. Come
tali, attraggono persone che fanno parte di tale comunità ma
attraggono anche spesso persone verso quella comunità: si pensi
ad esempio a una biblioteca universitaria. Nel contesto
scolastico però gli studenti e i docenti che fanno parte di una
classe sono di fatto costretti a utilizzare lo strumento
prescelto: lo studente che pretendesse di utilizzare un canale
più riservato e protetto subirebbe una enorme peer-pressure da
compagni e insegnanti che non ne comprenderebbero le ragioni.
Ma la stragrande maggioranza dei dati raccolti da Google
appartiene alla categoria dei dati personali, ovvero dati che
descrivono aspetti e comportamenti di una persona. I dati
personali non vengono espressi consapevolmente da un soggetto che
intende comunicarli, ma sono emessi inconsapevolmente da quel
soggetto e registrati da terze parti, tipicamente attraverso
software preposti. Possono essere classificati in due grandi
categorie: identificativi e dati descrittivi.
Gli
identificativi permettono la correlazione fra i profili e le
attività di una persona, nonché la mappatura delle sue relazioni
con altre persone identificabili. Possiamo distinguerli lungo un
asse spaziale (locali o globali) e lungo un asse temporale
(temporanei o permanenti).
L'utilità cibernetica degli
identificativi dipende dai dati che permettono di correlare. Gli
identificativi globali permettono di correlare dati raccolti in
tutto il pianeta, mentre gli identificativi locali permettono di
correlare solo dati emessi in un determinato luogo o contesto.
Analogamente gli identificativi permanenti permettono di
correlare dati raccolti lungo tutta l'esistenza del soggetto cui
sono attribuiti, mentre i dati temporanei permettono di correlare
solo i dati raccolti in un periodo limitato.
Possiamo
immaginare i dati personali descrittivi come una serie di
predicati associati a un identificativo tramite una funzione
probabilistica. Le misurazioni dirette hanno una probabilità pari
a uno, la certezza, mentre le deduzioni che è possibile trarne
hanno una probabilità compresa fra zero e uno. Quando ci rechiamo
in un luogo con un cellulare Android connesso alla rete dati,
diverse organizzazioni che producono le App autorizzate
all'accesso alla posizione possono riceverne orario e coordinate
Gps. Tale dato viene poi correlato con tutti gli altri dati
ricevuti da quello stesso utente. In questo modo è possibile
dedurre probabilisticamente altri dati sull'utente stesso, come
abitudini, frequentazioni, fede religiosa, condizioni mediche e
moltissime altre informazioni “derivate” esclusivamente dai
luoghi visitati e da chi altri vi si trova in quell'orario.
Grazie alla DaD, Google ha potuto raccogliere moltissimi dati
su studenti e insegnanti e, dato l'uso prevalente di nome e
cognome (identificativi globali e permanenti) nelle credenziali
di autenticazione, potrà facilmente correlarli con tutti gli
altri dati acquisiti in passato o in futuro su di essi. Un elenco
esaustivo anche solo delle tipologie di dati personali ottenuti
da Google durante la DaD sarebbe impossibile: dati biometrici
come impronta vocale e feature facciali; dati economici, sociali
e culturali deducibili dalle abitazioni riprese durante le video
lezioni; dati medici condivisi e discussi “in classe”… Talvolta i
dati raccolti riguardavano terzi, come contatti o familiari
positivi che determinavano l'avvio di un periodo di quarantena. E
naturalmente i voti, le relazioni con i compagni, i livelli di
apprendimento, le competenze linguistiche, soglie di attenzione o
di stress e molto molto altro.
Nell'indifferenza generale,
nessuna scuola ha adottato le misure tecniche previste dal Gdpr
per la protezione degli studenti: evitare l'uso della telecamera,
adottare pseudonimi da cambiare ogni tre mesi, fornire Vpn
scolastiche per evitare l'identificazione via Ip… Questo avrebbe
ridotto notevolmente i danni di queste piattaforme EdTech, ma
avrebbe comportato costi economici e organizzativi notevoli, tale
da rendere nettamente più convenienti soluzioni alternative
basate sul software libero.
Ad esempio il Politecnico di
Torino, invece di affidare studenti e docenti ai BigTech
selezionati dal Ministero, ha deciso di potenziare le proprie
infrastrutture informatiche dedicando sei server a un cluster
oVirt di 50 macchine virtuali su cui installare Big Blue Button.
Con questo stack completamente open source, ha permesso a oltre
2mila docenti di erogare 800 corsi per oltre 30mila studenti,
basandosi solo su risorse e competenze interne. Il tutto con un
costo annuale di meno di 80 centesimi a studente e un risparmio
previsto rispetto alle offerte cloud di oltre un milione di euro
in 5 anni.
Analogamente, già durante il primo lockdown il
consorzio universitario Garr ha potuto offrire gratuitamente alla
cittadinanza il sistema di videoconferenza Jitsi Meet,
installandolo sulla propria infrastruttura cloud federata,
realizzata esclusivamente con software open source.
Queste
esperienze hanno dimostrato che laddove si investa nelle
competenze, gestire autonomamente le proprie infrastrutture
informatiche non è solo possibile, ma più economico che affidarle
ad aziende multinazionali. Purtroppo queste competenze non si
improvvisano e sebbene sia il Politecnico di Torino che il
Consorzio Garr abbiano documentato ampiamente i propri sistemi e
si siano più volte resi disponibili per aiutare altre università
e pubbliche amministrazioni a riprodurne l'infrastruttura, la
loro offerta è stata ignorata.
Così tutti i dati raccolti per mesi su otto milioni di futuri
elettori potranno essere usati per orientare in modo
impercettibile i risultati delle loro ricerche, le loro opinioni,
i loro acquisti nonché ovviamente le ricerche che li
riguardano.
Per comprendere come, è importante conoscere i
meccanismi di base dell'AdTech.
Fino al secolo scorso, un
messaggio pubblicitario o politico doveva essere diffuso,
identico, su molti canali di comunicazione di massa per poter
raggiungere il maggior numero possibile di persone sensibili al
contenuto. Questo costringeva il mittente a inviare pochi
messaggi coerenti fra loro. Attraverso gli accurati modelli
previsionali estratti dai dati degli utenti è invece possibile
inviare messaggi studiati per colpire l'attenzione e orientare il
comportamento di una specifica categoria di persone e inviarli
solo a quelle più sensibili al loro contenuto. Questo rende
pubblicità e propaganda politica molto più efficaci perché
studiati sulla base delle debolezze, dei bisogni, delle paure e
dei valori di ciascuno di noi.
Ogni nuovo bit acquisito
duplica l'utilità di quelli già disponibili perché duplica la
probabilità di selezionare messaggi efficaci a orientare il
comportamento del ricevente, dimezzandone al contempo il costo.
Si tratta dunque di un potere a crescita esponenziale,
enormemente maggiore di quello conferito dal denaro, che cresce
in modo lineare con ogni centesimo. Dunque, al di là dello
straordinario ritorno economico, Google ha ottenuto un potere di
condizionamento molto più subdolo ed efficace su un intera
generazione, un condizionamento culturale e politico.
Per stabilizzare questo afflusso di dati, Google ha anche
sviluppato Practice Set, un plug-in per Classroom che promette,
attraverso una nuova tecnologia di apprendimento adattivo, di
“dare agli insegnanti il tempo e gli strumenti per meglio
supportare i propri studenti” permettendogli di “sapere cosa
stiano pensando” e fornendo a ciascuno studente “un tutor
virtuale 24 ore su 24”.
In sostanza i contenuti e i dati
personali raccolti da Google durante la DaD in Italia e
all'estero sono stati utilizzati per programmare statisticamente
“intelligenze artificiali” che suggeriranno automaticamente
“materiali didattici personalizzati” a ciascuno studente secondo
un nuovo “modello educativo” che viene venduto come
“Autopedagogia”. Si chiude così il cerchio tracciato dal
Ministero dell'Istruzione.
Le prossime generazioni di italiani
andranno a scuola da Google, che non si limiterà a sorvegliarle e
profilarle accuratamente, ma deciderà anche cosa ogni studente
dovrà studiare sulla base di tali profili. E ovviamente dei
propri interessi. In cambio, gli insegnanti, liberati
dall'incombenza di un rapporto personale con la classe, potranno
utilizzare il tempo risparmiato per istruire molti più alunni,
venendo meno l'argomento cardine contro le “classi pollaio”. Una
didattica senza educazione, che normalizzerà una sorveglianza di
massa di cui nessuno vorrà più fare a meno.
Appare dunque tristemente ingenuo il Requiem per gli studenti di Giorgio Agamben: nessuno ricorderà gli insegnanti che si sono opposti alla DaD, se la storia, anch'essa personalizzata, la scriveranno i software dei vincitori.