A Scuola da Google

01 May 2022

Articolo pubblicato sulla rivista GliAsini.

Come molti certamente ricorderanno, sin dall'avvio della Didattica a Distanza, il 4 marzo 2020, il Ministero dell'Istruzione propose alle scuole la scelta fra due piattaforme EdTech: una di Google e l'altra di Microsoft.

La pagina dedicata alla DaD il 04 Marzo 2020 alle ore 20:30:07

Una recente inchiesta di Stefano Zoja per “Altreconomia” ha rivelato le conseguenze di questa sponsorizzazione ministeriale: ben l'86% delle scuole italiane ha utilizzato per le varie forme didattica a distanza e didattica integrata che si sono susseguite negli ultimi due anni la prima piattaforma proposta, Google Suite for Education. Anche a livello globale, la pandemia ha raddoppiato la penetrazione di Google nella scuola, che è passata in pochi mesi da 70 a oltre 150 milioni di utenti.
Da un punto di vista cibernetico è importante distinguere la DaD, che ha caratterizzato in questi anni lockdown e quarantene, dall'integrazione sistematica di strumenti informatici nell'attività didattica e nella cultura condivisa di un Paese.
Prima che la pandemia facesse esplodere “il digitale”, diversi strumenti informatici erano già presenti nella scuola italiana di ogni ordine e grado: dal registro elettronico alle chat di classe, fino alla più semplice condivisione di materiali su supporti off-line e online.
Con la DaD (e la analoga Ddi), tutta questa varietà di strumenti e canali di comunicazione è stata sostituita per mesi con una singola piattaforma centralizzata che, per gli studenti e i docenti costretti a casa, ha di fatto rimpiazzato l'aula scolastica. Studenti e insegnanti sono stati costretti a trasferirsi in questo nuovo “spazio virtuale”, fatto di video conferenze, documenti, presentazioni, “stream di classe” e filmati YouTube, imparando via via ad aggirarne i limiti e ignorarne i disservizi per minimizzare l'impatto sullo svolgimento delle lezioni.

Questa brusca migrazione della didattica non ha però prodotto né una evoluzione metodologica né uno studio approfondito dei sistemi cibernetici che la veicolano. Studenti e insegnanti si sono trasferiti nella nuova scuola virtuale con la stessa consapevolezza con cui installano un'App di moda, senza comprenderne a fondo il funzionamento, i Termini del Servizio o le conseguenze di lungo periodo.
Ma cosa ha ottenuto Google in cambio di tanta generosa ospitalità? Un'analisi meramente economica della questione non è sufficiente per rispondere.
Gli insegnanti che hanno faticosamente imparato a utilizzare gli strumenti messi a disposizione gratuitamente da Google continueranno a utilizzarli nella didattica e resisteranno alla proposta di alternative. Analogamente, gli studenti che li hanno usati per anni a scuola continueranno a utilizzarli per le proprie esigenze private e lavorative. Infine, per minimizzare i costi di formazione interna, anche le aziende italiane saranno convinte ad adottare gli stessi prodotti.
Ma per Google non si è trattato semplicemente di conquistare un mercato notoriamente difficile come la scuola, di ridurre la concorrenza a un ruolo marginale o di imporre un lock-in fortissimo che avrà gravi ripercussioni sulla bilancia commerciale del nostro Paese nei prossimi decenni. Il business model di Google è definito da Shoshana Zuboff della Harvard Business School come “Capitalismo di sorveglianza”. Si tratta di un modello d'impresa basato sull'accumulo di grandi quantità di dati riguardanti ciascun utente, sulla creazione di accurati profili psicologici e sulla vendita dei cosiddetti “behavioral futures”, ovvero accurate previsioni statistiche delle reazioni di singoli individui a determinati stimoli e informazioni.

Già da prima e al di là del suo ingresso nell'EdTech, Google raccoglie questi dati attraverso una miriade di servizi e prodotti: dalle caselle Gmail, dalle ricerche online (di cui gestisce l'88% in Italia), dai tracciatori di Google Analytics (oltre l'80% dei siti web italiani e delle App Android), dai video visualizzati da ciascun utente su YouTube. Attraverso le App preinstallate nei cellulari Android (il 72%), Google tiene traccia di ogni chiamata effettuata e ogni sms inviato. E ovviamente attraverso il browser Google Chrome, usato da oltre il 66% degli italiani, che invia presso la casa madre qualsiasi cosa venga digitata sulla barra dell'indirizzo, ancor prima che venga premuto il tasto Invio, le coordinate Gps e molto altro. E attraverso i diversi servizi cloud, cui aziende e pubbliche amministrazioni affidano i nostri dati.
Vendendo in rapidissime aste automatizzate (Real Time Bidding) le previsioni comportamentali dedotte da tutti dati così raccolti, Google fattura diverse centinaia di milioni di dollari ogni giorno. Attraverso AI programmate statisticamente con quegli stessi dati, determina in tempo reale quali risultati di ricerca proporre a ciascun utente, quali notizie presentargli, quali video suggerirgli per massimizzarne l'engagement così come per orientarne consumi e opinioni.
Fondamentale per il funzionamento del capitalismo di sorveglianza è la cancellazione del canale di comunicazione dalla coscienza degli utenti connessi. Quando video-chiamiamo un amico, viviamo l'esperienza di un incontro alla finestra, siamo consapevoli della sua presenza ma il canale di comunicazione ci appare come un mezzo neutrale e trasparente. Questa percezione soggettiva dell'incontro è però fallace: da un punto di vista oggettivo la teleconferenza sostituisce l'incontro, perché ciascuno dei “partecipanti” guarda e parla a un oggetto che solo incidentalmente riproduce i suoni e le immagini inviate dagli altri. Potrebbe alterarli. E infatti li altera in molte occasioni, ad esempio quando gli chiediamo di sfumare lo sfondo dietro di noi.

L'automatismo infatti non veicola, ma media la comunicazione. Fino all'invenzione della scrittura, la condivisione delle informazioni avveniva esclusivamente in modo sincrono: due o più persone dovevano incontrarsi in un luogo e condividere l'esperienza che dava origine all'informazione o metterla in comune attraverso un linguaggio sufficientemente espressivo. Un'informazione è infatti una esperienza soggettiva di pensiero comunicabile che esiste solo nella mente umana di cui entra a far parte. Con l'invenzione della scrittura, l'uomo ha imparato a comunicare in modo asincrono, attraverso rappresentazioni simboliche trasferibili e interpretabili da altri esseri umani. Nacque così il dato, dal participio passato di dare, ovvero una rappresentazione di un'informazione che può essere appunto data, trasmessa ad altri, condivisa con esseri umani lontani nel tempo o nello spazio. Il dato è una delle possibili rappresentazioni di un'informazione, impressa su un supporto fisico e interpretabile dall'uomo.
In un sistema cibernetico i dati svolgono moltissime funzioni, a seconda degli automatismi che li scambiano, degli organismi che li producono e del contesto interpretativo in cui vengono usati. Analizzando la DaD da questa prospettiva dobbiamo anzitutto distinguere i contenuti dai dati personali.
I contenuti rappresentano e trasmettono la cultura di una comunità. Poiché sono sempre espressione consapevole di almeno un individuo, costituiscono la tipologia di dato più antica e meglio integrata nella cultura umana e sono regolamentati da categorie giuridiche consolidate come la libertà di espressione, il lavoro e il diritto d'autore. Ogni test, ogni presentazione, ogni schema e ogni rapporto caricato su Google Classroom da ogni insegnante, così come ogni compito caricato da ogni studente, costituisce un contenuto ceduto a Google. I contenuti espressi dai membri di una comunità determinano, da sempre, la cultura condivisa di quella stessa comunità. Come tali, attraggono persone che fanno parte di tale comunità ma attraggono anche spesso persone verso quella comunità: si pensi ad esempio a una biblioteca universitaria. Nel contesto scolastico però gli studenti e i docenti che fanno parte di una classe sono di fatto costretti a utilizzare lo strumento prescelto: lo studente che pretendesse di utilizzare un canale più riservato e protetto subirebbe una enorme peer-pressure da compagni e insegnanti che non ne comprenderebbero le ragioni.

Ma la stragrande maggioranza dei dati raccolti da Google appartiene alla categoria dei dati personali, ovvero dati che descrivono aspetti e comportamenti di una persona. I dati personali non vengono espressi consapevolmente da un soggetto che intende comunicarli, ma sono emessi inconsapevolmente da quel soggetto e registrati da terze parti, tipicamente attraverso software preposti. Possono essere classificati in due grandi categorie: identificativi e dati descrittivi.
Gli identificativi permettono la correlazione fra i profili e le attività di una persona, nonché la mappatura delle sue relazioni con altre persone identificabili. Possiamo distinguerli lungo un asse spaziale (locali o globali) e lungo un asse temporale (temporanei o permanenti).
L'utilità cibernetica degli identificativi dipende dai dati che permettono di correlare. Gli identificativi globali permettono di correlare dati raccolti in tutto il pianeta, mentre gli identificativi locali permettono di correlare solo dati emessi in un determinato luogo o contesto. Analogamente gli identificativi permanenti permettono di correlare dati raccolti lungo tutta l'esistenza del soggetto cui sono attribuiti, mentre i dati temporanei permettono di correlare solo i dati raccolti in un periodo limitato.
Possiamo immaginare i dati personali descrittivi come una serie di predicati associati a un identificativo tramite una funzione probabilistica. Le misurazioni dirette hanno una probabilità pari a uno, la certezza, mentre le deduzioni che è possibile trarne hanno una probabilità compresa fra zero e uno. Quando ci rechiamo in un luogo con un cellulare Android connesso alla rete dati, diverse organizzazioni che producono le App autorizzate all'accesso alla posizione possono riceverne orario e coordinate Gps. Tale dato viene poi correlato con tutti gli altri dati ricevuti da quello stesso utente. In questo modo è possibile dedurre probabilisticamente altri dati sull'utente stesso, come abitudini, frequentazioni, fede religiosa, condizioni mediche e moltissime altre informazioni “derivate” esclusivamente dai luoghi visitati e da chi altri vi si trova in quell'orario.

Grazie alla DaD, Google ha potuto raccogliere moltissimi dati su studenti e insegnanti e, dato l'uso prevalente di nome e cognome (identificativi globali e permanenti) nelle credenziali di autenticazione, potrà facilmente correlarli con tutti gli altri dati acquisiti in passato o in futuro su di essi. Un elenco esaustivo anche solo delle tipologie di dati personali ottenuti da Google durante la DaD sarebbe impossibile: dati biometrici come impronta vocale e feature facciali; dati economici, sociali e culturali deducibili dalle abitazioni riprese durante le video lezioni; dati medici condivisi e discussi “in classe”… Talvolta i dati raccolti riguardavano terzi, come contatti o familiari positivi che determinavano l'avvio di un periodo di quarantena. E naturalmente i voti, le relazioni con i compagni, i livelli di apprendimento, le competenze linguistiche, soglie di attenzione o di stress e molto molto altro.
Nell'indifferenza generale, nessuna scuola ha adottato le misure tecniche previste dal Gdpr per la protezione degli studenti: evitare l'uso della telecamera, adottare pseudonimi da cambiare ogni tre mesi, fornire Vpn scolastiche per evitare l'identificazione via Ip… Questo avrebbe ridotto notevolmente i danni di queste piattaforme EdTech, ma avrebbe comportato costi economici e organizzativi notevoli, tale da rendere nettamente più convenienti soluzioni alternative basate sul software libero.
Ad esempio il Politecnico di Torino, invece di affidare studenti e docenti ai BigTech selezionati dal Ministero, ha deciso di potenziare le proprie infrastrutture informatiche dedicando sei server a un cluster oVirt di 50 macchine virtuali su cui installare Big Blue Button. Con questo stack completamente open source, ha permesso a oltre 2mila docenti di erogare 800 corsi per oltre 30mila studenti, basandosi solo su risorse e competenze interne. Il tutto con un costo annuale di meno di 80 centesimi a studente e un risparmio previsto rispetto alle offerte cloud di oltre un milione di euro in 5 anni.
Analogamente, già durante il primo lockdown il consorzio universitario Garr ha potuto offrire gratuitamente alla cittadinanza il sistema di videoconferenza Jitsi Meet, installandolo sulla propria infrastruttura cloud federata, realizzata esclusivamente con software open source.
Queste esperienze hanno dimostrato che laddove si investa nelle competenze, gestire autonomamente le proprie infrastrutture informatiche non è solo possibile, ma più economico che affidarle ad aziende multinazionali. Purtroppo queste competenze non si improvvisano e sebbene sia il Politecnico di Torino che il Consorzio Garr abbiano documentato ampiamente i propri sistemi e si siano più volte resi disponibili per aiutare altre università e pubbliche amministrazioni a riprodurne l'infrastruttura, la loro offerta è stata ignorata.

Così tutti i dati raccolti per mesi su otto milioni di futuri elettori potranno essere usati per orientare in modo impercettibile i risultati delle loro ricerche, le loro opinioni, i loro acquisti nonché ovviamente le ricerche che li riguardano.
Per comprendere come, è importante conoscere i meccanismi di base dell'AdTech.
Fino al secolo scorso, un messaggio pubblicitario o politico doveva essere diffuso, identico, su molti canali di comunicazione di massa per poter raggiungere il maggior numero possibile di persone sensibili al contenuto. Questo costringeva il mittente a inviare pochi messaggi coerenti fra loro. Attraverso gli accurati modelli previsionali estratti dai dati degli utenti è invece possibile inviare messaggi studiati per colpire l'attenzione e orientare il comportamento di una specifica categoria di persone e inviarli solo a quelle più sensibili al loro contenuto. Questo rende pubblicità e propaganda politica molto più efficaci perché studiati sulla base delle debolezze, dei bisogni, delle paure e dei valori di ciascuno di noi.
Ogni nuovo bit acquisito duplica l'utilità di quelli già disponibili perché duplica la probabilità di selezionare messaggi efficaci a orientare il comportamento del ricevente, dimezzandone al contempo il costo. Si tratta dunque di un potere a crescita esponenziale, enormemente maggiore di quello conferito dal denaro, che cresce in modo lineare con ogni centesimo. Dunque, al di là dello straordinario ritorno economico, Google ha ottenuto un potere di condizionamento molto più subdolo ed efficace su un intera generazione, un condizionamento culturale e politico.

Per stabilizzare questo afflusso di dati, Google ha anche sviluppato Practice Set, un plug-in per Classroom che promette, attraverso una nuova tecnologia di apprendimento adattivo, di “dare agli insegnanti il tempo e gli strumenti per meglio supportare i propri studenti” permettendogli di “sapere cosa stiano pensando” e fornendo a ciascuno studente “un tutor virtuale 24 ore su 24”.
In sostanza i contenuti e i dati personali raccolti da Google durante la DaD in Italia e all'estero sono stati utilizzati per programmare statisticamente “intelligenze artificiali” che suggeriranno automaticamente “materiali didattici personalizzati” a ciascuno studente secondo un nuovo “modello educativo” che viene venduto come “Autopedagogia”. Si chiude così il cerchio tracciato dal Ministero dell'Istruzione.
Le prossime generazioni di italiani andranno a scuola da Google, che non si limiterà a sorvegliarle e profilarle accuratamente, ma deciderà anche cosa ogni studente dovrà studiare sulla base di tali profili. E ovviamente dei propri interessi. In cambio, gli insegnanti, liberati dall'incombenza di un rapporto personale con la classe, potranno utilizzare il tempo risparmiato per istruire molti più alunni, venendo meno l'argomento cardine contro le “classi pollaio”. Una didattica senza educazione, che normalizzerà una sorveglianza di massa di cui nessuno vorrà più fare a meno.

Appare dunque tristemente ingenuo il Requiem per gli studenti di Giorgio Agamben: nessuno ricorderà gli insegnanti che si sono opposti alla DaD, se la storia, anch'essa personalizzata, la scriveranno i software dei vincitori.