La nostra attenzione reale diventa misurabile

I telefoni cellulari non dovrebbero più disturbarci al momento sbagliato. Per raggiungere questo obiettivo, occorre innanzitutto comprendere meglio la nostra attenzione durante l'uso dello smartphone. Gli informatici dell'ETH hanno sviluppato un sistema che registra il contatto visivo con lo schermo per la prima volta nella vita quotidiana. Anche sociologi e medici potrebbero trarne vantaggio.

Vista ingrandita: cosa muove l'occhio quando si guarda uno smartphone? (Immagine: Adobe Stock)
Cosa muove l'occhio quando si guarda uno smartphone? (Immagine: Adobe Stock)

Quante volte al giorno accendete il vostro smartphone? Per quanto tempo rimane acceso lo schermo e per quanto tempo viene utilizzata una determinata applicazione? Tutti i moderni smartphone raccolgono automaticamente questi dati e li mettono a disposizione dell'utente sotto etichette come "benessere digitale". Ma non tutto il tempo trascorso sullo schermo è uguale e non tutto l'utilizzo delle app è uguale.

A volte ci concentriamo su qualcosa per un lungo periodo di tempo, altre volte diamo solo un'occhiata fugace allo schermo o siamo distratti più volte da eventi nell'ambiente. E a volte il nostro sguardo non si sofferma nemmeno sullo smartphone perché lo abbiamo attivato solo inconsciamente.

Capire l'attenzione dell'utente

L'attenzione che prestiamo al nostro smartphone può variare notevolmente", spiega Mihai Bâce, "ma non è mai stata studiata in situazioni quotidiane reali"."Il dottorando dell'Istituto per i sistemi interattivi intelligenti dell'ETH di Zurigo ha ora sviluppato, insieme a uno studente di master e a un professore dell'Università di Stoccarda, un sistema che può essere utilizzato per misurare l'attenzione visiva allo smartphone nel normale uso quotidiano e per un periodo di settimane.

Tutto ciò che serve è la fotocamera frontale del telefono e i dati dei sensori. In precedenza, era necessario utilizzare ingombranti dispositivi di misurazione con eye tracker o compilare questionari che potevano solo approssimare la vita normale nel migliore dei casi.

Comprendere l'attenzione dell'utente è una delle sfide più importanti sulla strada delle future interfacce utente mobili, come sottolinea Bâce. L'obiettivo è che queste interfacce diventino attente e tengano automaticamente conto delle nostre esigenze e della situazione in cui ci troviamo.

In questo modo non sarà più necessario, ad esempio, impostare manualmente la funzione "non disturbare" per non essere distratti da un'attività concentrata da un messaggio poco importante.

Solo 7 secondi alla volta e distrazione 4 volte

Vista ingrandita: l'esempio di Sander Staal, coautore dello studio, mostra come funziona il riconoscimento del contatto visivo. Il rettangolo verde indica il contatto visivo, quello rosso l'assenza di contatto.
L'esempio di Sander Staal, coautore dello studio, mostra come funziona il riconoscimento del contatto visivo. Un rettangolo verde indica un contatto visivo, mentre il rosso indica l'assenza di contatto visivo. (Gruppo Sistemi Distribuiti)

E tali tecnologie sembrano diventare sempre più necessarie con il passare del tempo. La ricerca di Bâce mostra che l'attenzione visiva che ammettiamo nei confronti dei nostri smartphone è estremamente frammentata. In media, il contatto visivo con lo schermo dura appena 7 secondi prima che il nostro sguardo si allontani.

Questo avviene quattro volte per circa 2 secondi dopo ogni sblocco. Il grado di distraibilità degli utenti dipende dalla loro personalità individuale, ma anche dall'ambiente in cui si trovano e dal tipo di app in uso. Le applicazioni mediche o educative, ad esempio, sono molto più coinvolgenti di quelle di intrattenimento.

Base per un'ampia gamma di ricerche

Tuttavia, Bâce vede il grande valore del suo lavoro non solo nei risultati di ricerca specifici ottenuti con il sistema: "Soprattutto, il nostro sistema dovrebbe fornire una base per altri scienziati. Per questo motivo pubblicheremo tutti i nostri algoritmi e tutti i dati video".

In futuro potrebbero beneficiarne non solo gli sviluppatori di app, ma anche sociologi o psicologi, ad esempio, che potrebbero utilizzare il sistema per condurre studi sull'influenza di vari fattori sull'attenzione senza grandi sforzi tecnici. Anche la medicina potrebbe essere un potenziale utilizzatore della tecnologia. I cambiamenti nel comportamento attentivo potrebbero essere utilizzati per monitorare i pazienti, ad esempio, e indicare sviluppi problematici.

Durante lo sviluppo del sistema è stata utilizzata un'applicazione che, oltre a registrare i video della fotocamera frontale ogni volta che il cellulare viene sbloccato e a raccogliere parallelamente vari sensori e metadati, conteneva anche funzionalità di protezione e verifica dei dati.

Un componente di revisione ha permesso ai partecipanti allo studio di decidere da soli quali video rilasciare per la valutazione, mentre un gioco di annotazioni ha permesso alle sequenze video di essere valutate da altri partecipanti. Questo terzo componente è stato utilizzato nella fase di sviluppo per verificare i risultati del riconoscimento automatico del contatto visivo.

L'infrastruttura come sfida principale

In un primo esperimento con 32 partecipanti e per un periodo di oltre due settimane, i ricercatori hanno registrato un totale di 472 ore di sequenze video e le hanno poi analizzate utilizzando un innovativo sistema di riconoscimento adattivo del contatto visivo. I singoli video potevano avere dimensioni di diverse centinaia di megabyte. Ciò significava che nel frattempo era necessario molto spazio di archiviazione sugli smartphone e i tempi di caricamento erano di conseguenza lunghi. E proprio questa è stata una delle sfide più grandi.

Mihai Bace
Non effettuiamo deliberatamente il riconoscimento facciale. L'unica cosa che viene determinata è il contatto visivo con lo schermo.Mihai Bâce, dottorando presso l'Istituto per i Sistemi Interattivi Intelligenti

Poiché gli utenti sono pronti a disattivare un'app che li ostacola nella vita di tutti i giorni, o almeno a ridurne l'uso, è stato necessario trovare meccanismi che non comportassero un carico eccessivo sulla memoria del cellulare e non bloccassero le capacità di trasmissione degli smartphone.

La protezione dei dati deve essere garantita in ogni momento: solo i dati espressamente autorizzati dagli utenti attraverso la componente di revisione possono essere caricati sul server di analisi. "L'app è stata esaminata dalla commissione d'etica dell'ETH di Zurigo e deliberatamente non viene effettuato il riconoscimento facciale. L'unica cosa che viene determinata è il contatto visivo con lo schermo", aggiunge Bâce.

Se in futuro il nostro smartphone capirà meglio noi e le nostre esigenze, ciò non dovrà necessariamente basarsi sull'analisi di dati personali sensibili. Grazie al sistema degli informatici, in futuro questo obiettivo potrà essere raggiunto anche riconoscendo automaticamente il livello di attenzione dell'uomo.

Riferimenti

Bâce M, Staal S, Bulling A. (2020). Quantificazione dell'attenzione visiva degli utenti durante le interazioni quotidiane con i dispositivi mobili. In: Proceedings of the Conference on Human Factors in Computing Systems (CHI '20). ACM, New York, NY, USA, 2020, 1-14. doi: pagina esterna10.1145/3313831.3376449

Bâce M, Staal S, Bulling A. (2019). Rilevamento accurato e robusto del contatto visivo durante le interazioni quotidiane con i dispositivi mobili pagina esternaarxiv.org/abs/1907.11115

Video di presentazione del documento: pagina esternawww.youtube.com/watch?v=SzLn3LujIqw

Video dataset dello studio: pagina esternawww.emva-dataset.org

JavaScript è stato disabilitato sul tuo browser