L’obiettivo del progetto VISION è sviluppare un framework di videosorveglianza per le smart cities, da integrare nella piattaforma FLAME, allo scopo di fornire un tool di videosorveglianza sociale e condivisa per aiutare le persone diversamente abili (non vedenti, con mobilità limitata, non udenti, anziani) che potrebbero aver bisogno di essere guidate/sorvegliate per garantirne la sicurezza nella città. VISION si compone di tre elementi architetturali, in particolare la piattaforma DiMoVis, Tourist Eyes e Lying Person Recognition.

FLAME

Progetto VISION

VIdeo Surveillance
for Impaired persONs

Progetto vincitore

L'immagine mostra la bandiera dell'Unione Europea

Horizon 2020

Il progetto ha ricevuto finanziamenti dal programma di ricerca e innovazione Horizon 2020 dell’Unione europea nell’ambito della convenzione di sovvenzione N.731677

L'immagine mostra il logo di FLAME

Piattaforma FLAME

Progetto vincitore della terza edizione della FLAME Open Call

ARCHITETTURA

DiMoVis

Piattaforma smart e flessibile di videosorveglianza social, quando utilizzata su FLAME diviene estremamente scalabile in termini di numero di devices in trasmissione e ricezione. Ciascun utente della piattaforma può facilmente condividere il proprio dispositivo di trasmissione video (es. webcam, IP cam, smartphone, tablet) connettendolo al network (con connessione Wi-Fi o mediante rete mobile) e registrandolo alla piattaforma DiMoVis tramite app Android o portale web. Durante la registrazione, l’utente può gestire gli accessi al proprio dispositivo di trasmissione, specificando uno o più profili per restringere l’accesso a diversi gruppi di utenti. Ogni utente, dal lato opposto, tramite la stessa app Android o lo stesso portale web, ha la mappa dell’area coperta dal servizio della piattaforma DiMoVis (es. una smart city), con tutte le camere attive rappresentate da cerchi verdi, come mostrato in Figura 2.

IPS element

L’Impaired Person Support element (elemento di supporto per persone con disabilità) incluso in DiMoViS mira a fornire supporto alle persone con disabilità che possono essere guidate a distanza da un parente o un amico (tramite guida remota via chiamata), ad esempio quando il disabile ha perso i suoi punti di riferimento spaziali o se lui / lei vuole raggiungere un posto sconosciuto. Più specificamente, una persona con disabilità che cammina in un’area coperta dal servizio VISION può richiedere una guida visiva remota. A tal fine, inizia una telefonata con la guida remota, informandolo della sua posizione approssimativa. Quindi la guida remota attiva l’app VISION e, navigando sulla mappa, seleziona tutte le telecamere disponibili nella zona in cui potrebbe essere la persona con disabilità. Quindi, guardando i flussi video ricevuti da queste telecamere, inizia a guidare la persona parlando al telefono con lui. La guida remota può seguire la persona durante il suo percorso attraverso diversi flussi video trasmessi da varie telecamere, continuando a fornire istruzioni fino a raggiungere il luogo desiderato.

L'immagine mostra l'architettura del progetto VISION

Figura 1. Architettura di ViSiOn e sua interazione con la piattaforma FLAME sottostante
Figura 2. Interfaccia utente grafica dell’app VISION
Figura 3. Impaired Person Support service (modulo di supporto per persone con disabilità)

DUE ESTENSIONI DI DIMOVIS, INCLUSE NELLA PIATTAFORMA VISION, SONO TOURIST EYES E LYING PERSON RECOGNITION.

Tourist Eyes

L’obiettivo di Tourist Eyes è fornire ai turisti non vedenti che visitano una città intelligente un framework per supportare le loro attività, sia in ambienti esterni che interni. Pertanto, l’obiettivo di questo servizio è l’utilizzo di framework conformi al 5G e telecamere IP installate su percorsi turistici predefiniti per guidare i turisti non vedenti a muoversi in città intelligenti. I turisti non vedenti, tramite i comandi vocali gestiti da un’app per smartphone, richiedono indicazioni per raggiungere alcuni punti di interesse (PoI, Points of Interest) appartenenti a percorsi predefiniti, come ristoranti, servizi igienici, musei, sportelli bancomat. Quindi, i turisti non vedenti sono localizzati dal sistema grazie a un cappello indossabile con un colore specifico e ricevono messaggi sonori da Tourist Eyes attraverso il loro dispositivo smart per seguire il percorso selezionato.

Figura 4. Modulo Tourist Eyes

Questo servizio è complementare al blocco Tourist Eyes, poiché può essere invocato quando il turista con disabilità si trova su un percorso registrato nella piattaforma Tourist Eyes e deve raggiungere un luogo non incluso nell’elenco PoI o quando deve raggiungere un percorso di Tourist Eyes da un luogo esterno. Tutte le telecamere IP installate per il servizio Tourist Eyes possono essere associate alla piattaforma DiMoVis e quindi possono essere utilizzate da tutti i servizi da essa forniti.

Il Lying Person Recognition element (modulo di riconoscimento di persona sdraiata), grazie alle telecamere installate, può riconoscere automaticamente se una persona giace a terra in ambienti interni o esterni e inviare un avviso a qualcuno (ad esempio un amico o un parente di quella persona, ai servizi di emergenza locali o ad un operatore sanitario). Ad esempio, questo servizio può essere attivato da un parente di una persona anziana che desidera monitorarla. In questo caso, i flussi video generati da tutte le telecamere IP installate vicino ai luoghi in cui la persona con disabilità si sposta vengono inviati a uno strumento di intelligenza artificiale in esecuzione all’interno del network come una funzione virtuale (VF), in grado di riconoscere le persone che giacciono su il terreno attraverso un algoritmo di riconoscimento delle immagini. Se accade che una persona monitorata tramite il Lying Person Recognition element si trovi per terra in un’area controllata da una telecamera, verrà inviato un avviso al parente che ha richiesto di monitorarla.

La piattaforma VISION si completa con i dispositivi esterni, rappresentati dalle telecamere IP fornite dall’utente e dai dispositivi mobili, entrambi collegati tramite WiFi alla piattaforma FLAME. Le fonti video sono costituite da qualsiasi tipo di dispositivo di trasmissione video, come telecamere IP, action cam, telecamere installate su droni di bordo, ecc. Nell’esperimento, per essere conformi al resto della piattaforma, sono state utilizzate telecamere IP WiFi che trasmettono flussi basati su HTTP o, in alternativa, qualsiasi tipo di telecamere i cui flussi sono transcodificati in questo formato con un software in esecuzione su una scheda Raspberry Pi collegata alla telecamera IP. I dispositivi mobili, invece, sono smartphone o tablet Android su cui verrà installata l’app VISION.

Categorie: Progetto