Modèle de ville composé uniquement d'images

Des scientifiques de l'ETH ont combiné des millions d'images et de vidéos pour créer un modèle vivant en trois dimensions d'une ville - concrètement : de Zurich. Cette nouvelle technologie offre de nombreuses applications et peut par exemple analyser où et quand les piétons se déplacent et les places de parking se libèrent.

Vue agrandie : modèle urbain de Zurich
Le modèle tridimensionnel de Zurich se base exclusivement sur des données d'images. (Image : ETH Zurich)

Des chercheurs de l'ETH Zurich ont développé une plateforme technologique qui leur permet de créer des modèles 3D de villes uniquement à partir d'informations d'images. La plateforme, appelée Varcity, est si polyvalente qu'elle peut utiliser toutes les sources d'images imaginables, les évaluer et les combiner automatiquement : Des photos aériennes, des images panoramiques à 360 degrés prises par des véhicules spéciaux, mais aussi des photos ordinaires, comme celles que les touristes publient sur les réseaux sociaux et les plateformes Internet. La technologie utilise également du matériel vidéo, par exemple des films Youtube et des données provenant de webcams publiques.

Grâce à des algorithmes d'apprentissage automatique, la technologie peut reconnaître des contenus d'images tels que des bâtiments, des fenêtres et des portes, des routes, des cours d'eau, des personnes et des voitures. Sans intervention humaine, le modèle 3D créé "sait" par exemple quels sont les trottoirs et - grâce à l'évaluation des données de webcam - quelles sont les rues qui ne sont empruntées que dans un seul sens.

Vue agrandie : Modèle de la ville de Zurich Végétation
Grâce à des algorithmes de machine learning, le modèle peut distinguer les bâtiments, l'espace routier, la végétation et les cours d'eau. (Image : ETH Zurich)
Vue agrandie : modèle Zurich Façades et fenêtres
En outre, le modèle reconnaît les façades et les fenêtres (rendues visibles en jaune et en rouge dans les bâtiments à l'avant gauche). (Image : ETH Zurich)

"Donner vie aux modèles de villes"

"Tout cela va si loin que nous pouvons analyser de manière très détaillée le flux de la circulation dans l'espace routier et mesurer les flux de piétons, même en temps réel selon l'application", explique Hayko Riemenschneider. Il est postdoctorant et chef de projet Varcity dans le groupe de Luc Van Gool, professeur au Computer Vision Lab de l'ETH Zurich. Les comptages de trafic deviennent ainsi très simples : ils peuvent être réalisés uniquement avec des caméras et ne nécessitent plus de capteurs installés dans la chaussée.

"Notre technologie apporte le dynamisme, la vie, les gens et les véhicules dans les modèles de villes en 3D. C'est l'un des grands avantages de notre technologie par rapport à des applications connues comme Google Street View", explique Riemenschneider. En outre, la technologie est construite selon le principe de "privacy by design" : Les algorithmes génèrent des informations sous forme anonymisée à partir des données d'images. Dans les visualisations, les flux de personnes et le trafic sont affichés sous forme d'avatars. Varcity est donc compatible avec la protection des données.

De grandes quantités de données exploitées

Les scientifiques ont développé les algorithmes informatiques correspondants au cours des cinq dernières années dans le cadre d'un projet du Conseil européen de la recherche ERC (ERC Advanced Grant accordé au professeur Van Gool de l'ETH). Comme objet d'illustration, ils ont créé un modèle 3D de la ville de Zurich, qu'ils présentent maintenant dans une vidéo à l'occasion de la clôture du projet comme prévu.

La technologie Varcity se base sur l'analyse d'une quantité gigantesque de données d'images. "Plus la plateforme peut analyser d'images et de vidéos, plus le modèle est précis", explique Kenneth Vanhoey, postdoctorant dans le groupe de Van Gool. "L'objectif de notre projet était de développer des algorithmes pour de tels modèles de villes en 3D. Ceci en partant du principe que la quantité d'images et de vidéos disponibles continuera à augmenter rapidement dans les années à venir".

Pour créer un modèle tridimensionnel à partir des données d'images, les scientifiques utilisent la triangulation. Ils ont besoin pour cela de plusieurs prises de vue d'un objet sous différents angles. Grâce à l'analyse des distances et des angles sur les différentes images, il est possible de localiser précisément les coins de l'objet dans l'espace.

Une technologie de guidage de parking simple

Les scientifiques ne proposent pas le modèle urbain lui-même comme application, mais les applications possibles de la technologie sont nombreuses. La planification urbaine et la planification des transports en font partie. Afin de commercialiser les applications basées sur la technologie, les participants au projet ont en outre créé plusieurs start-ups : Spectando propose des visites virtuelles de bâtiments pour le marché de l'immobilier, et Casalva réalise des analyses virtuelles de dommages aux bâtiments pour les assurances, par exemple après des intempéries comme des tempêtes de grêle. Ces applications ne nécessitent pas d'appareils spéciaux, des photos ordinaires prises avec un smartphone suffisent.

Parquery, le spin-off de l'ETH issu de Varcity, utilise également cette technologie. L'entreprise a développé un système de guidage de stationnement qui fonctionne exclusivement avec des caméras orientées vers les places de stationnement et qui n'a pas besoin de capteurs de stationnement. L'ordinateur évalue les données vidéo en temps réel, peut reconnaître les voitures et sait ainsi quelles places de stationnement sont vides, mais aussi quelles voitures n'ont pas été garées conformément aux règles. Le système a été le premier à être utilisé à Locarno. Il existe en outre 30 autres projets au niveau international.

Enfin, le spin-off de l'ETH Uniqfeed utilise ces méthodes pour identifier les publicités sur les bandes et les joueurs individuels lors des retransmissions télévisées d'événements sportifs. Elle peut ainsi, d'une part, calculer leur durée de visibilité pendant la retransmission et, d'autre part, personnaliser la publicité sur les bandes pour différents groupes d'utilisateurs.

En regardant la vidéo, vous acceptez la déclaration de confidentialité de YouTube.En savoir plus OK
Vidéo : ETH Zurich
JavaScript a été désactivé sur votre navigateur.