Nous sommes à Washington, en 2054 précisément. La reconnaissance faciale et la biométrie semblent être devenues un « Must Have » apprécié de tous, tout comme la nouvelle Lexus 2054. Que se passe-t-il ? Nous sommes tout simplement dans Minority Report et a cette époque soit en 2002, ce genre de « barbarie futuriste » à base de reconnaissance faciale semblait ne représenter qu’un mauvais rêve tout droit sorti des fantasmes d’un génie scénariste de science-fiction…! Au jeu des chiffres, citons l’année 1927 ou Metropolis présentait notre avenir avec la « Visio-Téléphonie » … Génie visionnaire, Fritz Lang avait anticipé les premières applications de visioconférences ayant péniblement vu le jour 40 ans plus tard… Et si nos technologies actuelles n’étaient que le fruit de l’imagination débordante des scénaristes de science-fiction ? De ce pas, démystifions l’analyse vidéo de manière pragmatique au travers ce billet de blog devenant obsolète dans moins de 2 ans compte tenu des progrès spectaculaires dans le domaine de l’intelligence artificielle. A 2019 pour un nouvel article 😉
En quelques années, l’analyse vidéo s’est forgé une solide réputation en matière de fiabilité, de simplicité à l’usage et s’est dotée d’une certaine « intelligence » dans la prise de décision. À la grande époque de l’analogique, CAD près de dix ans auparavant, les systèmes de vidéosurveillance étaient cantonnés à des fins uniques de surveillance sans vraiment pouvoir tirer profit de quelconque intelligence, ou alors rudimentaire et minimaliste soit elle. Traiter 40 caméras en temps réel était une tâche fastidieuse, routinière et ô combien exigeante avec le matériel. Petite ou plutôt grande révolution, l’analyse vidéo a réellement offert un gain de temps considérable et permet à ce jour d’épauler diverses taches jadis fastidieuses et lourdement rébarbatives.
Vidéosurveillance intelligente : Solution d’analyse vidéo, pourquoi s’orienter vers l’analyse vidéo intelligente ?
Réservé il y’a peu encore aux grandes entreprises ou administration, la vidéosurveillance intelligente s’accommode à tout type d’applications et nous côtoie un peu partout dans notre quotidien. Exit les énormes serveurs Hewlett Packard cumulant de nombreuses grappes RAID et place à la miniaturisation grâce à l’augmentation tout bonnement exponentielle (soulignons-le !) de la puissance de calculs des caméras et enregistreurs/serveurs vidéos. De nos jours, l’analyse vidéo peut se passer du côté caméras ou depuis un serveur dédié englobant plusieurs flux en haute définition.
L’avènement des caméras IP, la baisse significative des coûts de production, les cadences en nette hausse, la future généralisation du codec H.265 et l’augmentation annuelle de puissance de calcul font et feront des caméras IP de véritables outils d’intelligence artificielle. Initiée en 1965, la loi de Moore annonce chaque année une puissance par 2 des machines. Gordon Moore, cofondateur d’Intel semble régir ainsi la progression annuelle de la puissance de calcul dans le domaine de l’électronique et par la même occasion de nos caméras et de leurs intelligences… Jusqu’où ira l’analyse vidéo à ce rythme ?
Vidéosurveillance intelligente : Comprendre ce que l’analyse vidéo est capable de faire en matière de vidéosurveillance
L’analyse vidéo permet d’épauler au quotidien de nombreux domaines allant du commerce/marketing à la santé en passant par la gestion du personnel, l’étude des comportements, des émotions et bien évidemment de la sécurité, notre domaine de prédiction. Les systèmes d’analyse vidéos sont capables d’analyser et de traiter en temps réels de nombreux flux. Ainsi, le franchissement d’une ligne virtuelle, la circulation dans le mauvais sens d’un individu ou d’un véhicule, la détection d’objets abandonnés tels un colis ou une valise, la gestion des foules et des files d’attente, la lecture des plaques minéralogiques (LAPI) dans le domaine de la vidéosurveillance urbaine, le comptage des véhicules par voies et leur sens de circulation (sens interdit, circulation sur une bande d’arrêt d’urgence, stationnement interdit…), la probabilité d’un vol d’objet, la cartographie thermique et bien plus encore ne sont à ce jour, qu’une petite partie de l’iceberg.
Aujourd’hui la vidéosurveillance analytique est parfaitement capable de faire la distinction entre plusieurs objets, entre des humains ou des véhicules et d’analyser de manière intelligente une situation avec une prise de décision à la clé. L’analyse vidéo offre un niveau relativement satisfaisant permettant de s’appuyer de manière fiable sur diverses « Métadatas ». Pourtant, la multiplication des algorithmes et critères de détection nous amène parfois à basculer dans un système un brin aléatoire proche de la justice préventive avec une banalisation des « faux positifs » qui en découle d’un grand nombre d’erreurs lors de la phase de traitement. Il est donc opportun d’utiliser l’analyse vidéo de manière pragmatique en ne surévaluant pas ses capacités afin de rester dans une certaine concordance. #PierreQuiCriaitAuLoup.
Vidéosurveillance intelligente : Rebondir sur les lacunes de la détection intrusion avec la vidéosurveillance analytique
La bonne vielle détection intrusion avoue parfois ses limites et dans certaines applications, tends à se faire devancer, surpasser voir totalement « dessoudé » par l’analyse vidéo ! Ses faibles propriétés de couverture avec des portées de détection moindre, la nécessité bien souvent de lourds voir très lourds travaux de génie civil et son manque de flexibilité, oriente naturellement vers l’analyse vidéo. Couplée à de l’imagerie thermique, l’analyse vidéo ainsi associée permet d’apporter une détection des plus précises sans aucune dépendance aux mauvaises conditions météorologiques. Pour des applications allant de quelques centaines de mètres à plusieurs kilomètres, telle une surveillance nautique, aux frontières, protection des chantiers ou tout simplement la protection de vastes étendues de stockage typique des grandes surfaces de bricolages, l’analyse vidéo montre tout son sens et permet de bénéficier d’une solution « légère » à mettre en œuvre avec un niveau de précision paramétrable à souhait.
Vidéosurveillance intelligente : L’analyse vidéo dans la vente, améliorer l’expérience d’achat pour les consommateurs
Si un domaine est propice à la vidéosurveillance, c’est sans équivoque le domaine de la vente. Cantonné il y’a quelques années à n’assurer qu’une lutte contre la démarque inconnue, aujourd’hui la vidéosurveillance s’est étoffée de quelques galons supplémentaires grâce à l’analyse d’image. Allié précieux du domaine de la vente, la vidéosurveillance analytique est capable de se transformer en véritable outil marketing dont il serait de plus en plus difficile de s’en passer… Analysant les flux entrants et sortants des visiteurs de manière anonyme tout en décryptant leurs parcours ou leur temps d’arrêt, la vidéosurveillance analytique est apte à identifier les zones « froides » ou « chaudes » d’un magasin, de qualifier la fréquence et ainsi d’optimiser grandement certains rayons en travaillant sur la disposition des produits.
Le comptage associé au calcul du ratio « ventes/visites » permet de rapidement débusquer les points faibles d’un magasin. Les temps d’attentes en caisses sont également parfaitement maitrisés par l’analyse fine d’une file d’attente résultant des ouvertures/fermetures de caisses découlant par l’optimisation de la meilleure humeur des clients (!) L’analyse vidéo permet dans le domaine de la vente d’anticiper certaines habitudes des consommateurs, d’optimiser le magasin et le confort des usagers et indirectement de générer plus de ventes par l’amélioration du cultissime taux de transformation.
Vidéosurveillance intelligente : Étude de cas, Disney et son algorithme d’analyse FVAE – Venez vivre la magie !
Baptisé FVAE Factorized Variational Autoencoders, ce puissant algorithme permet à ce jour d’analyser et de prédire nos émotions ressenties devant un film. Le programme FVAE utilise quatre caméras infrarouges installées sur le devant de la scène afin d’analyser le faciès des utilisateurs à une cadence soutenue de 2FPS (2 images/secondes). FVAE a été déployé sur 3179 cinéphiles répartis sur 150 projections cinématographiques dans une salle de type théâtre comportant 400 places. Ce puissant algorithme utilisant l’intelligence artificielle est développé par Disney Research en collaboration avec l’université. Pour cet algorithme, Simon Frazer s’appuie sur de nombreux critères afin de déterminer avec précision notre degré de plaisir, de peur, de surprise ou de stress devant une œuvre (ou pas !) cinématographique.
En capturant de nombreuses expressions faciales, l’algorithme est capable d’effectuer une analyse fine de chaque individu présent dans la salle et ainsi, d’évaluer la réaction globale du public devant tout type de film. FVAE analyse les visages à une fréquence de 2 FPS et les reclasse dans certaines catégories. FVAE analyse 68 traits de comportement et additionne ainsi le nombre de visages qui présenteront un sourire, cligneront des yeux, baillerons aux corneilles etc. Les métadonnées sont ensuite finement analysées avec de nombreuses autres données pertinentes puis recoupées avec d’autres visages à différents temps du film. En quelques minutes, l’algorithme est capable de prédire le niveau de satisfaction d’un individu ou d’un groupe d’individus face à la projection d’un film. Une technologie d’avenir qui devrait faire parler d’elle…
Vidéosurveillance intelligente : Étude de cas et dérapages, programme « Behavior Detection And Analysis »
Le 8 février 2017, une série de documents appartenant à la TSA (agence publique chargée de la sécurité des transports aux États-Unis) pointaient de sérieuses failles en matière de l’analyse comportementale établie dans de nombreux lieux aux États-Unis. Le programme Behavior Detection and Analysis s’appuie sur de nombreux critères permettant de détecter tout type de comportement. Afin d’apporter des éléments constructifs à la détection, ce programme s’appuie sur une centaine de critères physiques et comportementaux allant de l’analyse des émotions à l’état de stress, d’angoisse, d’une posture rigide, d’arrogance, de certain comportement tel un raclage de gorge incessant en passant par un mouvement des yeux ou encore, une arrivée tardive à l’aéroport…
Ainsi, un couple marié de plus de 55 ans, un homme d’une 60 aines d’années ou une femme de 55 ans aura nettement moins de chance de « matché » à ce détecteur d’émotions et verra son « score personnel » diminué d’un ou deux points. Ce classement (pardonnez ce nom barbare) permet d’amoindrir les allégations. A contrario, si le score se montre trop important, immédiatement l’alerte est lancée permettant d’écarter et de contrôler l’individu suspect. Le Behavior Detection And Analysis est dénoncé activement depuis 2013 par le Government Accountability Office (agence indépendante de conseil du Congrès américain) qui indique que le facteur chance est plus probable qu’une réelle détection par analyse comportementale. En évolution constante, les critères de pertinence sont revus fréquemment afin d’éviter l’usage de certains critères d’évaluation discutable…
L’arrivée imminente de la vidéosurveillance intelligente 2.0 – Deep Learning, IA & Convolutional Neural Networks
L’intelligence artificielle est un domaine dont une série de deux chiffres ne suffirait pas à quantifier sa croissance annuelle. Étant un des segments les plus dynamiques dans le domaine de la vidéosurveillance, de nombreuses technologies viennent peu à peu « fiabiliser » et renforcer la qualité dans le domaine de l’IA au point d’arriver à une révolution de type 2.0. Les algorithmes avancés d’apprentissage profond Deep Learning associé à la CNN Convolutional Neural Networks permettent des avancées spectaculaires de jour en jour. Considéré comme l’un des chercheurs les plus influents dans le domaine de l’IA, Yann LeCun a résumé en une phrase équivoque le Deep Learning : « La technologie du Deep Learning apprend à représenter le monde »…
Cette technologie est tout à fait capable de faire une distinction de tout type d’objet en s’appuyant sur des datas immatérielles telles les différences de forme, de taille, de couleur, mais également de manière plus poussée, en recroisant toutes ses données tout en analysant finement leurs positions. Ainsi, après une comparaison des différents pixels situés au-dessus et en dessous et lorsque la présence de lignes se rencontre à 45°, l’IA va être capable de reconnaitre le triangle de l’oreille d’un chat. Après plusieurs analyses des différentes formes constituant notre cher félin, l’IA sera capable de certifier qu’il s’agit bien d’un chat. L’analyse vidéo va considérablement évoluer dans les mois/années à venir et offrir un niveau de précision sans précédent…
Conclusion : Jusqu’où la vidéosurveillance intelligente est-elle capable d’aller pour améliorer notre quotidien ?
Ce qui était fortement espéré, désiré voir ranger dans la case du fantasmagorique il y’a quelques années est en train de se réaliser… La puissance de calcul en croissance constante annuelle associée à l’évolution de l’IA de plus en plus poussée pourrait apporter des solutions d’analyse vidéo pertinente ne présentant peu ou plus du tout de « faux positif » avec l’arrivée massive des technologies d’apprentissage. Présente au quotidien dans tout type de domaine, l’analyse vidéo est à ce jour devenue un précieux allié de nombreux domaines et permet peu à peu de bénéficier de solutions autonomes particulièrement intelligente, capable d’alléger les opérateurs des différentes taches rébarbatives et bien souvent fastidieuses…
Aujourd’hui, l’analyse vidéo peut être déployée très simplement par la mise en place d’une détection de franchissement performante et simple à mettre en place. L’analyse vidéo comme nous l’avons décrite dans cet article est également capable de s’appuyer sur de nombreux critères pour analyser nos émotions nos comportements dans le but d’améliorer l’expérience utilisateur, le commerce ou la sécurité. La Smart Home ou encore, Smart Building n’est sont qu’à leurs premiers émois et deviennent peu à peu une réalité qui dépassera (très) prochainement la fiction.