JONAS (Just ONe smart ASsistant), Projet Univ. Evry CIR 2019

/, SIAM/JONAS (Just ONe smart ASsistant), Projet Univ. Evry CIR 2019
JONAS (Just ONe smart ASsistant), Projet Univ. Evry CIR 2019 2019-02-25T13:44:04+00:00

Description Projet

JONAS (Just ONe smart ASsistant)

Un des plus fameux paradoxe de l’intelligence artificielle, le paradoxe de Moravec, peut s’énoncer simplement ainsi :« le plus difficile en robotique est souvent ce qui est le plus facile pour l’homme ». D’innombrables exemples appuient ce paradoxe : les taches de reconnaissance d’un objet, d’un visage, l’évaluation des émotions d’autres individus, sont faciles à reproduire par l’homme tandis que le calcul mathématique, la logique ou la planification lui donnent plus de difficultés.

L’explication de ce paradoxe tient en un mot : l’évolution.

Les taches sensorimotrices, fonctionnalités biologiques anciennes ont été perfectionnées durant des millions d’années tandis que les facultés de raisonnement sont plus récentes biologiquement parlant, et ne sont pas autant « optimisées ».

Noter que, jusqu’ici, nous n’avons pas encore parler d’intelligence, mais seulement de taches, de calcul, de logique, appelé également weak ounarrow AI avec quelques illustrations fameuses comme le supercalculateur Watson d’IBM, SIRI de Google ou les filtres anti-spam, etc. Par opposition la strong AI (aussi connue sous l’appellation IA générale) suppose des capacités cognitive et conversationnelles proches de celles de l’humain. Un tel système n’existe pas encore et les experts sont partagés sur la possibilité qu’il puisse exister un jour.

Le présent projet a pour ambition de réaliser une intelligence composée d’agents connectés électroniquement et cognitivement que nous appellerons JONAS.

Examinons chaque terme : pourquoi une ensemble d’agents ? Un groupe d’experts est meilleur qu’un seul expert même si, parfois ces experts peuvent se contredire. La connexion cognitive sera conçue par un processus de connaissance centralisé qui mettra en jeu des mémoires, un raisonnement, une intelligence, une prise de décision une perception ou une attention. Ces processus cognitifs ont été l’objet de travaux de psychologues d’Harvard dans les années 1955-1960 [1].

Connexion électronique ? Apprendre c’est désapprendre ! Il faut oublier pour progresser. Dans la revue Nature Communication des chercheurs canadiens ont démontré que des mécanismes neuronaux seraient dédiés à l’oubli d’informations lors d’une phase d’apprentissage. Comme l’explique Steve Masson de l’UQAM, “pour apprendre, le cerveau doit établir de nouvelles connexions entre les neurones du cerveau. Une fois créées, ces connexions peuvent se renforcer ou s’estomper, voire disparaître”. Nous proposons de créer un processus de gestion de la mémoire qui reproduira ce mécanisme d’oubli dans la mémoire centralisée chargée de synchroniser régulièrement les mémoires des agents.

Nous proposons d’expérimenter cette idée sur un problème simple, la reconnaissance faciale.

Une récente étude [3] révèle en effet le code de reconnaissance faciale mis en place par le cerveau pour reconnaître, à partir d’une très faible quantité de neurones, n’importe quel visage. On sait ainsi que plusieurs petites régions du lobe temporal inférieur forment le centre de la reconnaissance faciale. Chaque cellule faciale code une caractéristique particulière du visage, décrivant sa forme ou son aspect. Plus précisément un peu plus de 200 neurones (caractéristiques) seraient suffisants car variant le plus d’un visage à un autre, pour identifier un visage comme la texture et la couleur de la peau et des cheveux, la distance entre les yeux, etc.

ces résultats pourraient aider à mieux comprendre l’origine de la prosopagnosie, une pathologie rendant difficile voire impossible l’identification ou la mémorisation des visages humain. Ce code pourrait potentiellement être utilisé en médecine légale pour réaliser des portraits-robots en permettant la reconstruction d’un visage en analysant l’activité des cellules faciales chez un témoin. Un autre aspect vient naturellement dans cette étude : c’est l’analyse des interactions utilisateurs par des méthodes de clustering.

Avec l’émergence de l’apprentissage en profondeur (deep-learning), et des réseaux de neurones en général, comme la technologie dominante pour l’apprentissage automatique, nos efforts porteront sur certaines tendances de l’apprentissage automatique. Un besoin très important est en effet l’automatisation des algorithmes – l’automatisation dans le sens où ils auraient besoin de connaissances expertes minimales pour converger. Une fois automatisés, nos algorithmes d’apprentissage ouvrent la porte à la création de nouveaux types de systèmes et d’applications que nous n’aurions jamais pu imaginer auparavant. 

Concernant le matériel pour l’apprentissage de JONAS. Nous avons ciblé une architecture volontairement minimaliste, bien que plusieurs dispositifs en cours de développement chez Microsoft ou Thalès sont destinés à l’apprentissage en profondeur. Mais beaucoup de nos algorithmes d’apprentissage peuvent également exploiter le parallélisme massif offert par les GPU et les FPGA. Ces formes matérielles viennent également avec des langages de programmation de haut niveau comme OpenCL et CUDA, ce qui facilite la création de versions matérielles de nos algorithmes. Ces langages sont par ailleurs « libres ».

Après avoir étudier les protocoles et vulnérabilité de l’IoT, la vidéosurveillance fonctionnant de manière autonome, cette dernière peut faire partie d’une offre domotique plus complète, comprenant une passerelle IoT à installer sur le réseau local. Un audit concernant une offre domotique connectée, permettant de fédérer des objets connectés provenant de nombreux fabricants, a donné l’occasion de s’intéresser à la sécurité d’un protocole assez courant dans l’IoT : MQTT,

L’ensemble de processus d’apprentissage expérimentaux basés sur le comprehensive sensing : la perception globale d’un environnement animé dans lequel les acteurs interagissent avec cet environnement. Ces acteurs sont des caméras autonomes, pivotantes, placées aux endroits les plus stratégiques et réagissant par détection de mouvement. À partir des flots d’images collectées l’agent apprenant va construire ses propres éléments discriminants pour optimiser ses performances d’identification.

Ces agents intelligents sont des modules informatiques réduits connectés et communicants, autrement dit des systèmes embarqués intégrant un OS light linux-like de type Rasbian doté de bibliothèques open-source de traitement d’image en temps réel OpenCV mais aussi de librairies Python pour le filtrage d’images. La reconnaissance faciale permet de reconnaître ces visages parmi une base de donnée pré-enregistrée. Mais avant de pouvoir faire reconnaître les visages à l’ordinateur, il faut en premier lieu que celui-ci puisse les détecter.

  • Porteur du projet: Vincent VIGNERON (MCF HDR Univ. Evry)
  • Date du projet: 2018-2019