Evolution artificielle, optimisation et apprentissage

De Bioinformatique théorique, Fouille de données et Optimisation stochastique.
Aller à : Navigation, rechercher
Thématique SONIC (Stochastic Optimisation and Nature Inspired Computing)

Pierre Collet
La thématique SONIC (Stochastic Optimisation and Nature Inspired Computing), portée par Pierre Collet, étudie et utilise des techniques permettant de s'attaquer à des problèmes complexes insolubles par méthodes exactes. Les méthodes inspirées de la nature sont privilégiées pour leur robustesse et leur très bonne exploration de l'espace de recherche. L'équipe utilise principalement :

L'équipe est actuellement au meilleur niveau international dans l'utilisation de cartes graphiques massivement parallèles (GPGPU) pour le calcul scientifique par évolution artificielle et pour l'intelligence artificielle, en étant la première à obtenir des accélérations d'environ trois ordres de grandeur par rapport à un coeur de CPU moderne sur des problèmes d'optimisation génériques avec la plateforme EASEA (EAsy Specification of Evolutionary Algorithms). Typiquement, une journée de calcul sur un ordinateur comportant plusieurs cartes GPU devient équivalente à plusieurs années de calcul sur un ordinateur compatible PC moderne, ce qui permet de s'attaquer à des problèmes impossibles à aborder par d'autres techniques.

Le but poursuivi est ambitieux : il consiste à implémenter une véritable intelligence artificielle compétitive avec l'intelligence humaine sur un ordinateur de type PC équipé de plusieurs cartes graphiques.

Deux types de projets sont menés de front : des projets fondamentaux portant sur l'adaptation des algorithmes évolutionnaires aux caractéristiques de ces nouvelles cartes, et des projets appliqués qui permettent de tester les algorithmes élaborés sur des problèmes réels, souvent bien différent des problèmes jouets de type benchmarks.

Sommaire

Principales personnes travaillant dans la thématique

A ces personnes viennent s'ajouter :

Projets

ECOMAPS (Evolutionary Computation on Massively Parallel Systems)

Le projet ECOMAPS a pour but de revisiter les différents paradigmes évolutionnaires pour les adapter à la parallélisation massive, notamment sur cartes GPGPU (General Purpose Graphic Processing Units) et de les intégrer dans le langage EASEA (cliquer ici pour une rapide explication).
Ogier web.jpg

Il comprend trois volets :

Poursuite du développement du langage EASEA (EAsy Specification of Evolutionary Algorithms, (Collet et al., 2001) permettant à un algorithme évolutionnaire de s'exécuter sur cartes GPGPU General Purpose Graphic Processing Unit sans que le programmeur n'ait besoin de savoir programmer les cartes. Le développement de la plateforme de calcul évolutionnaire massivement parallèle EASEA est actuellement assuré par :
Frederic web.JPG

La plateforme EASEA intègre les derniers développements algorithmiques de l'équipe. Il est disponible sur Sourceforge.

- Adaptation de la Programmation Génétique Linéaire à l'exécution sur cartes GPGPU
Wolfgang web.jpg
La Programmation Génétique Linéaire, développée par Wolfgang Banzhaf (cf. Brameier & Banzhaf, 2007) semble particulièrement bien adaptée à l'architecture des processeurs GPU. Ogier Maitre et Wolfgang Banzhaf travaillent à modifier la Programmation Génétique Linéaire pour profiter des spécificités de ces cartes massivement parallèles. Le résultat sera intégré au langage EASEA (cf. ci-dessous).
- Implémentation d'un algorithme de chimie virtuelle sur GPGPU 
Yamamoto web.jpg
La chimie virtuelle est un paradigme qui peut servir non seulement à simuler des réactions chimiques, mais qui peut aussi être utilisé pour résoudre des problèmes scientifiques. Le sujet du post-doc de Lidia Yamamoto consiste à porter la chimie virtuelle sur cartes GPU.

ARA (Administrateur Réseaux Artificiel)

Deepak web.jpg
Post-doc de Deepak Sharma financé par OSEO pour la société Kelerio. La société Kelerio administre des réseaux pour des entreprises clientes. Le but du projet ARA est de créer un Administrateur Réseaux artificiel capable de détecter des pannes et d'y remédier avant qu'elles ne surviennent.

Une collaboration a lieu sur ce sujet avec Cécilia Zanni-Merck et Philippe Bouché du LGeCo (INSA de Strasbourg).

RENZEO (Recherche de Nouvelles Zéolites)

Frederic web.JPG
Stage de M2 ILC option Recherche faisant suite à un stage de M1 en collaboration avec Laurent Baumes de l'Instituto de Tecnologia Quimica de l'Université Polytechnique de Valencia (Espagne). Les zéolites sont des structures cristallines poreuses d'une grande importance dans l'industrie. Suivant le diamètre des pores de la molécule, une zéolite peut être utilisée comme adsorbant, pour filtrer ou retenir d'autres molécules, permettant ainsi de déshydrater du gaz ou comme catalyseur. Chaque nouvelle découverte de zéolite permet de nouvelles utilisations industrielles, d'où l'importance de la recherche dans ce domaine.

BETON (optimisation de structures béton)

Cédric den Drijver effectue un stage en apprentissage financé par l'INSA de Strasbourg dans le cadre d'une collaboration autour de la thèse de Céline Conrardy financée par Lafarge. Le but de cet apprentissage est d'optimiser des structures béton (poutrelles, par exemple) par Programmation Génétique sur GPGPU en les évaluants par éléments finis.

Thèses en cours

- Algorithmes génétiques et programmation génétique sur carte GPGPU 
Ogier web.jpg
Thèse d'Ogier Maitre, dirigée par Pierre Collet et co-encadrée par Nicolas Lachiche).

Travaux réalisés :

  1. Parallélisation d'un algorithme évolutionnaire standard sur carte GPGPU : Ce travail a permis d'obtenir des accélérations proportionnelles à la puissance des cartes GPGPU par rapport à un processeur moderne de type Pentium (typiquement, x100 sur une carte NVidia GTX260 à 700 GFlops, cf. caractéristiques des cartes NVIDIA). La puissance des cartes GPGPU devient appliquable à tout problème d'optimisation abordable par évolution artificielle. Les résultats ont été inclus dans le langage EASEA, qui permet d'obtenir l'accélération par parallélisation automatique d'un algorithme évolutionnaire sans que l'utilisateur n'ait besoin de savoir programmer la carte (Ogier et al. 2009, 2009b).
  2. Parallélisation de l'évaluation d'arbres standards de Programmation Génétique sur carte GPGPU : des accélérations de l'ordre de x100 à x250 sont obtenues sur une demi-carte NVidia GTX295 sur de très grandes populations avec seulement 32 cas d'apprentissage. Cette avancée est majeure car elle permet d'appliquer la puissance des cartes GPGPU à des problèmes d'apprentissage automatique, ouvrant ainsi la voie à une intelligence artificielle compétitive avec l'intelligence humaine sur un PC standard équipé de cartes GPGPU (Koza 2003).

Travaux en cours et futurs dans le cadre de la thèse :

  1. Couplage de l'exécution parallèle d'arbres de PG avec un moteur évolutionnaire standard permettant de paralléliser un algorithme de Programmation Génétique standard sur GPGPU et son intégration dans EASEA (en cours).
  2. Développement d'un algorithme de Programmation Génétique adapté à l'architecture des GPGPU. Un bon candidat est la Linear Genetic Programming (Brameier et al. 2007).
  3. Adaptation du paradigme aux très grandes populations en s'inspirant probablement des travaux de (Poli et al. 2007) sur le sujet.

Sujets de TER de M1 2009-2010 en rapport avec la thèse :

- Optimisation stochastique par méthodes évolutionnaires appliquée à la conduite d’engins autonomes (et notamment les drones) 
Stephane web.jpg
Thèse de Stéphane Querry, dirigée par Pierre Collet et financée par la société POLYVIONICS. Ce projet comporte plusieurs volets :

Sujets de projet 150h de M2 en rapport avec la thèse :

La soutenance consistera à faire tourner l'algorithme sur le Casque à Mouches ci-contre spécialement réalisé pour le projet :-)

- Modélisation et optimisation des pratiques collaboratives 
Olivier web.jpg
Thèse d'Olivier Kuhn, dirigée par Pierre Collet et Parisa Ghodous, en cotutelle avec le LIRIS de l'Université de Lyon, sur financement CIFRE PROSTEP).

Travaux réalisés :

Travaux en cours :

Liste des Publications

Liste

Animation Scientifique

Principales Collaborations

Department of Computer Science, Memorial University of Newfoundland, St John, Canada 
Venue du Pr Wolfgang Banzhaf dans l'équipe pendant 6 mois (d'avril 2010 à septembre 2010) pour y développer la chimie artificielle sur carte GPGPU.
Instituto de Tecnologia Quimica , Universidad Politecnica de Valencia (Espagne) 
Collaboration sur la recherche de nouvelles zéolites, avec plusieurs articles de conférence et de journaux scientifiques soumis.
Indian Institute of Technology of Kharagpur (Inde) 
avec la venue du doctorant Arijit Biswas pendant 8 mois (d'avril 2009 à décembre 2009) dans l'équipe dans le cadre d'une bourse franco-indienne Sandwitch. Un article de journal international a été soumis.
Laboratoire d'InfoRmatique en Image et Système d'informations, Université de Lyon 
co-tutelle de la thèse d'Olvier Kuhn (cf. ci-dessus).
Société PROSTEP France et Allemagne 
Thèse CIFRE d'Olivier Kuhn.
Société POLYVIONICS 
Thèse de Stéphane Querry.
Equipe Image et Calcul Parallèle Scientifique (ICPS) du LSIIT, dirigée par Philippe Clauss 
Un papier a été accepté à EuroPar'09 (Ogier et al. 2009b).
Projet INRIA ALEA, Centre de Recherche Bordeaux Sud Ouest et Service ORL de l'Hôpital Avicenne 
plusieurs articles de journaux et chapitres de livre publiés.
Bristol Institute of Technology, University of the West of England 
collaboration avec l'équipe d'Andy Adamatzky, et plusieurs articles publiés.

---

L'utilisation de méthodes évolutionnaires tisse des liens évidents avec la thématique Bioinformatique Théorique de l'équipe, notamment concernant l'étude d'opérateurs génétiques destinés à modifier le génotype des individus que l'on fait évoluer. Jusqu'à maintenant, l'évolution artificielle ne s'inspire de l'évolution naturelle que dans les grandes lignes. Le rapprochement avec la thématique Bioinformatique Théorique permet aux informaticiens d'accéder à des connaissances beaucoup plus précises sur les mécanismes génétiques biologiques, pour affiner les modèles qu'ils utilisent, et inversement, les biologistes peuvent apprendre de l'expérience in silico des chercheurs en évolution artificielle.

Les liens sont très forts aussi avec la thématique Fouille de données et classification, car les méthodes évolutionnaires permettent aussi de créer des classifieurs et extracteurs de connaissance (supervisés ou non) par programmation génétique, par exemple (cf. thèses de Sébastien Derivaux et Jonathan Weber).

Anciens membres

- Arijit Biswas 04/09 - 12/09 
Optimisation du processus d'extraction de Manganèse de nodules polymétalliques extraits de fonds sous-marins :
Arijit web.jpg
Dans le cadre de sa thèse de l'Indian Institute of Technology de Kharagpur (Inde) dirigée par les Professeurs Nirupam Chakraborti et Prodip Sen, Arijit Biswas a obtenu une bourse franco-indienne Sandwitch qui lui a permis de passer 8 mois en France dans l'équipe FDBT (entre avril 2009 et décembre 2009) dans le but d'apprendre à utiliser la Programmation Génétique (spécialité de l'équipe) et de l'appliquer à son sujet de thèse.<p>A l'issue de son séjour, les résultats précédemment obtenus (et publiés) par Arijit à l'aide de réseaux neuronaux ont été améliorés par Programmation Génétique. Un article de revue internationale est en préparation.

Bioinformatique théorique, Fouille de données et Optimisation stochastique
Affichages
Actions
L'équipe BFO
Thématiques
Recherche
Réalisations logicielles
Outils personnels