Decideo - Actualités sur le Big Data, Business Intelligence, Data Science

Abonnez-vous gratuitement à Decideo !


Decideo


 
Forums, dernières contributions

Le Laboratoire MAS de l’Ecole Centrale Paris recherche un post doctorant

 Marie-Aude Aufaure
Mardi 15 Juin 2010

Version imprimable
Le Laboratoire MAS de l’Ecole Centrale Paris recherche un post doctorant :

Entrepôts de données et technologies du web sémantique pour l’aide à la visualisation décisionnelle : application la conception de systèmes complexes

Environnement
Ce travail de recherches postdoctorales s’effectue au sein de l’équipe « Business Intelligence » du laboratoire MAS (Mathématiques Appliquées aux Systèmes) de l’Ecole Centrale Paris. Ce travail s’effectuera dans la cadre du projet CSDL (Complex Systems Design Labs) du pôle de compétitivité System@tic, regroupant 28 partenaires, et dont l’objectif est de mettre en place un environnement collaboratif complet d'aide à la décision pour la conception de systèmes complexes tout particulièrement durant la phase d'avant-projet. L’équipe est impliquée dans un workpackage sur la conception de méthodes et d’algorithmes innovants sur une tâche de visualisation décisionnelle. Les objectifs de cette tâche sont les suivants :
- Fournir des méthodologies et des algorithmes d’aide à l’exploration visuelle de résultats de calcul numériques et de données dans des espaces paramétriques hautement dimensionnels pour la conception avant-projet, multidisciplinaire et conception en phase préliminaire.
- Offrir la possibilité de confronter 'facilement' différentes méthodes d'analyse sur un même jeu de données. Guider le choix de la méthode de classification en fonction des caractéristiques des résultats de simulation à explorer (nombre de dimensions, représentativité des données d'apprentissage, type de structuration attendue, par ex. nombre de classes, structuration hiérarchique ou non)
- Evoluer vers une homogénéisation des modèles de données et des visualisations, qui sont respectivement en entrée et en sortie des procédés d'analyse de données/classification (Gains attendus : simplification des chaînes de traitement supportant les processus décisionnels, meilleures interopérabilité et réutilisation dans la composition des chaînes de traitement).
Les use case concernent les domaines de l’aviation et de l’automobile (exemples : optimisation de la conception d’un groupe motopropulseur (GMP) automobile, optimisation d’un système aérothermique d’une cabine passager ou d’une soute). Un cas test « air conditionné dans une cabine d’avion commercial » a été défini et pour lequel une base de données brutes a été constituée.




Mission
Lors de la première phase de ce projet – démarré en octobre 2009 – plusieurs types de besoins ont été mis en exergue dont des besoins en stockage/modélisation et des besoins de sémantique.
Les besoins en stockage/modélisation concernent la modélisation de grandes masses de données selon un modèle dédié à l’analyse multidimensionnelle.
Deux systèmes doivent coexister : 1) un système opérationnel d’enregistrement de données : une base de données, et 2) un entrepôt (data warehouse) pour la restitution de grandes masses de données et l’analyse multidimensionnelle. L’entrepôt de données permettra de combiner plusieurs modèles dimensionnels en un ensemble cohérent (dimensions et faits). Deux aspects importants à prendre en compte sont : (1) l’adaptabilité des données aux modifications notamment par la conception de data marts distincts, modulaires et distribués, et par une architecture d’entrepôt incrémentielle et (2) L’accessibilité des données pour l’utilisateur de l’espace décisionnel ; En effet, la modélisation de l’entrepôt doit faciliter la compréhension des données et la navigation dans ces données.
Les besoins en sémantiques ont été identifiés du fait qu’il faut pouvoir confronter différentes méthodes d’analyse sur un même jeu de données, guider le choix des méthodes de classification des données en fonction des caractéristiques des résultats de simulation à explorer, et homogénéiser les modèles. De ce fait, il est nécessaire de spécifier formellement la sémantique des connaissances qui seront manipulées par l’espace de visualisation décisionnelle. D’autres besoins tels que distinguer entre différentes interprétations (les connaissances sur les dimensions physiques de variables, les paramètres, etc. ; la signification d’un modèle/calcul dans son contexte d’utilisation ; …), connecter des modèles, définir des indicateurs et des patterns d’analyse, renforcent cette nécessité. une vue descriptive commune servant de référant sémantique formel pour l’espace décisionnel permettra de gérer des requêtes sur différents types de modèles de données et de rendus visuels et de spécifier des liens conceptuels de correspondance entre les types de méthodes de classification et les types de résultats de simulation pouvant être explorés (cf. figure suivante). Ce référent sémantique peut se matérialiser par une ontologie qui servira de support notamment pour l’instanciation/spécialisation de méta-modèles (modèles génériques), la comparaison de modèles, l’annotation de modèles et/ou des vues dans l’espace décisionnel, etc.
















Travail à réaliser
L’objectif de ce travail de recherches postdoctorales est de définir comment les technologies du web sémantiques peuvent être utilisées pour l’aide à la visualisation décisionnelle (ontologies et stockage sémantique sous forme de Triple Store) et de proposer/implémenter une solution.

Compétences et profil
Formation, expérience
Doctorat en Informatique ou Mathématiques Appliquées.
Ce poste exige une rigueur scientifique et une très grande autonomie.
Des qualités relationnelles sont indispensables.
Connaissances techniques
- Connaissances en Bases de Données, Entrepôts de Données, Ingénierie des connaissances et ontologies.
- Bonne expérience en outils de développement des mondes Linux et Windows.
- Maîtrise des langages et outils comme XML, SQL, Java, et aptitude à la programmation.
- Bonne faculté d'apprentissage et d'adaptation à divers outils informatiques.
- Excellente maitrise de l’anglais.
Lieu de travail
Laboratoire MAS – Ecole Centrale Paris – Chatenay-Malabry
Durée : 18 mois
Début : dès que possible
Statut : CDD CRSA (Centrale Recherche SA)
Rémunération : ~ 2000 € net mensuel
Dossier de candidature
- Une lettre de candidature et de motivation
- Un CV mentionnant le sujet de la thèse
- Des références ou lettres de recommandation

Envoi des candidatures (date limite 02 juillet 2010)
Marie-Aude Aufaure
Ecole Centrale Paris - Grande Voie des Vignes - 92 295 Chatenay-Malabry Cedex
Email : Marie-Aude.Aufaure@ecp.fr


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store