IMA3/IMA4 2020/2022 P5

De Wiki de Projets IMA
Révision datée du 5 janvier 2022 à 22:31 par Abrossas (discussion | contributions) (Semestre 7)

Présentation générale

Contexte

Introduction

L’objectif de ce projet est la mise en place d’algorithmes de machine learning afin de diagnostiquer l’état de machines industrielles. Nous travaillons sur ce projet durant 2 semestres. Durant le premier semestre, nous avions comme objectifs d’acquérir la maîtrise des différentes librairies primordiales pour traiter les données en machine learning, ainsi que d’étudier et d’utiliser certains algorithmes basiques (régression linéaire, logistique, Bayes) sur des datasets que nous traiterons nous même.

Répartition des tâches

Semestre 6

Au début, comme le sujet était flou pour une majorité d’entre nous, nous nous sommes documentés tous ensemble sur différents livres à propos du machine learning et avons compris l’importance des librairies associées au machine learning. Après s’être suffisamment documenté, 3 d’entre nous devaient réaliser un rapport sur les différentes librairies (Numpy pour Loïc, Pandas pour Tom, Seaborn pour Aymen), celui-ci se devait d’être assez explicite afin que les autres n’ayant pas travaillé sur ces librairies puissent acquérir des connaissances facilement en le lisant, Florian et Antoine, quant à eux, se sont occupées d’implémenter et d’analyser une première méthode de machine learning, la régression linéaire, et d’en effectuer un rapport. Ensuite, une partie d’entre nous s’est intéressée à d’autres algorithmes de machine learning (Bayes pour Loïc et régression logistique pour Antoine) tandis que Florian et Tom se sont intéressées à diverses méthodes de pré-traitement de données (méthode SMOTE pour l’oversampling) à appliquer sur une base de données existantes et Aymen s’est occupé de la partie évaluation de l’efficacité d’un algorithme (avec notamment l’importance de la matrice de confusion).

Semestre 7

Durant ce semestre, certains d’entre nous (Aymen, Loïc et Florian) se sont documentés sur les différentes méthodes pour créer notre propre dataset afin de les mettre en place ultérieurement pendant que d’autres (Tom et Antoine) se renseignaient sur différentes méthodes de pré-traitement des datasets (random,...) afin de les réaliser sur la dataset créée

Cahier des charges

Ressources disponibles :

Livres sur le machine learning

Bases de données (afin d'appliquer divers algorithmes de machine learning) que nous prendrons sur ces sites : https://www.kaggle.com/datasets https://archive.ics.uci.edu/ml/datasets.php

Librairies Python (Scikit-learn, Pandas, Numpy, Seaborn, Matplotlib)

Objectifs poursuivis :

Détecter les dysfonctionnements de systèmes mécatroniques (par exemple les robots Khepera, Robotino…), grâce au machine learning.

Apprendre à implémenter différentes méthodes machine learning .

Profil du public cible :

Secteur mécatronique

Entreprises disposant d'ingénieurs pour maintenir le système informatique opérationnel

Entreprises utilisant des machines dans tous les secteurs

Analyse des besoins :

L’industrie a de plus en plus besoin du machine learning pour détecter les erreurs des systèmes. En effet, cette technologie devient indispensable pour les industriels, notamment afin d'accroître la productivité et l’efficacité des systèmes industriels. Notamment dans le cadre de l'industrie 4.0.

Le programme peut ne pas être aussi rapide et optimisé en espace mémoire que d'autres programmes, nous visons l’efficacité de notre algorithme plutôt que la rapidité.

Recherche bibliographique

  • Cours de probabilités et statistiques de l’Université Jules Vernes
  • Machine Learning with scikit-learn Quick Start Guide écrit par Kevin Jolly
  • Machine Learning algorithms - Second Edition écrit par Giuseppe Bonaccorso

Rapports et présentation

Librairies

Rapports