IMA3/IMA4 2020/2022 P5 : Différence entre versions

De Wiki de Projets IMA
(Cahier des charges)
(Cahier des charges)
Ligne 19 : Ligne 19 :
 
https://www.kaggle.com/datasets
 
https://www.kaggle.com/datasets
 
https://archive.ics.uci.edu/ml/datasets.php
 
https://archive.ics.uci.edu/ml/datasets.php
 +
 
Librairies Python (Scikit-learn, Pandas, Numpy, Seaborn, Matplotlib)
 
Librairies Python (Scikit-learn, Pandas, Numpy, Seaborn, Matplotlib)
Google Colab
 
 
'''
 
'''
 
Objectifs poursuivis :'''
 
Objectifs poursuivis :'''

Version du 22 octobre 2021 à 11:03

Présentation générale

Introduction

L’objectif de ce projet est la mise en place d’algorithmes de machine learning afin de diagnostiquer l’état de machines industrielles. Nous travaillerons sur ce projet durant 2 semestres. Durant ce premier semestre, nous avions comme objectifs d’acquérir la maîtrise des différentes librairies primordiales pour traiter les données en machine learning, ainsi que d’étudier et d’utiliser certains algorithmes basiques (régression linéaire, logistique, Bayes) sur des datasets que nous traiterons nous même.

Durant ce semestre, nous nous sommes répartis les tâches suivantes :

Au début, comme le sujet était flou pour une majorité d’entre nous, nous nous sommes documentés tous ensemble sur différents livres à propos du machine learning et avons compris l’importance des librairies associées au machine learning. Après s’être suffisamment documenté, 3 d’entre nous devaient réaliser un rapport sur les différentes librairies (Numpy pour Loïc, Pandas pour Tom, Seaborn pour Aymen), celui-ci se devait d’être assez explicite afin que les autres n’ayant pas travaillé sur ces librairies puissent acquérir des connaissances facilement en le lisant, Florian et Antoine, quant à eux, se sont occupées d’implémenter et d’analyser une première méthode de machine learning, la régression linéaire, et d’en effectuer un rapport. Ensuite, une partie d’entre nous s’est intéressée à d’autres algorithmes de machine learning (Bayes pour Loïc et régression logistique pour Antoine) tandis que Florian et Tom se sont intéressées à diverses méthodes de pré-traitement de données (méthode SMOTE pour l’oversampling) à appliquer sur une base de données existantes et Aymen s’est occupé de la partie évaluation de l’efficacité d’un algorithme (avec notamment l’importance de la matrice de confusion).

Cahier des charges

Ressources disponibles : Livres sur le machine learning

Bases de données (afin d'appliquer divers algorithmes de machine learning) que nous prendrons sur ces sites : https://www.kaggle.com/datasets https://archive.ics.uci.edu/ml/datasets.php

Librairies Python (Scikit-learn, Pandas, Numpy, Seaborn, Matplotlib) Objectifs poursuivis : Détecter les dysfonctionnements de systèmes mécatroniques (par exemple les robots Khepera, Robotino…), grâce au machine learning. Apprendre à implémenter différentes méthodes machine learning .

Profil du public cible : Secteur mécatronique Entreprises disposant d'ingénieurs pour maintenir le système informatique opérationnel Entreprises utilisant des machines dans tous les secteurs

Analyse des besoins : L’industrie a de plus en plus besoin du machine learning pour détecter les erreurs des systèmes. En effet, cette technologie devient indispensable pour les industriels, notamment afin d'accroître la productivité et l’efficacité des systèmes industriels. Le programme peut ne pas être aussi rapide et optimisé en espace mémoire que d'autres programmes, nous visons l’efficacité de notre algorithme plutôt que la rapidité.

Description

Fonctionnalités et Solutions adoptées