IMA3/IMA4 2020/2022 P5 : Différence entre versions
(→Présentation générale) |
(→Recherche bibliographique) |
||
Ligne 51 : | Ligne 51 : | ||
==Recherche bibliographique== | ==Recherche bibliographique== | ||
− | www.wikipedia.com | + | https://www.wikipedia.com |
− | www.jybaudot.fr | + | https://www.jybaudot.fr |
https://datascientest.com/ | https://datascientest.com/ | ||
− | www.ipgirl.com | + | https://www.ipgirl.com |
Cours de probabilités et statistiques de l’Université Jules Vernes | Cours de probabilités et statistiques de l’Université Jules Vernes | ||
Ligne 75 : | Ligne 75 : | ||
Machine Learning algorithms - Second Edition écrit par Giuseppe Bonaccorso | Machine Learning algorithms - Second Edition écrit par Giuseppe Bonaccorso | ||
− | www.datacamp.com | + | https://www.datacamp.com |
https://towardsdatascience.com/ | https://towardsdatascience.com/ |
Version du 22 octobre 2021 à 11:15
Sommaire
Présentation générale
Contexte
Introduction
L’objectif de ce projet est la mise en place d’algorithmes de machine learning afin de diagnostiquer l’état de machines industrielles. Nous travaillons sur ce projet durant 2 semestres. Durant le premier semestre, nous avions comme objectifs d’acquérir la maîtrise des différentes librairies primordiales pour traiter les données en machine learning, ainsi que d’étudier et d’utiliser certains algorithmes basiques (régression linéaire, logistique, Bayes) sur des datasets que nous traiterons nous même.
Répartition des tâches
Semestre 6
Au début, comme le sujet était flou pour une majorité d’entre nous, nous nous sommes documentés tous ensemble sur différents livres à propos du machine learning et avons compris l’importance des librairies associées au machine learning. Après s’être suffisamment documenté, 3 d’entre nous devaient réaliser un rapport sur les différentes librairies (Numpy pour Loïc, Pandas pour Tom, Seaborn pour Aymen), celui-ci se devait d’être assez explicite afin que les autres n’ayant pas travaillé sur ces librairies puissent acquérir des connaissances facilement en le lisant, Florian et Antoine, quant à eux, se sont occupées d’implémenter et d’analyser une première méthode de machine learning, la régression linéaire, et d’en effectuer un rapport. Ensuite, une partie d’entre nous s’est intéressée à d’autres algorithmes de machine learning (Bayes pour Loïc et régression logistique pour Antoine) tandis que Florian et Tom se sont intéressées à diverses méthodes de pré-traitement de données (méthode SMOTE pour l’oversampling) à appliquer sur une base de données existantes et Aymen s’est occupé de la partie évaluation de l’efficacité d’un algorithme (avec notamment l’importance de la matrice de confusion).
Semestre 7
Cahier des charges
Ressources disponibles :
Livres sur le machine learning
Bases de données (afin d'appliquer divers algorithmes de machine learning) que nous prendrons sur ces sites : https://www.kaggle.com/datasets https://archive.ics.uci.edu/ml/datasets.php
Librairies Python (Scikit-learn, Pandas, Numpy, Seaborn, Matplotlib)
Objectifs poursuivis :
Détecter les dysfonctionnements de systèmes mécatroniques (par exemple les robots Khepera, Robotino…), grâce au machine learning.
Apprendre à implémenter différentes méthodes machine learning .
Profil du public cible :
Secteur mécatronique
Entreprises disposant d'ingénieurs pour maintenir le système informatique opérationnel
Entreprises utilisant des machines dans tous les secteurs
Analyse des besoins :
L’industrie a de plus en plus besoin du machine learning pour détecter les erreurs des systèmes. En effet, cette technologie devient indispensable pour les industriels, notamment afin d'accroître la productivité et l’efficacité des systèmes industriels.
Le programme peut ne pas être aussi rapide et optimisé en espace mémoire que d'autres programmes, nous visons l’efficacité de notre algorithme plutôt que la rapidité.
Recherche bibliographique
Cours de probabilités et statistiques de l’Université Jules Vernes
Chaine youtube Machine Learning : https://www.youtube.com/channel/UCmpptkXu8iIFe6kfDK5o7VQ
Machine Learning with scikit-learn Quick Start Guide écrit par Kevin Jolly
https://archive.ics.uci.edu/ml/datasets.php
https://www.kaggle.com/datasets
Machine Learning algorithms - Second Edition écrit par Giuseppe Bonaccorso
https://towardsdatascience.com/
Rapports et présentation
- Rapport Numpy
- Rapport Pandas
- Rapport Seaborn
- Rapport S6 [1]