IMA3/IMA4 2020/2022 P5 : Différence entre versions

De Wiki de Projets IMA
(Recherche bibliographique)
(Rapports et présentation)
Ligne 83 : Ligne 83 :
 
==Rapports et présentation==
 
==Rapports et présentation==
  
- Rapport Numpy
+
===Librairies===
  
- Rapport Pandas
+
- Rapport Numpy [https://colab.research.google.com/drive/1CQZ1s6fNY_6MsmbBa5TP1OzSedqFeaWI?usp=sharing/ Rapport Numpy]
  
- Rapport Seaborn
+
- Rapport Pandas [https://colab.research.google.com/drive/1tdu_B2wRsUiqdnSeskQENdn_wX3pJMeT?usp=sharing/ Rapport Pandas]
  
- Rapport S6 [https://docs.google.com/document/d/1yR0vLePV3hI1_HVtTZWwGIwy0Cb-oLOsOTK3Um5KAYE/edit?usp=sharing]
+
- [https://colab.research.google.com/drive/1DPS4ZT91SIEhscwST8kfER7u21tKoM3a?usp=sharing/ Rapport Seaborn]
 +
 
 +
===S6===
 +
 
 +
- [https://docs.google.com/document/d/1yR0vLePV3hI1_HVtTZWwGIwy0Cb-oLOsOTK3Um5KAYE/edit?usp=sharing/ Rapport S6]
 +
 
 +
- [https://docs.google.com/presentation/d/1Je_yF0dgc-s9gB7LLsfOg0b05xcwIFJbaqpVytxWv5A/edit?usp=sharing/ Présentation S6]
 +
 
 +
- [https://colab.research.google.com/drive/1bRyrnL1JM870cEcEvfGaS8ItrG16rchy?usp=sharing/ Google Colab]
  
 
==Fonctionnalités et Solutions adoptées==
 
==Fonctionnalités et Solutions adoptées==

Version du 22 octobre 2021 à 11:20

Présentation générale

Contexte

Introduction

L’objectif de ce projet est la mise en place d’algorithmes de machine learning afin de diagnostiquer l’état de machines industrielles. Nous travaillons sur ce projet durant 2 semestres. Durant le premier semestre, nous avions comme objectifs d’acquérir la maîtrise des différentes librairies primordiales pour traiter les données en machine learning, ainsi que d’étudier et d’utiliser certains algorithmes basiques (régression linéaire, logistique, Bayes) sur des datasets que nous traiterons nous même.

Répartition des tâches

Semestre 6

Au début, comme le sujet était flou pour une majorité d’entre nous, nous nous sommes documentés tous ensemble sur différents livres à propos du machine learning et avons compris l’importance des librairies associées au machine learning. Après s’être suffisamment documenté, 3 d’entre nous devaient réaliser un rapport sur les différentes librairies (Numpy pour Loïc, Pandas pour Tom, Seaborn pour Aymen), celui-ci se devait d’être assez explicite afin que les autres n’ayant pas travaillé sur ces librairies puissent acquérir des connaissances facilement en le lisant, Florian et Antoine, quant à eux, se sont occupées d’implémenter et d’analyser une première méthode de machine learning, la régression linéaire, et d’en effectuer un rapport. Ensuite, une partie d’entre nous s’est intéressée à d’autres algorithmes de machine learning (Bayes pour Loïc et régression logistique pour Antoine) tandis que Florian et Tom se sont intéressées à diverses méthodes de pré-traitement de données (méthode SMOTE pour l’oversampling) à appliquer sur une base de données existantes et Aymen s’est occupé de la partie évaluation de l’efficacité d’un algorithme (avec notamment l’importance de la matrice de confusion).

Semestre 7

Cahier des charges

Ressources disponibles :

Livres sur le machine learning

Bases de données (afin d'appliquer divers algorithmes de machine learning) que nous prendrons sur ces sites : https://www.kaggle.com/datasets https://archive.ics.uci.edu/ml/datasets.php

Librairies Python (Scikit-learn, Pandas, Numpy, Seaborn, Matplotlib)

Objectifs poursuivis :

Détecter les dysfonctionnements de systèmes mécatroniques (par exemple les robots Khepera, Robotino…), grâce au machine learning.

Apprendre à implémenter différentes méthodes machine learning .

Profil du public cible :

Secteur mécatronique

Entreprises disposant d'ingénieurs pour maintenir le système informatique opérationnel

Entreprises utilisant des machines dans tous les secteurs

Analyse des besoins :

L’industrie a de plus en plus besoin du machine learning pour détecter les erreurs des systèmes. En effet, cette technologie devient indispensable pour les industriels, notamment afin d'accroître la productivité et l’efficacité des systèmes industriels.

Le programme peut ne pas être aussi rapide et optimisé en espace mémoire que d'autres programmes, nous visons l’efficacité de notre algorithme plutôt que la rapidité.

Recherche bibliographique

https://www.wikipedia.com

https://www.jybaudot.fr

https://datascientest.com/

https://www.ipgirl.com

Cours de probabilités et statistiques de l’Université Jules Vernes

Chaine youtube Machine Learning : https://www.youtube.com/channel/UCmpptkXu8iIFe6kfDK5o7VQ

Machine Learning with scikit-learn Quick Start Guide écrit par Kevin Jolly

https://lucidar.me/

https://archive.ics.uci.edu/ml/datasets.php

https://www.kaggle.com/datasets

https://www.datacamp.com/

Machine Learning algorithms - Second Edition écrit par Giuseppe Bonaccorso

https://www.datacamp.com

https://towardsdatascience.com/

https://www.learndatasci.com/

Rapports et présentation

Librairies

- Rapport Numpy Rapport Numpy

- Rapport Pandas Rapport Pandas

- Rapport Seaborn

S6

- Rapport S6

- Présentation S6

- Google Colab

Fonctionnalités et Solutions adoptées