Python – Base
51862
Initiation aux fonctionnalités spécifiques de Python
Demandeur d’emploi, salarié, entreprise, étudiant, particulier
L’environnement de développement Python / Anaconda / Jupyter Notebook
Pandas : l’analyse de données tabulaires (CSV, Excel), statistiques, pivots, jointures et filtres
Traitement des valeurs manquantes : imputation par la moyenne, médiane, interpolation, knn
Traitement des Outliers : analyse graphique, méthode de l’IQR, Z-score
Standardisation
Normalisation : Skewness et Kurtosis
Données non balancées : Undersampling, Oversampling, SMOTE
Modèles d’apprentissage supervisés et non-supervisés les plus courants
Entraînement de modèles avec Scikit-learn
Méthodes d’évaluations : savoir choisir les bonnes métriques pour chaque problématique
Présentation des librairies Optuna et Hyperopt
Présentation de l’approche Grid Search pour identifier les meilleurs hyper paramètres d’un modèle
Log des hyper paramètres et des performances dans Mlflow
Intérêt de vérifier le modèle Drift et le Data Drift
Présentation des librairies Evidently et Streamlit
Présentation du service AWS EC2
Présentation de Flask pour la mise à disposition d’un modèle de machine learning par le biais d’une API
Présentation de divers outils de connexion à l’environnement virtuel tels que Putty et Visual Studio Code
Déploiement du code par le biais de GitHub