Python – Base
81881
Initiation aux fonctionnalités spécifiques de Python
Demandeur d’emploi, salarié, entreprise, étudiant, particulier
Panorama de l’écosystème scientifique de Python : les librairies incontournables
Savoir où trouver de nouvelles librairies et juger de leur pérennité
Les principaux outils et logiciels open source pour la data science
Le socle scientifique Python : la SciPy Stack
Les bonnes pratiques pour bien démarrer votre projet de data science avec Python
Les formats de fichiers scientifiques et les librairies pour les manipuler
Pandas : l’analyse de données tabulaires (fichiers csv, excel), statistiques, pivots, filtres et recherche
Numpy : calcul numérique et algèbre linéaire (les vecteurs, matrices, images)
L’extraction des données, la préparation et le nettoyage
Les étapes de construction d’un modèle
Les algorithmes supervisés et non supervisés
Le choix entre la régression et la classification
Les techniques de ré-échantillonnage en jeu d’apprentissage, de validation et de test
Test de représentativité des données d’apprentissage
Mesures de performance des modèles prédictifs
Matrice de confusion, de coût et la courbe ROC et AUC
Le principe de régression linéaire univariée
La régression multivariée
La régression polynomiale
La régression régularisée
Le Naive Bayes
La régression logistique
Le clustering hiérarchique
Le clustering non hiérarchique
Les approches mixtes