Python – Base
59718
Initiation aux fonctionnalités spécifiques de Python
Demandeur d’emploi, salarié, entreprise, étudiant, particulier
L’environnement de développement Python / Anaconda / Jupyter Notebook
Les principaux types de données : chaînes, booléennes, nombres, listes, tuples et dictionnaires
Les structures de contrôles : les boucles for et while, le test if/elif/else
Les fonctions : création, passage de paramètres, valeurs par défaut, arguments variables
Numpy : vecteurs, matrices, slicing, concaténation
Pandas : l’analyse de données tabulaires (CSV, Excel), statistiques, pivots, jointures, filtres
Identifier les données textuelles et présentation des librairies spaCy et nltk
Tokenisation des mots
Suppression des stop-words, de la ponctuation et des éléments non essentiels à l’analyse
Lemmatisation vs racinisation (stemming)
Identification de la nature grammaticale des mots à l’aide du Part Of Speech Tagging
Identifier des personnes et lieux avec le Named Entity Recognition
Bag of words
Pondération tf-idf
Approche avec des n-grams
Les embeddings : word2vec, gloVe, fastTesxt
Rappels sur les étapes de construction d’un modèle prédictif
Classification
Analyse de sentiment
Topic modelling
Les techniques de ré-échantillonnage en jeu d’apprentissage, de validation et de test
Test de représentativité des données d’apprentissage.
Mesures de performance des modèles prédictifs
Matrice de confusion