Skip to content

Latest commit

 

History

History
62 lines (43 loc) · 1.65 KB

File metadata and controls

62 lines (43 loc) · 1.65 KB

Digiciomp PYDATA

Objectifs

  • Approfondir ses connaissances en Python.
  • Apprendre à utiliser les modules d'analyse statistique de Python.
  • Acquérir les connaissances nécessaires à l'analyse de données et à la représentation graphique des résultats.
  • Apprendre à utiliser les Jupyter Notebooks pour la présentation et le partage des analyses.

Contenu

Programmation fonctionnelle

  • Expressions lambda
  • List comprehension

Jupyter Notebook

  • Fonctionnement local, serveur
  • Interface et commandes

NumPy

  • Création et manipulation de tableaux et matrices NumPy
  • Indexation et sélection
  • Manipulations arithmétiques, broadcasting
  • Fonctions statistiques

Pandas

  • Structures de données (Series, DataFrame, Panel)
  • Indexation et sélection
  • Fonctions statistiques
  • Combinaison des données (concat, append, merge, join)
  • Fenêtrage
  • Groupement et agrégation
  • Données temporelles
  • Chargement et sauvegarde des données

Traitement des principaux formats de fichiers

  • Excel, CSV, XML, JSON
  • Requêtes SQL avec Pandas

Préparation et nettoyage des données

  • Traitement des données manquantes
  • Combinaison et transformation de données
  • Agrégation et regroupement de données
  • Traitement des données temporelles

Visualisation avec Matplotlib, Seaborn et Plotly

  • Types de graphiques : ligne, point, histogramme, bar, pie, ...
  • Label, légende, grille, axes, titre
  • Sauvegarde des graphiques
  • Visualisation avec Seaborn
  • Visualisation web interactive avec Plotly

Exemple d'analyse de données financières

Introduction au Machine Learning