Skip to content

Latest commit

 

History

History
25 lines (22 loc) · 1.61 KB

File metadata and controls

25 lines (22 loc) · 1.61 KB

Introduction

L'objectif de ce lab est de définir les sources que nous allons utiliser dans notre projet. Pour ce faire, nous allons simuler trois sources de données :

  • Transactions : des données qu'une autre équipe ou un partenaire nous a partagées (la table transactions).
  • Customers : une table alimentée par un flux dans notre dataplateform (la table customers).
  • Products : une table que nous allons charger depuis un stockage (la table products).
  • Address : une table que nous allons charger depuis un stockage (la table address).

Les objectifs du lab sont :

  1. Créer la source transactions : se baser sur la table transactions définie dans formation-dataform.raw_data.transactions.
  2. Créer la table customers : l'alimenter avec les données du fichier customers.csv.
    1. télécharger le fichier cutomers.csv en local
    2. dans bigquery créer une dataset, par exemple lab2
    3. dans la dataset lab2 créer une table
    4. choisir upload et récupérer le fichier depuis le local
  3. Créer la table products : charger les données depuis le fichier products.csv.
    1. télécharger le fichier products.csv.
    2. créez une bucket gcs
    3. mettre le fichier products.csv.dans le bucket
    4. créer la table productsdepuis le fichier products.csv en utilisant une operation dataform
  4. Créer la table address : charger les données depuis le fichier address.csv.
    1. télécharger le fichier address.csv.
    2. ajouter le fichier dans le bucket déjà créé
    3. créer la table addressdepuis le fichier address.csv en utilisant une operation dataform