6 février 2026 – 12 mars 2026 · Travail en équipe de 4 personnes
- Collecte automatique de données web sur les commerces parisiens à partir de la base BCOM2023 de l'APUR (Atelier Parisien d'Urbanisme)
- Récupération des coordonnées GPS (latitude, longitude) via l'API gouvernementale adresse.data.gouv.fr
- Recherche automatisée de sites web et de présences sur des plateformes de livraison (UberEats, Deliveroo...) pour chaque commerce
- Développement d'un script Python structuré (notebook .ipynb) intégrant requêtes API, parsing de données et enrichissement de la base initiale
Source des données
BCOM2023 - APUR - API adresse.data.gouv.fr
Livrables
Script Python / Notebook .ipynb
Python
Pandas
Requests
API REST
31 janvier 2026 – 6 mars 2026 · Projet en binôme
- Analyse d'un projet de croisement de données RH (badgeage, MyTime, données personnelles) au regard des grands principes du RGPD
- Identification des points de non-conformité : absence de transparence, données sensibles (situation maritale, santé, garde d'enfants), finalité détournée
- Rédaction d'une grille d'analyse structurée avec check-list des obligations RGPD, manquements relevés et mesures correctrices proposées
- Soutenance orale de 10 à 15 minutes avec argumentation critique des conclusions
Thématique
RGPD · Éthique des données
Livrables
Grille d'analyse
RGPD
Analyse de conformité
4 février 2026 – 20 février 2026 · Travail en équipe de 3 personnes
- Analyse des risques cardiaques à partir d'un dataset Kaggle : exploration statistique, identification des variables explicatives
- Nettoyage et préparation des données avec Power Query : gestion des valeurs manquantes, normalisation, création de colonnes calculées
- Conception d'un dashboard interactif sous Power BI permettant la visualisation des tendances et des facteurs de risque
- Présentation des résultats et recommandations à l'équipe pédagogique
Source des données
Dataset Kaggle "Heart disease"
Livrables
Rapport PowerBI et soutenance orale (powerpoint)
Power BI
Power Query
Kaggle
DAX
9 janvier 2026 · Projet en binôme
- Analyse d'une série temporelle de production d'électricité (2001-2024) issue des données de l'EIA (Administration américaine d'information sur l'énergie)
- Mise en évidence de la tendance par filtre de moyennes mobiles et régression des moyennes annuelles
- Calcul et représentation des coefficients saisonniers, décomposition de la série et analyse des résidus
- Prévision de la production 2025 par trois méthodes différentes, avec calcul de l'erreur quadratique moyenne sur 2024 pour comparer les approches
- Rédaction d'un rapport synthétique (10-12 pages) en français avec résumé en anglais
Source des données
EIA - données mensuelles 2001-2024
Méthodes
Moyennes mobiles · Régression · Prévision
Livrables
Rapport écrit · Résumé en anglais
R Studio
Séries temporelles
Statistiques
Prévision
14 – 19 janvier 2025 · Travail en équipe de 3 personnes
- Analyse d'une base de données clients et locations de DVD pour extraire des indicateurs clés : fréquence, montant moyen dépensé, périodes d'affluence
- Requêtage SQL pour l'extraction et la structuration des données issues de la base
- Création de graphiques et visualisations sur Excel pour illustrer les tendances et faciliter l'interprétation
- Formulation de préconisations stratégiques basées sur les analyses pour déterminer l'implantation optimale d'un vidéo-club
Problématique
Implantation d'un vidéo-club
Livrables
Fichier excel et rapport écrit
SQL
Excel