COURS BIG DATA – INTRODUCTION
1. QU’EST-CE QUE LE BIG DATA ?
Le Big Data désigne des ensembles de données tellement volumineux qu’ils ne peuvent pas être traités par des outils traditionnels.
Exemple concret :
Une base de données Excel ne peut pas gérer 1 milliard de lignes
Le Big Data permet de traiter ces volumes massifs
2. LES 5 CARACTÉRISTIQUES (LES 5V)
Volume : Quantité énorme de données (téraoctets, pétaoctets)
Vélocité : Vitesse de génération et de traitement des données
Variété : Différents types de données (textes, images, vidéos)
Véracité : Fiabilité et qualité des données
Valeur : Utilité des données pour l’entreprise
3. TYPES DE DONNÉES
Données structurées : Tables, Excel, bases SQL
Données semi-structurées : JSON, XML, HTML
Données non structurées : Images, vidéos, emails, PDF
4. POURQUOI LE BIG DATA EST IMPORTANT ?
Aide à la décision : Mieux comprendre ses clients
Innovation : Créer de nouveaux services
Efficacité : Optimiser les processus
Compétitivité : Prendre l’avantage sur ses concurrents

5. EXEMPLES D’UTILISATION
Amazon : Recommandations de produits personnalisées
Netflix : Suggestions de films adaptées à vos goûts
Uber : Tarification dynamique et optimisation des trajets
Météo France : Prévisions météorologiques plus précises
6. TECHNOLOGIES COURANTES
Stockage : Hadoop HDFS
Traitement : Apache Spark
Bases de données : MongoDB, Cassandra
Cloud : AWS, Google Cloud, Azure
7. MÉTIERS DU BIG DATA
Data Engineer : Construit l’infrastructure
Data Scientist : Analyse les données et crée des modèles
Data Analyst : Interprète les résultats et crée des rapports
8. DÉFIS À RELEVER
Coût : Infrastructure onéreuse
Sécurité : Protection des données sensibles
Compétences : Besoin de personnel qualifié
Qualité : Garantir des données fiables
