Pandas est une bibliothèque Python spécialisée conçue pour améliorer l'efficacité de l'analyse de grands ensembles de données. Son utilisation facilite la réalisation de projets d'analyse de données complexes et variés, en accélérant et en simplifiant le traitement des données.
Initiation aux principales bibliothèques Python de Data Science tels que : Pandas, Numpy, Matplotlib, Scikit-learn.
Introduction à Pandas pour l'analyse de données :
- Les notions de Series et DataFrame
- Importer et exporter des jeux de données avec Pandas de multiples formats (e.g. csv, excel, html...)
- Trier des données
- Manipulations avancées avec Pandas (e.g. groupby, join)
- Visualisation basique