Python pour le data scientist - 3e édition
Existe au format livre et ebook
Présentation du livre
Si vous vous intéressez au traitement des données avec le langage Python, cet ouvrage s’adresse à vous. Que vous soyez débutant en Python ou que vous ayez une expérience significative, il vous apportera les clés pour utiliser ce langage en data science.
Ce livre répond à de nombreuses questions sur Python :
- Comment utiliser Python en data science ?
- Comment coder en Python ?
- Comment préparer des données avec Python ?
- Comment créer des visualisations attractives avec Python ?
- Comment appliquer des modèles de machine learning et de deep learning avec Python ?
- Comment passer aux environnements big data ?
Vous apprendrez à tirer parti des multiples outils Python tels que conda, Jupyter, NumPy, Pandas, Matplotlib, Seaborn, Plotly, Dash, Streamlit, Scikit-Learn, TensorFlow, Keras, PySpark... pour mettre en place vos traitements.
Cette troisième édition est complétée et enrichie par des mises à jour de code liées aux évolutions de Python et des packages de data science.
L’ensemble du code compris dans cet ouvrage est disponible sous la forme de notebooks Jupyter dans le repository public de l’auteur : https://github.com/emjako/pythondatascientist
Sommaire de l'ouvrage
Python, ses origines et son environnement. Histoire, origines et évolution : de la naissance à la version 3.12. Python vs R vs le reste du monde. Comment développer en Python ? Les outils pour coder en Python. Les packages pour la data science. Python from scratch. Principes de base. Les interpréteurs : Python et IPython. La base pour commencer à coder. Les structures (tuples, listes, dictionnaires). La programmation (conditions, boucles…). Les fonctions. Les classes et les objets. Les packages et les modules. Aller plus loin. Python et les données (NumPy et Pandas). La donnée à l’ère de la data science. Les arrays de NumPy. Les objets series et dataframe de Pandas. La préparation des données et les premières statistiques. Présentation des données. Les outils pour charger les données. Décrire et transformer des colonnes. Extraire des statistiques descriptives. Utilisation du groupby pour décrire des données. Aller plus loin : accélération. Data visualisation avec Python. Construction de graphiques avec Matplotlib. Seaborn pour des représentations plus élaborées. Quelques bases de cartographie. Les graphiques interactifs avec d’autres packages et outils. Différentes utilisations du machine learning avec Python. Le machine learning, qu'est-ce que c'est ? Comment faire du machine learning avec Python. Le processus de traitement en machine learning. L’apprentissage supervisé avec Scikit-Learn. L’apprentissage non supervisé. L'analyse textuelle avec Python. Le deep learning. Python, et le big dta : tour d'horizon. Est-ce qu'on change tout quand on parle de big data ? Comment traiter de la donnée massive avec Python. Récupérer des données avec Python. Utilisation d'Apache Spark avec PySpark en Python.