• Blog

Maîtriser les Data Sciences avec Python Langage |Partie III

Python Appliqué aux Datasciences !

(242 vues)
Catégorie(s) : Programmation
Niveau :  Intérmédiaire
Editeur(s) : Anaconda
Produit(s) : Jupyter Notebook



Vue d’ensemble

Bien qu’une grande partie de cette formation soit consacrée à vous initier au langage Python en tant que outil de développement,  s'agit plutôt d'aider les utilisateurs de Python à apprendre à utiliser les piles de données informatiques de Python, telles que le noyau interactif IPython notamment dans un contexte Jupyter Notebook où vous  allez découvrir ensemble les divers modes e présentation du code comme les Mark down , les présentations de texte et du code ainsi que les méthodes magiques de Jupyter.

Ou encore l’intégration des modules tel que NumPy, Pandas, Matplotlib, SciPy ainsi que bien d’autres outils associés, pour stocker, manipuler et obtenir des données d’une manière efficace.

Après avoir suivi la première et la deuxième partie de la formation « Les Data sciences ou la science des données avec Python Langage» et apprendre les notions avancée, vous allez entamer dans cette troisième partie Python et les Datascience.

Dans cette partie vous allez découvrir les différentes étapes à travers la quelle passe le montage d’un projet Data science

En commençant par l’acquisition des données où vous allez couvrir pratiquement la totalité des cas et des situations, commençant par la saisie des données à partir des fichiers texte et l’application des expressions régulières avec tous ces détails dans un contexte python pour extraire les informations précises, jusqu’à l’acquisition des données en format audio, audiovisuel ou encore les données issues des capteurs dans le cadre d’emploi des cartes programmables, des systèmes embarqués et Internet Of Things en passant par les SGBD relationnels plus particulièrement SQLite et Oracle 11 g Express Edition et des SGBD No SQL essentiellement MongoDB, la capture des données à partir des images moyennant OCR et sans oublier le système de gestion des flux utilisé principalement dans le monde du Big Data notamment le Spark et  le Web Scrapping.   

En passant par la préparation de ces données à l’exploitation essentiellement à l’aide de Numpy, Cython et Pandas, on va arriver jusqu’à la visualisation de ces données à l’aide du module Matplotlib.

Objectifs

Lors de cette dernière partie de la formation, vous allez :

- Apprendre à utiliser les piles de données informatiques de Python, telles que le noyau interactif IPython notamment dans un contexte Jupyter Notebook

- Découvrir les divers modes de présentation du code comme les Mark down, les présentations de texte et du code ainsi que les méthodes magiques de Jupyter      

- Intégrer des modules tel que NumPy, Pandas, Matplotlib, SciPy ainsi que bien d’autres outils associés, pour stocker, manipuler et obtenir des données d’une manière efficace.

Prérequis

Il faut prendre en considération un certain niveau en termes de Python en tant que langage de développement pour bien continuer.

Il est fortement conseillé de suivre les deux volets précédents de cette même formation.

Public concerné

- Les étudiants : Doctorants et chercheurs

- Les stagiaires et chercheurs d’emploi

- Les ingénieurs et les docteurs 

Plan de la formation

I Chapitre introductif

1.       Présentation-Python appliqué au Data Science

II Chapitre  Acquisition des données

1.       Acquisition des données-Texte et Regex-Partie I

2.         Acquisition des données-Texte et Regex-Partie II

3.         Acquisition des données-Texte et Regex-Partie III

4.         Acquisition des données-Texte et Regex-Partie IV

5.         Acquisition des données-Texte et Regex-Partie V

6.         Acquisition des données-Les fichiers CSV

7.         Acquisition des données-Les fichiers Excels

8.         Acquisition des données-Les bases de données-Partie I

9.         Acquisition des données-Les bases de données-Partie II

10.     Acquisition des données-Les bases de données-Partie III

11.     Acquisition des données-Les bases de données-Partie IV

12.     Acquisition des données-Les bases de données-Partie V

13.     Acquisition des données-Le OCR

14.     Acquisition des données-Le Audio

15.     Aquisition des données-Spark-Introduction

16.     Aquisition des données-Spark-Local

17.     Aquisition des données-Spark-Distant avec Livy

18.     Aquisition des données-Spark-Distant avec Sparkmagic

19.     Acquisition des données-Le Web Scrapping-Quelques Conseils

20.     Acquisition des données-Le Web Scrapping-Quelques démonstrations 

21.     Acquisition des données-Le IOT-Introduction

22.     Acquisition des données-Le IOT-Presentation des outils

III Chapitre Préparation des données

1.         Préparation des données-Introduction

2.         Préparation des données-Premier rappel Statistique

3.         Préparation des donnée-Introduction Numpy-Partie I

4.         Préparation des donnée-Introduction Numpy-Partie II

5.         Préparation des donnée-Introduction Numpy-Partie III

6.         Préparation des donnée-Introduction Numpy-Partie IV

7.         Préparation des donnée-Introduction Pandas  

8.         Préparation des donnée-Exploration des données avec Pandas   

9.         Préparation des données-Validation des données

10.     Préparation des données-Nettoyage des données-Présentation

11.     Préparation des données-Nettoyage des données -Les Missing Values 

12.     Préparation des données-Nettoyage des données -Les Outliers

13.     Préparation des données-Les transformations-Les opérations jointures  

14.     Préparation des données-Nettoyage des données -Le filtrage

15.     Préparation des données-Nettoyage des données -Les Duplicatas

16.     Préparation des données-Les transformations-Les tables Pivos

17.     Préparation des données-Présentation des modules ETL pour automatisation des flux  

18.     Préparation des données-Un deuxième rappel Statistique  

19.     Préparation des données-Présentation de SciPi

IV Chapitre Visualisation des données

1.    Visualisation des données-Matplotlib et Jupyter

V Chapitre Le bilan

1.    Le bilan

Espace dédié à l'échange avec le formateur et entre membres, à propos de la formation. Posez vos questions ici et n'hésitez pas à répondre aux questions des autres membres.

Contenu réservé aux utilisateurs payants.
Passer à une version payante.

Avis des participants

3
Moyenne des votes ( 1 )
5
0
4
0
3
1
2
0
1
0

Avis

Pas de commentaires pour l'instant ... Soyez le premier à le faire !