• Blog

Maîtriser les Data Sciences avec Python Language (Plan Beta)

Créez vos propre modules et packages Python et devenez un programmeur autonome !

(235 vues)
Catégorie(s) : Programmation
Niveau :  Intérmédiaire
Editeur(s) : Anaconda
Produit(s) : Jupyter Notebook



Vue d’ensemble

Lors de diverses interventions, rencontres et réunions consacrées à la technologie, l'une des questions les plus courantes que j'ai personnellement entendues est la suivante: "comment pourrais-je apprendre le python?"

Si vous recherchez un guide sur le langage Python lui-même, vous n’êtes pas obligé d’aller chercher ailleurs!!

Cette formation vidéo propose une revisite des fonctionnalités essentielles du langage Python dans ces deux premières parties tout en respectant le cadre qui est l’application dans un contexte de Datascience. 

Les deux premières parties peuvent être destinées même aux informaticiens déjà familiarisés avec un ou plusieurs autres langages de programmation  indépendamment du thème Data science aussi ainsi que les scientistes qui ont un le sens d’analyse remarquable.

La troisième partie va se concentrer surtout sur les techniques d’acquisition conventionnelle et non conventionnelle des données en vue de préparer le bon terrain de leur analyse et leur présentation au public concerné.

En plus d’avoir une interface interactive utile pour Python je cite le REPL, Ipython ou Interactive Python comme il est prononcé  fournit en plus un certain nombre d’additions syntaxiques utiles au langage.

Nous allons couvrir le plus utile de ces fonctionnalités ici au niveau de cette formation y compris la préparation de l’environnement qui sera essentiellement Jupyter Notebook sous Anaconda 3.

Python devient étroitement lié au projet Jupyter malgré que ce soient deux entités indépendantes en sens du terme, l’avantage que présente Jupyter Notebook c’est qu’il fournit un bloc-notes basé sur un navigateur qui est utile pour le développement, la collaboration, le partage et même la publication des résultats de science des données.

Jupyter Notebook, conçu sous sa forme  en bloc-notes, est en fait un cas particulier de la structure la plus large, qui englobe les blocs-notes pour Julia, R et bien d'autres langages de programmation, vous pouvez même coder en termes de C/C++ dans ce cadre.

En guise d'exemple de l'utilité du format de cahier, ne cherchez pas plus loin que la page que vous lisez, le code source presque entier de cette formation d’ailleurs a été composé sous la forme d'un ensemble de cahiers IPython.

Objectifs

Bien qu’une grande partie de cette formation soit consacrée à vous initier au langage Python en tant que outil de développement,  s'agit plutôt de vous aider à apprendre à :

- Utiliser les piles de données informatiques de Python, telles que le noyau interactif IPython notamment dans un contexte Jupyter Notebook où vous  allez découvrir ensemble les divers modes e présentation du code comme les Mark down , les présentations de texte et du code ainsi que les méthodes magiques de Jupyter.

- Intégrer des modules tel que NumPy, Pandas, Matplotlib, SciPy ainsi que bien d’autres outils associés, pour stocker.

- Manipuler et obtenir des données d’une manière efficace.

Prérequis

Ce cours est conçu pour prendre en considération tous les niveaux y compris les novices en termes de programmation.

Public concerné

- Les étudiants : Doctorants et chercheurs

- Les stagiaires et chercheurs d’emploi

- Les ingénieurs et les docteurs 

Plan de la formation


Chapitre introductif

  1. Introduction de la formation
  2. Ce que vous deviez savoir
  3. Ce que vous deviez avoir

Chapitre Préparation de l’environnement

  1. Installation et configuration Python sous Windows
  2. Configuration Python sous Windows
  3. Installation de Visual Studio Code cas de Windows
  4. Installation de Visual Studio Code cas de Linux
  5. Installation des packages Numpy et Panda
  6. Jupyter notebook comme alternative à VS Code

Chapitre Vos premiers pas avec Python

  1. Les notions basiques
  2. Maîtriser les flux d’exécutions
  3. Maîtriser les listes
  4. Maîtriser les dictionnaires
  5. Maîtriser les itérateurs
  6. Maîtriser les fonctions
  7. Travailler avec les packages
  8. Programmation procédurale vs Programmation Orientée objet
  9. Vos premier pas avec Numpy et Panda

Chapitre Techniques d’acquisition des données

  1. Ce que vous deviez savoir sur l’acquisition des données
  2. Les données issues des fichiers Classeurs
  3. Les données issues des fichiers XML
  4. Les données issues des fichiers Json
  5. Les données issues des fichiers Audio Visuels
  6. Les données issues des fichiers binaires
  7. Les données issues de bases de données relationnelles
  8. Les techniques de Web Scraping avec Python

Chapitre Techniques d’Analyse des données

  1. Les méthodes Lookup avec python
  2. Le Fuzzy Lookup avec Fuzzy Wuzzy
  3. Gérer les cas des données manquantes
  4. Détecter les anomalies des données
  5. La normalisation pour le cas des bases de données relationnelles

Chapitre Techniques de préparation des données

  1. Introduction de Data Wrangling avec Pandas de PyData
  2. Les techniques de manipulation des Tidy Data
  3. Le principe d’enchainement des méthodes
  4. Les techniques de Data Summerization
  5. Les techniques de division des DataSet en Data Frames
  6. La génération de nouvelles colonnes
  7. Formatage des données et manipulation des chaines
  8. Présentation des packages ETL avec Python

Chapitre Techniques de modélisation des données

  1. Introduction des analyses prédictives
  2. Rappel sur les outils statiques
  3. Introduction des models prédictifs
  4. Introduction à la bibliothèque Scikit-Learn
  5. Les méthodes de classification avec Naive Bayes
  6. Les méthodes de classification avec Descision Tree
  7. Les méthodes de classification avec Random Forests
  8. Les techniques de régressions
  9. Les méthodes Gaussiennes

Chapitre Techniques de visualisation des données

  1. Initialisation à la bibliothèque Matplotlib
  2. Initialisation à la bibliothèque Seaborn  
  3. Initialisation à la bibliothèque Geoplotlib pour les cartes graphiques
  4. Data visualisation avec Jupyter

Chapitre Déploiement et maintenance des données

  1. Déploiement pour le cas de Jupyter
  2. Présentation des données entant que service RESTFUL
  3. Techniques de déploiement avec Docker/Kubernetes

 

Espace dédié à l'échange avec le formateur et entre membres, à propos de la formation. Posez vos questions ici et n'hésitez pas à répondre aux questions des autres membres.

Contenu réservé aux utilisateurs payants.
Passer à une version payante.

Avis des participants

4
Moyenne des votes ( 1 )
5
0
4
1
3
0
2
0
1
0

Avis

Pas de commentaires pour l'instant ... Soyez le premier à le faire !