Formation métier : Data Scientist

La mission d'un data scientist ou data miner consiste à valoriser et exploiter les données afin de répondre à une problématique métier.  Son rôle consiste à manipuler, explorer et analyser les données pour en extraire la connaissance clef pour la réussite de l'entreprise.

Ce cursus a pour objectif de former de façon très opérationnelle des data scientists afin de répondre à une demande de plus en plus croissante sur le marché de l'emploi. Le cursus de formation Data Scientist permet d'avoir une bonne culture générale concernant le Big Data et l'environnement Hadoop et présente les objectifs suivants :

  1. Consolider la compétence statistique et data mining pour analyser les données et construire des modèles prédictifs.
  2. Comprendre la logique de l'analyse du texte " Text Mining " et combiner les connaissances acquises à partir de données textuelles avec des données structurées
  3. Acquérir la compétence sur les logiciels d'analyse prédictive de IBM SPSS tels qu'IBM SPSS Modeler, IBM SPSS Statistics, IBM SPSS Text Analytics
  4. cquérir une culture générale de l'environnement Big Data : Hadoop, Map Reduce, bases de données NOSQL, Spark et les langages de programmation R et Python.
36 jours de formation + 15 jours de travaux pratiques
Durée totale : 51 jours soit 357 heures
Démarrage de la prochaine session : le 16 janvier 2018

Pour connaître les modalités de réalisation de la formation Data Scientist et de son financement, écrivez à metier@globalknowledge.fr.

Les qualités requises d'un data scientist :

  • Une forte compétence en statistique et data mining
  • La maîtrise d'au moins un logiciel de data mining reconnu sur le marché
  • Une bonne culture informatique qui lui permet de collaborer avec le service informatique de l'entreprise pour trouver et fédérer les sources de données nécessaires à son métier
  • Une culture métier et un bon sens de la communication pour échanger avec le business et savoir restituer les résultats

Public concerné par le rôle de Data Scientist :

Toute personne technique ayant une formation initiale scientifique (au moins Bac + 4) et qui a une appétence pour l'analyse des données et l'informatique 

  • Niveau au moins Bac+4  scientifique ou technique de préférence Mathématiques, Informatique ou  Physique, Biologie, etc.
  • Rigueur du raisonnement logique, faculté d'analyse, esprit de synthèse, sens de l'organisation
  • Etre à l'aise avec l'environnement Windows 

Méthodes et moyens pédagogiques du parcours Data Scientist

Méthodes pédagogiques

Ce parcours de formation comporte :

  • Un rappel opérationnel de la logique et des concepts fondamentaux et de la statistique avec des exemples d'application sur des jeux de données marketing, risque bancaire. Le participant analysera les données en utilisant IBM SPSS Statistics, IBM SPSS Modeler et des programmes R.
  • Une revue des principaux modèles statistiques et automatiques " Machine learning " qui sont utilisés dans les projets de data mining et Big Data. Ces modèles sont mis en application sur des jeux de données marketing, risque bancaire et maintenance prédictive avec le logiciel IBM SPSS Modeler et avec des programmes R.

Le cursus de cette filière est composé d'une alternance :

  • D'exposés théoriques
  • De démonstrations sur les logiciels IBM SPSS Modeler et sur R avec des exemples de jeux de données de différents domaines d'activité : Marketing, bancaire, médical, industriel
  • De travaux dirigés avec des exemples de jeux de données de différents domaines d'activité : Marketing, bancaire, médical, industriel 

Moyens pédagogiques

Pour ce faire, durant le cursus chaque stagiaire aura à sa disposition :

  • Des supports de cours reprenant la théorie abordée durant les exposés (supports officiels éditeurs/constructeurs et supports officiels Global Knowledge) ainsi que des cahiers d’exercices
  • Un ordinateur et un accès à Internet lui permettant d’accéder aux environnements virtuels et/ou distants nécessaires à la réalisation des travaux dirigés et des travaux pratiques

Les exposés théoriques seront menés par des formateurs experts ayant une expérience métier en consulting et traitement des données ainsi que les certifications techniques se référant aux sujets traités.

Programme de formation Data Scientist

Le  métier de Data Scientist
Introduction au Big Data : Hadoop
La visualisation des données
Les fondamentaux de l'analyse statistique et Machine Learning
Les bases du SQL
Introduction à l'analyse statistique avec R
Introduction au langage Python pour l'analyse statistique
Introduction à Spark
Introduction à IBM SPSS Statistics
IBM SPSS Statistics : traitement et gestion des données
Introduction à l'analyse statistique avec IBM SPSS Statistics
Construction de typologies
Modèle linéaire : régression et analyse de la variance
Introduction à IBM SPSS Modeler et au Data Mining
Préparation des données avec IBM SPSS Modeler - cours avancé
IBM SPSS Modeler : segmentation clients
IBM SPSS Modeler : modèles pour cible quantitative
Modèles prédictifs avancés et Machine learning
Automated Data Mining with IBM SPSS Modeler
Construction de typologie et modèles d'association avec IBM SPSS Modeler
Séries temporelles

Travaux Pratiques

  • Cas d'usage en marketing
  • Cas d'usage en telécommunication
  • Cas d'usage en risque bancaire
  • Cas d'usage en maintenance prédictive

Certification associée à ce cursus

Suite à ce cursus, les candidats pourront prétendre aux titres de certification IBM suivants :

  • IBM Certified Associate - SPSS Modeler Data Analysis
  • IBM Certified Associate - SPSS Modeler Data Mining
  • IBM Certified Specialist - SPSS Modeler Professional   

Ces certifications IBM sont reconnues sur le marché du data mining. Elles prouvent que le candidat dispose des compétences en statistique et data mining nécessaires pour mener à bien un projet avec IBM SPSS Modeler ou IBM SPSS Statistics. Toutes les SSII en informatique qui sont partenaires IBM doivent posséder dans leurs équipes des consultants certifiés IBM SPSS. NB : la présentation aux examens n'est toutefois pas prévue durant parcours de formation.

Pour connaître les modalités de réalisation de la formation Data Scientist et de son financement, écrivez à metier@globalknowledge.fr.