Introduction aux modèles statistiques scalables
Modélisation, nouveaux paradigmes, écosystème “Big Data”
Date & lieu : lundi 5 décembre 2016 à l’Institut Henri Poincaré (IHP)
Deadline inscription : 15 octobre 2016
Seulement 20 places disponibles – Programme Tarif S’inscrire directement
Cette formation, proposée par le groupe DMA (Data Mining et Apprentissage) de la Société Française de Statistique se déroulera
à l’IHP Salle 201 (2ème étage)
Institut Henri Poincaré
11 rue Pierre et Marie Curie 75005 Paris
Accès : RER ligne B station : Luxembourg
Bus : 21, 27, 38, 84, 85, 89
Programme Tarif S’inscrire directement
Cette formation est pour vous si …
- Vous êtes un “data scientist” avec une expérience dans la modélisation des données, le data mining, l’apprentissage statistique, business intelligence, ou vous avez une expérience dans la chaîne de traitement traditionnel des données.
- Vous êtes un ingénieur ayant une expérience dans les architectures et solutions Scala, Java, Python ou R et vous avez besoin d’intégrer les technologies évolutives dans l’architecture de votre entreprise
À la fin de cette formation, vous aurez une solide compréhension de :
- Comment modéliser et développer des modèles statistiques scalables dans l’écosystème Big Data dans votre laboratoire ou en entreprise avec des outils qui vous permettront de se concentrer sur la phase modélisation
- Comment ingérer et traiter de multiples flux de données
- Comment construire une chaîne rigoureuse de traitement statistique de données massives
Programme Tarif S’inscrire directement
Formateurs
Andy Petrella, Data-Fellas
Xavier Tordoir, Data-Fellas
Quelques références internationales sur les formateurs et la formation
http://www.oreilly.com/online-training/building-distributed-pipelines-for-data-science.html
http://www.oreilly.com/online-training/building-distributed-pipelines-for-data-science.html
http://conferences.oreilly.com/strata/hadoop-big-data-eu/public/schedule/speaker/204775
http://cfp.devoxx.fr/2016/speaker/andy_petrella.htm
La formation sera donnée en français. Une image vous sera donnée à installer avec docker (prévoir docker sur votre PC)
09:00 : Accueil café
09:30 – 11:00 : Introduction à Spark, Spark-Notebook, et l’écosystème Bigdata
11:00 – 12:00 : Apprentissage automatique local vs massivement distribué (scalable)
12:00 – 13:00 Déjeuner
13:00 – 13:30 : Scala et Data Science
13:30 – 14:30 : De RDD à Dataset par DataFrame
14:30 – 15:30 : Streaming: du Micro Batching au Structured Stream
15:30 – 16:30 : Écrire un programme en apprentissage distribué
16:30 : Discussion clôture
Organisateurs
Christophe Biernacki, Université Lille1 – INRIA
Mustapha Lebbah, LIPN, Université Paris 13
● Tarif entreprise : 600 euros
● Tarif universitaire: 300 euros
Seulement 20 places disponibles : inscrivez-vous maintenant
Conditions et modalités d’inscriptions
Modalités d’inscription
Cliquez ici pour vous inscrire
Plus d’informations : https://bigdata-stat.sciencesconf.org
Préparer votre rentrée avec BigDataFr