Objectifs
Savoir installer, configurer, Dataiku DSS, l'utiliser depuis l'interface web ou des API.Syllabus
Présentation, concepts DSS
- Fonctionnalités :
- Mise à disposition des méthodes et outils de data-sciences à partir d'une interface graphique ou de langages de requêtage ou de programmation (Python, SQL, R)
- Notions de projet, data, dataset, recipes
- Premiers pas avec Dataiku DSS : exemples
Connexion aux données
- Connecteurs disponibles, formats de fichiers, formats spécifiques hadoop/Spark
- Chargement des fichiers, emplacement des fichiers,
- Système de fichiers, HDFS, Amazon S3, stockage Google Cloud, etc ...
- FTP, connexion ssh, connexion aux bases de données SQL
- Autres stockages : Cassandra, MongoDB, Elasticsearch, ...
Préparation des données
- Scripts de préparation, échantillonnage, exécution,
- les différents moteurs d'exécution: DSS, Spark, base de données SQL, , Spark
Graphiques et statistiques
- Présentation des types de graphiques disponibles et configuration
- Echantillonnage et exécution,
- graphiques de base, tables, nuages de points,
- visualisation cartographique, etc ...
- Réalisation d'exercices pratiques.
- Fonctionnalités statistiques disponibles,
- démonstrations
Machine learning
- Fonctionnalités disponibles :
- apprentissage supervisé et non supervisé,
- algorithmes utilisés, scoring, deep learning, optimisation de modèles, ...
Flow/Recipes
- Interface graphique de gestion des flux de traitement,des datasets, traitements, paramètrage de l'exécution en parallèle, des données géographiques,
- export des données, génération d'images, etc ...
- Travaux pratiques
Interfaces de programmation
- Présentation des différentes interfaces : SQL, Python, R
- Exemples d'interrogations SQL et Python
- Interfaçage avec Spark
Comment ?
Méthodes pédagogiques
1 poste et 1 support par stagiaire
8 à 10 stagiaires par salle
Remise d'une documentation pédagogique papier ou numérique pendant le stage
La formation est constituée d'apports théoriques, d'exercices pratiques, de réflexions et de retours d'expérience
Moyens pédagogiques
Test case moyen pédagogiques pour voirÉvaluation
Auto-évaluation des acquis par le stagiaire via un questionnaire en ligne
Attestation de fin de stage remise au stagiaire
Participez à la prochaine session !
S'inscrireAdmission
A qui s’adresse cette formation
Chefs de projet, développeurs, data-scientists, utilisateurs de Dataiku DSS
Prérequis
Connaissance d'un langage de programmation comme python et des principes de base de la manipulation de données et du machine learning.
Coût de la formation
Frais pédagogiques
1410€ HT
Tarif Inter-entreprise par personne
Aides au financement
Des dispositifs variés et aides au fnancement existent. N’hésitez pas à nous constulter pour en savoir plus.
En savoir plus sur les dispositifs de financement.