Objectifs
- Maîtriser les techniques de gestion, de nettoyage et de préparation des données.
- Utiliser des outils de versioning pour les données et les modèles.
- Concevoir et implémenter des pipelines d'apprentissage automatique automatisés.
- Maîtriser les stratégies de déploiement des modèles d'apprentissage automatique.
- Intégrer l'IA (notamment IA gen) dans son quotidien de développeur
- Savoir basculer les modèles d'IA Gen en MLOps
- Gestion, traitement et stockage de données complexes (images, textes, sons)
- Maîtrise du prompt engineering pour améliorer la performance des modèles de NLP en production, réduire les coûts d'entrainement
- Déploiement et scalabilité de modèles d'IA génératifs
- Mettre en place des systèmes de surveillance de la performance des modèles en production.
- Communiquer efficacement les résultats et les processus techniques à des non-experts.
- Gérer les aspects de confidentialité et de réglementation des données.
- Adapter les solutions MLOps pour la scalabilité et la gestion des ressources.
- Lister les impacts éthiques, sociaux et environnementaux d'un déploiement massif d'Intelligence Artificielle en entreprise.
Syllabus
Gestion et versioning des données et modèles ( 3 semaines )
- Organiser et gérer de grands ensembles de données pour l'entraînement et la validation.
- Utiliser des outils comme DVC pour versionner les données et les modèles.
- Assurer la traçabilité et la reproductibilité des expériences.
Automatisation des pipelines d'apprentissage automatique ( 4 semaines )
- Concevoir et mettre en œuvre des pipelines automatisés pour l'entraînement, le test et le déploiement des modèles.
- Utiliser des outils comme Jenkins, GitLab CI/CD pour l'automatisation.
- Utiliser des bibliothèques ML ?
- Optimiser les pipelines pour réduire les temps d'exécution.
Déploiement et surveillance des modèles en production ( 3 semaines )
- Déployer des modèles d'IA dans des environnements de production en utilisant des outils comme Docker, Kubernetes.
- Surveiller les performances des modèles en temps réel et déclencher des alertes en cas de dérive.
- Mettre à jour et re-entraîner les modèles en fonction des feedbacks et des nouvelles données.
Collaboration interdisciplinaire ( 2 semaines )
- Travailler en étroite collaboration avec les équipes de data science, de développement et d'opérations.
- Faciliter la communication entre les équipes pour assurer une mise en œuvre fluide du MLOps.
- Résoudre les conflits et les défis techniques en collaboration avec les parties prenantes.
Sécurité et conformité des pipelines MLOps ( 2 semaines )
- Assurer la sécurité des données et des modèles tout au long du pipeline.
- Mettre en place des protocoles pour garantir la confidentialité et la conformité réglementaire.
- Effectuer des audits réguliers pour détecter et corriger les vulnérabilités.
Optimisation continue et scalabilité ( 2 semaines )
- Évaluer et améliorer continuellement les performances des pipelines.
- Adapter les solutions MLOps à la croissance et à l'évolution des besoins.
- Intégrer de nouvelles technologies et méthodologies pour rester à la pointe du domaine.
Comment ?
Méthodes pédagogiques
1 poste par stagiaire
Remise d'un support pédagogique (numérique ou papier) pendant la formation
La formation est constituée d'apports théoriques, d'exercices pratiques, de réflexions et de retours d'expérience
********************
Formation distancielle, synchrone, avec le formateur en visioconférence
Partage d'écran formateur et stagiaire pour les présentations, démonstrations et vérification des mises en application
Un support technique accompagne la préparation et le suivi du parcours d'apprentissage
Séquençage pédagogique construit et adapté au mode d'organisation distanciel
Remise d'une documentation pédagogique numérique pendant le stage
La formation est constituée d'apports théoriques, d'exercices pratiques, de réflexions et de retours d'expérience
Évaluation
Auto-évaluation des acquis par le stagiaire via un questionnaire en ligne
Attestation de fin de stage remise au stagiaire
***************
Évaluation du formateur au fil des séquences pédagogiques.
Auto-évaluation des acquis par le stagiaire via un questionnaire en ligne
Attestation de fin de stage remise au stagiaire
Participez à la prochaine session !
S'inscrireAdmission
A qui s’adresse cette formation
Cette formation s'adresse aux :
1. **Ingénieurs en apprentissage automatique (Machine Learning Engineers)** :
2. **Ingénieurs DevOps** :
3. **Data Scientists** :
4. **Ingénieurs en données (Data Engineers)** :
5. **Architectes de solutions** :
6. **Gestionnaires de projets et responsables techniques** :
7. **Développeurs de logiciels** :
8. **Administrateurs système et Cloud** :
Prérequis
- Maîtrise d'au moins un langage de programmation pertinent pour le domaine de la data science, comme Python, R ou Java.
- Connaissance des bibliothèques ML telles que TensorFlow, PyTorch, Scikit-learn, LightGBM...
- Expérience avec des outils d'analyse de données comme Pandas, NumPy, ou équivalents.
- Familiarité avec les concepts de base de l'apprentissage supervisé et non supervisé.
- Compréhension des principes de base de la gestion de bases de données, y compris SQL.
- Familiarité avec les principes et les pratiques de DevOps, (ex : intégration, livraison et déploiement continus, gestion de la configuration, et monitoring)
- Compréhension d'au moins une infrastructure cloud (AWS, GCP, Azur)
- Notion de sécurité et conformité IT ?
- Compétences en gestion de projet et première expérience de collaboration Data Science, IT et métier
- Ouverture d'esprit sur de nouvelles pratiques IT
NB : Ces pré-requis peuvent être obtenus ou renforcés au travers des formations d'expertise LePont (www.lepont-learning.com)
Coût de la formation
Frais pédagogiques
6500€ HT
Tarif Inter-entreprise par personne
Aides au financement
Des dispositifs variés et aides au fnancement existent. N’hésitez pas à nous constulter pour en savoir plus.
En savoir plus sur les dispositifs de financement.