Me cultiver

Faîtes le plein d'inspiration sur les domaines de la Data et de l'IA

Je m'abonne
Accueil   >   Blog   >   Pourquoi se former à Informatica PowerCenter

Pourquoi se former à Informatica PowerCenter

Outils et Technologies

Disposer d’une vision globale et instantanée de la performance des activités de l’entreprise est devenu un impératif dans un contexte aussi concurrentiel qu’instable. Mais la richesse et la variété des données dont le traitement est nécessaire pour atteindre cet objectif rendent cet exercice particulièrement délicat et complexe… à moins de disposer d’outils adéquats. Avec PowerCenter, Informatica propose une solution qui permet d’intégrer puis de restituer instantanément les données issues de différents systèmes professionnels. Mokhtar, notre formateur sur Informatica PowerCenter nous présente cet outil et les points clés de la formation qu’il dispense.

Bonjour Mokhtar, peux-tu te présenter ?

Mokhtar : Après un diplôme d’ingénieur et un DEA en informatique et système d’information, j’ai commencé ma carrière chez Axa en tant que développeur informatique, puis chez EDF, en tant que chef de projet informatique. En 2008 je suis rentré chez Groupama sur des postes de responsable d’activité informatique pour devenir aujourd’hui Expert ETL Informatica PowerCenter. J’ai également un diplôme de formateur et depuis 2013, je donne des formations chez LePont donc ça fait aujourd’hui dix ans !

Pourquoi t’es-tu formé à Informatica au départ ?

Mokhtar : C’est un ancien collègue qui m’a parlé en premier de « cet outil qui arrive sur le marché et qui va exploser ». A cette époque, l’outil n’était pas bien connu, moi je travaillais chez AXA en prestations et j’ai demandé autour de moi si d’autres sociétés utilisaient Informatica pour me faire la main sur l’outil. Donc concrètement, je travaille sur Informatica depuis 2002.

Mais déjà qu’est-ce qu’un ETL ?

Mokhtar : Informatica est un ETL, qui vient de l’anglais : extraction, transformation loading.

En résumé :

  • On extrait des données, soit des fichiers plats, soit des bases de données. Si vous connaissez un peu informatique des tables dans l’outil.
  • Puis on effectue des transformations par rapport aux besoins de l’entreprise, par rapport aux règles de gestion.
  • Et une fois les transformations effectuées, on les charge.

Quelles différences entre ETL et Entrepôt de données ?

Mokhtar : L’ETL, ce n’est pas lui qui stocke les données. Les données sont stockées dans des bases de données différentes en fonction des entreprises.

Informatica va aller lire leurs bases de données via des connecteurs et va extraire les données. C’est ce qu’on appelle l’extraction. Il va ensuite faire la transformation dans son logiciel à lui et enfin va « loader », c’est à dire, charger les données transformées via son logiciel dans leur base de données.

Informatica ne stocke donc que le travail des données. Ce qu’on appelle repositories, c’est différent.

L’ETL extrait donc les données dans un entrepôt de données externe ou via des fichiers plats, des fichiers qu’on trouve sur le NAS, sur un serveur. Il effectue la/les transformations en son sein. Quand il a terminé, il charge les données transformées dans l’entrepôt de données ou bien dans le serveur sélectionné.

Pour aller plus loin :

Qu’est-ce qu’on entend par transformations ?

Mokhtar : Je vais donner un exemple simple : mon objectif est de calculer un montant.

Le calcul à faire est le suivant : « le montant » = « le prix » X « la quantité ».

  • J’ai donc besoin de récupérer les données suivantes : le prix et la quantité, en entrée de mes tables ou de mes fichiers.
  • Et avec mes transformations , je calcule le montant.

Si maintenant on me demande le montant hors taxe et TTC, je peux ajouter une transformation liée à ce calcul : j’ajoute la TVA .

Voici un autre cas concret. Si je travaille dans une société qui fait des assurances, je vais être amené à devoir potentiellement travailler sur des sinistres.

Je veux connaître le nombre de sinistres, de gravité 1, 2 ou 3.

La règle de gestion de l’entreprise indique :

  • Si le montant est entre 500 000 € et 1 million d’euros c’est un sinistre de gravité 1.
  • Si le montant est entre 1 million d’euros à 1 million et demi, c’est un sinistre de gravité 2.
  • Si le montant est supérieur à 1 million et demi c’est un sinistre gravité 3.

Donc moi je vais avoir besoin de récupérer l’ensemble des sinistres de tous les clients. Et, de faire la somme des montants groupés des clients. Pour avoir les montants groupés je vais créer des règles sur les montants (si inférieur à X euros, si supérieur X euros et ainsi de suite).

Voilà ce que sont les transformations.

Une fois j’ai extrait les données des tables, je commence à faire des transformations et une fois que j’ai tous les résultats, que j’ai répondu à tous les besoins de ces transformations. Je charge dans des tables log.

Pourquoi Informatica est-il le leader sur le marché ?

Mokhtar : L’avantage de cet ETL, c’est qu’il peut traiter un gros volume de données. Quand je parle d’un gros volume de données, par exemple, 1 million de données, ce n’est rien, il suffit d’utiliser une requête SQL et hop tu charges des données.

Par contre, quand tu as 100 millions ou même 600 milliards d’enregistrements là c’est une autre histoire. Cela ne peut pas être géré par simples requêtes, car les traitements vont mettre énormément de temps.

Ainsi, par exemple un traitement lambda qui habituellement prendrait quatre jours, je vais pouvoir le convertir sur Informatica et il s’effectuera ainsi qu’en treize secondes. Bon, quand je dis treize secondes, c’est qu’il faut bien entendu le développer correctement.

Du coup si on dit qu’Informatica est utile pour traiter de grands volumes de données cela sous-entend qu’il est principalement utilisé dans les grandes entreprises ?

Mokhtar : Informatica, c’est un éditeur de logiciels, il est spécialisé dans la gestion des données, ce qu’on appelle le data management.

Aujourd’hui, en effet, une majorité d’entreprises demandent à utiliser Informatica car elles ont un gros volume de données et qu’elles ont besoin des indicateurs rapidement.

C’est vraiment ça, le point fort d’Informatica par rapport à ses concurrents comme Talend, ou SAS par exemple.

 

Donc le principal atout d’Informatica c’est la gestion de gros volumes de données rapidement ?

Mokhtar : Oui mais ce n’est pas tout, il a plusieurs autres points forts :

  • La simplicité de la mise en œuvre ;
  • La puissance des transformations, c’est-à-dire le nombre, la complexité et la rapidité des traitements ;
  • La maintenance

Concernant, la maintenance je m’explique : avec cet outil, je peux ajouter un traitement de plus, sans toucher aux traitements existants. Donc c’est pour ça qu’on parle de maintenance évolutive, ou de l’évolutivité de la solution. Il peut aussi gérer l’intégration du système d’information de l’entreprise qui gère toutes les métadonnées de l’entreprise, quel que soit le type de données.

  • Il est indépendant.

Il est indépendant aussi vis à vis de la plateforme, c’est à dire, même si tu as des données sur Oracle, t’as des données sur SQL Server, t’as des fichiers XML, t’as des données issues des pages web : il est indépendant et peut aller les lire facilement.

Pourquoi se former à Informatica si on n’est pas un développeur ?

A qui s’adresse la formation Informatica PowerCenter de LePont ?

Mokhtar : Alors cette formation, elle n’est pas uniquement adressée aux développeurs, comme les gens peuvent le penser. Elle est également adressée aux :

  • Managers,
  • Chefs de projet,
  • Consultants,
  • Et bien entendu aux développeurs et aux intégrateurs.

Alors que le niveau 1 est pour tous, le niveau 2 est plus adapté à des profils techniques, ayant une pratique de l’outil.

    Pourquoi aux chefs de projets ou aux manageurs ?

    Mokhtar : Tu vas me dire oui mais les managers ne savent pas développer l’informatique. Parce que l’outil est divisé en trois volets :

    • Le développement.
    • L’exécution, c’est à dire les intégrateurs.
    • Les résultats, c’est à dire les tableaux de bords

    Grâce à la formation, un manager peut s’assurer, en toute autonomie, du bon chargement des données dans l’outil et du statut des différents traitements. En effet, il lui suffit d’aller dans le monitoring d’Informatica PowerCenter afin d’avoir la vision de l’ensemble des données extraites provenant de différentes tables.

    La formation lui permettra de savoir lire un monitoring notamment :

    • À quelle heure un traitement a tourné
    • Le traitement a-t-il bien tourné ? (sans bug)
    • À quelle heure a-t-il commencé et s’est-il arrêté ?
    • Et d’identifier des points de blocage : pourquoi un traitement a-t-il duré trop de temps ?

    Quelle est la différence entre niveau 1 et niveau 2 ?

    Avec LePont tu dispenses deux formations pour Informatica PowerCenter : une niveau 1 et une niveau 2.

    Le niveau 1

    Mokhtar : Oui, le niveau 1 de la formation est adressé à des débutants, n’ayant jamais travaillé sur un ETL ou dans la BI (Business Intelligence). Il faut cependant avoir des bonnes bases en SQL pour s’en sortir sur l’outil.

    La formation commence donc de zéro et explique comment utiliser le logiciel. En partant de l’entrée de la donnée dans l’outil (à partir d’une table en entrée ou un fichier en entrée) jusqu’à sa sortie : charger une table ou un fichier en sortie.

    Le niveau 2

    Mokhtar : Le niveau deux est adressé à des personnes qui ont au moins fait six mois d’informatique, un mois forcé de niveau un tellement ils aiment ça.

    Peut-on enchaîner avec la formation de niveau 2 tout de suite après la formation de niveau 1 ?

    Mokhtar : Clairement, Non. Alors rassurez-vous, vous êtes opérationnels dès la fin de la formation de niveau 1 mais je vous conseille vivement de pratiquer un peu, pendant six mois, voire un an, et ensuite de passer le niveau deux.

    En effet, la formation est faite de 50% de pratique et parfois les apprenants ont l’impression que dès leur dernier jour formation, ils peuvent enchaîner avec le niveau deux.

    Alors c’est vrai que les exercices et les cas concrets permettent d’être autonomes à la fin du niveau 1. Mais il faut vraiment avoir été confronté aux problématiques des entreprises, se faire la main dans la vraie vie, car ce n’est pas la même chose. Il faut de la pratique pour savoir quels composants il convient d’utiliser pour répondre à un besoin particulier par exemple.

    Quelle est la différence avec le niveau 1 ?

    Mokhtar : Le niveau deux, va être accès sur les performances du logiciel. Qu’entendons-nous par performances ? Je vais vraiment rentrer dans le détail, à l’intérieur du logiciel. L’objectif est de répondre à la question suivante : comment optimiser au mieux mes traitements ?

    Par exemple, si j’ai un traitement qui dure 3 h, je peux en jouant avec le traitement et avec l’expérience acquise, l’optimiser et l’écourter pour qu’il ne dure au final qu’un quart d’heure.

    Le niveau deux va me permettre d’avoir des astuces et des conseils d’optimisation des traitements. Les bonnes pratiques, en quelques sortes. Même si, bien entendu certaines bonnes pratiques sont déjà forcément vues pendant le niveau un car quand tu commences à développer, il faut avoir les bonnes bases.

    Le niveau deux permet donc de travailler plus en profondeur sur l’outil, sur le timing des traitements, sur des traitements plus complexes.

    A qui s’adresse le niveau 2 ?

    Mokhtar : C’est pourquoi, le niveau deux est plus fait pour des profils techniques. Un chef de projet ne va pas forcément avoir besoin, dans le cadre de son métier, d’approfondir sa connaissance technique sur l’outil. Je dirais donc que le niveau deux est plutôt adressé à quelqu’un qui veut vraiment évoluer sur l’outil et souhaite devenir expert informatique, pourquoi pas passer des certifications plus tard par exemple.

    Quels sont les points forts de la formation ?

    Mokhtar : je dirais que la formation LePont se différencie des autres formations sur 5 points majeurs.

    1 – Une formation en français

    La formation est animée en français et les supports de cours sont également en français.

    2 – Un support détaillé et constamment à jour

    Mokhtar : Le support est détaillé alors que chez l’éditeur, par exemple, il n’y a que des petits slides.

    Et surtout, il est mis à jour constamment en fonction des cas que je rencontre dans les entreprises. Si je trouve un cas d’usage intéressant, je vais l’ajouter dans le support de formation, dans un exercice ou bien dans mes remarques. En effet, comme c’est moi qui construis le support de cours, il est donc enrichi de mon expérience.

    3 – 50% du temps dédié à la pratique

    Mokhtar : un autre axe différenciant est que 50 % du temps de la formation est dédié à des exercices, à de la pratique. Et quand je dis pratique, il s’agit de cas réels d’entreprise (sur des données anonymisées de ventes, d’achats, de facturation… etc).

    Et là, l’avantage de cette pratique de deux jours, c’est que le quatrième jour, quand les apprenants sortent de la formation, ils sont déjà autonomes. Ils seront aptes à gérer des projets.

    4 – Un formateur expert et professionnel

    Mokhtar : Il existe de très bons formateurs, mais je pense sincèrement que lorsqu’on est en plus professionnel en entreprise, c’est différent.

    Quand on fait uniquement la formation, on n’a pas forcément en tête tous les cas d’usage. Mon avantage, c’est que j’ai plus de 20 ans d’expérience sur l’outil et que je le pratique sur le terrain.

    Cela pourrait vous intéresser

    Connect

    Pour recevoir nos derniers articles sur la Data et l'Intelligence Artificielle, abonnez vous à Connect, l’email qui fait du bien à vos données.

    Le Pont Learning