Ref: SIDS202
R text mining – Analyse de documents
E-learning - Synchrone - 14h
Objectifs
L'objectif de cette formation est de maitriser les techniques de Text mining et d'analyse de document à l'aide du logiciel R.Syllabus
Utilisation des données textuelles
- Import de fichier
- Extraction des textes de pdf
- Extraction des textes de htlm
Manipulation et nettoyage des données textuelles
- Lemmatisation : Regroupement par des mots
- Stemmatisation : Garder la racine des mots
- Suppression des stop-words
- Création de la table des mots
Analyse de la table des mots
- Décomptes des termes
- Fréquence des mots
- Calcul de l'indicateur TF-IDF
- Utilisation de la Loi de Zipf et interprétation
- Création des n-gram des termes du texte
- Corrélation entre les mots
Analyse de sentiments des textes
Modélisation
- LDA
- Régressions
- Classifications
Visualisation
- Fréquence des mots
- Wordcloud
- Mots les plus pertinents (avec la loi de zipf)
- Les réseaux de mots
Passerelle entre {tidytext} et {tm}
Deux études de cas corrigés
Comment ?
Méthodes pédagogiques
8 à 10 personnes maximum par cours
1 poste de travail par stagiaire
Remise d'une documentation pédagogique papier ou numérique pendant le stage
La formation est constituée d'apports théoriques, d'exercices pratiques, de réflexions et de retours d'expérience
Évaluation
Auto-évaluation des acquis par le stagiaire via un questionnaire en ligne
Attestation de fin de stage remise au stagiaire
Participez à la prochaine session !
S'inscrireAdmission
A qui s’adresse cette formation
Chefs de projets statistiques, chargés d'étude, analystes …
Prérequis
Connaissance des bases de la théorie statistique, avoir suivi la formation R niveau 1 ou avoir une utilisation avancée de R.
Coût de la formation
Frais pédagogiques
1600€ HT
Tarif Inter-entreprise par personne
Aides au financement
Des dispositifs variés et aides au fnancement existent. N’hésitez pas à nous constulter pour en savoir plus.
En savoir plus sur les dispositifs de financement.