Text mining ou l’exploitation de données textuelles pour les risques agricoles et sanitaires (sur demande)
Objectifs
- Acquérir les bases permettant de manipuler les principales méthodes de text mining
- Mettre en place des outils de visualisation (graphiques, cartes de risque,…)
- Choisir des tests statistiques pour l’analyse des données textuelles
- Appliquer ces méthodes dans des études de cas avec le logiciel R
Public
Ingénieurs, chercheurs et doctorants travaillant dans les domaines de l’agriculture, de l’agroalimentaire et de l’environnement.
Pré-requis
Connaissances de base du logiciel R
Programme et déroulé
La formation comporte 3 classes virtuelles de 2h (de 9h à 11h) réparties sur 3 jours, où l’interactivité et l’échange seront privilégiés.
Présentation de la formation, modalités d’apprentissage et tour de table
Théorie du text mining
- introduction au text mining, concept et applications
- text mining, tokenisation et indices principaux
- text mining et sentiment analysis
Données tweets et analyses cartographiques
- API et extraction des données tweets
- visualisation des données, carte et graphe sous shiny (étude de cas GA)
Tests statistiques : introduction et théories :
- introduction, les différents tests
- topic modeling théorie et étude de cas
Modèle linéaire généralisé
- théorie, références
- étude de cas
Mobilisation de toutes les compétences acquises :
- mise en place d’une application complète (étude de cas)
Conclusion et évaluation de la formation
En asynchrone : travail individuel à réaliser sur deux après-midi : mise en place d’une application : étude de cas épidémiologie (2 x 1h environ). Un retour en classe virtuelle sera fait et les corrections apportées.
Moyens pédagogiques
Formation en ligne interactive alternant :
- Exposés, quizz et étude de cas sous R en classe virtuelle
- Un travail personnel en asynchrone d’une durée estimée à 1h à réaliser à la suite des deux premières classes virtuelles à rendre avant 18h aux formateurs. Merci de prévoir suffisamment de temps pour le réaliser.
- Retour sur les travaux individuels en classe virtuelle pour valider le travail personnel de chacun
Moyens d’évaluation
- Questionnaire de positionnement
- Évaluation des compétences acquises par des quizz et exercices en classes virtuelles ainsi que 2 travaux individuels en asynchrone
- Évaluation de la formation par un questionnaire de satisfaction
Ressources pédagogiques
- Pdf de la formation fourni en début de session
- Différents codes sous R (extraction, cartographie, tests statistiques)
- Jeux de données tweets des cas d’usage
Moyens de suivi et formalisation à l’issue de la formation
- Émargement par classe virtuelle
- Certificat de réalisation transmis par courriel à l’issue de la formation
Équipements nécessaires
Disposer d’un équipement pour participer à une classe virtuelle (ordinateur avec connexion internet et web camera). Durant la formation, il est recommandé de s’isoler.
Tarif réduit
350€ HT pour les partenaires RMT Science des données et Modélisation pour l’agriculture et l’agroalimentaire (www.modelia.org) ou pour les doctorants financés ou labellisés par l’institut de convergence DigitAg – Agriculture Numérique (www.hdigitag.fr).