Objectifs

  • Acquérir les bases permettant de manipuler les principales méthodes de text mining
  • Mettre en place des outils de visualisation (graphiques, cartes de risque,…)
  • Choisir des tests statistiques pour l’analyse des données textuelles
  • Appliquer ces méthodes dans des études de cas avec le logiciel R

Public

Ingénieurs, chercheurs et doctorants travaillant dans les domaines de l’agriculture, de l’agroalimentaire et de l’environnement.

Pré-requis

Connaissances de base du logiciel R

Programme et déroulé

La formation comporte 3 classes virtuelles de 2h (de 9h à 11h) réparties sur 3 jours, où l’interactivité et l’échange seront privilégiés.

Présentation de la formation, modalités d’apprentissage et tour de table

Théorie du text mining

  • introduction au text mining, concept et applications
  • text mining, tokenisation et indices principaux
  • text mining et sentiment analysis

Données tweets et analyses cartographiques

  • API et extraction des données tweets
  • visualisation des données, carte et graphe sous shiny (étude de cas GA)

Tests statistiques : introduction et théories : 

  • introduction, les différents tests
  • topic modeling théorie et étude de cas

Modèle linéaire généralisé

  • théorie, références
  • étude de cas

Mobilisation de toutes les compétences acquises : 

  • mise en place d’une application complète (étude de cas)

Conclusion et évaluation de la formation

En asynchrone : travail individuel à réaliser sur deux après-midi : mise en place d’une application : étude de cas épidémiologie (2 x 1h environ). Un retour en classe virtuelle sera fait et les corrections apportées.

Moyens pédagogiques

Formation en ligne interactive alternant :

  • Exposés, quizz et étude de cas sous R en classe virtuelle
  • Un travail personnel en asynchrone d’une durée estimée à 1h à réaliser à la suite des deux premières classes virtuelles à rendre avant 18h aux formateurs. Merci de prévoir suffisamment de temps pour le réaliser.
  • Retour sur les travaux individuels en classe virtuelle pour valider le travail personnel de chacun

Moyens d’évaluation

  • Questionnaire de positionnement
  • Évaluation des compétences acquises par des quizz et exercices en classes virtuelles ainsi que 2 travaux individuels  en asynchrone
  • Évaluation de la formation par un questionnaire de satisfaction

Ressources pédagogiques

  • Pdf de la formation fourni en début de session
  • Différents codes sous R (extraction, cartographie, tests statistiques)
  • Jeux de données tweets des cas d’usage

Moyens de suivi et formalisation à l’issue de la formation

  • Émargement par classe virtuelle
  • Certificat de réalisation transmis par courriel à l’issue de la formation

Équipements nécessaires

Disposer d’un équipement pour participer à une classe virtuelle (ordinateur avec connexion internet et web camera). Durant la formation, il est recommandé de s’isoler.

Tarif réduit

350€ HT pour les partenaires RMT Science des données et Modélisation pour l’agriculture et l’agroalimentaire (www.modelia.org) ou pour les doctorants financés ou labellisés par l’institut de convergence DigitAg – Agriculture Numérique (www.hdigitag.fr).