Imprimer

Text mining ou l’exploitation de données textuelles pour les risques agricoles et sanitaires

Date : 22, 23 et 24 mars 2022

Institut organisateur :

Pour un objectif personnalisé
  • Acquérir les bases permettant de manipuler les principales méthodes de text mining
  • Mettre en place des outils de visualisation (graphiques, cartes de risque,...)
  • Choisir des tests statistiques pour l’analyse des données textuelles
  • Appliquer ces méthodes dans des études de cas avec le logiciel R
Un public

Ingénieurs, chercheurs et doctorants travaillant dans les domaines de l’agriculture, de l’agroalimentaire et de l’environnement

Prérequis : connaissances de base du logiciel R

Une méthode

Moyens pédagogiques

Formation en ligne interactive alternant :

  • Exposés, quizz et étude de cas sous R en classe virtuelle
  • Un travail personnel en asynchrone d’une durée estimée à 1h à réaliser dans l’après-midi entre les deux sessions à rendre avant 18h aux formateurs. Merci de prévoir suffisamment de temps pour le réaliser.
  • Retour sur le travail individuel en classe virtuelle pour valider le travail personnel de chacun

Moyens d’Evaluation

  • Quizz et exercices en classes virtuelles
  • Travail individuel en asynchrone
  • Questionnaire de satisfaction en fin de formation

Ressources pédagogiques

  • Pdf de la formation fourni en début de session
  • Différents codes sous R (extraction, cartographie, tests statistiques)
  • Jeux de données tweets des cas d’usage
Un contenu adaptable

Présentation de la formation, modalités d'apprentissage et tour de table

Théorie du text mining

  • introduction au text mining, concept et applications 

  • text mining, tokenisation et indices principaux

  • text mining et sentiment analysis 

Données tweets et analyses cartographiques

  • API et extraction des données tweets

  • visualisation des données, carte et graphe sous shiny (étude de cas GA)

  • échanges

  • explication travail personnel de l’après-midi

Tests statistiques : introduction et théories : 

  • introduction, les différents tests 
  • topic modeling théorie et étude de cas

Modèle linéaire généralisé

  • théorie, références
  • étude de cas 

Mobilisation de toutes les compétences acquises : 

  • mise en place d’une application complète (étude de cas)

Conclusion et évaluation de la formation

 

 

En asynchrone : travail individuel à réaliser sur deux après-midis : mise en place d'une application : étude de cas épidémiologie (2 x 1 heure environ). Un retour en classe virtuelle sera fait et les corrections apportées. 

Une formule adaptée à l'entreprise
  • Durée : 8h

  • Tarif : 450€ HT

  • Tarif réduit : 350€ HT pour les partenaires RMT Science des données et Modélisation pour l’agriculture et l’agroalimentaire (www.modelia.org) ou pour les doctorants financés ou labellisés par l'institut de convergence DigitAg – Agriculture Numérique (www.hdigitag.fr).

  • Date :22, 23 et 24 mars 2022

  • Intervenants : François Brun, Acta-les instituts techniques agricoles : ingénieur, animateur du RMT Modelia, intervenant sur les méthodes d’évaluation, Jeanne Pennon, Acta-les instituts techniques agricoles : élève ingénieur ; David Makowski, INRAE, directeur de recherche, animateur du RMT Modelia

  • Lieu : formation réalisée à distance

  • Matériel à prévoir : Ordinateur portable avec le logiciel R installé et accès internet

Délais d’accès : vous pouvez vous inscrire jusqu’à 3 semaines avant la formation. Au-delà, merci de nous contacter.

 

 

 

Contact pédagogique

François BRUN

Acta

Tél : 05 61 28 50 25

Mél : francois.brun@acta.asso.fr

Contact administratif

Volimata CAMARA

Acta

149 rue de Bercy

75595 PARIS CEDEX 12

Tel : 01 40 04 50 08

Mél : volimata.camara@acta.asso.fr

                                                                                                                                   Date de mise à jour : 30/09/2021