Informations pratiques

Date : 28/11/2022 > 07/12/2022
Lieu : À distance
Durée : 6 demi-journées (25h)
Tarif : 1 200 € HT (voir Tarif réduit en bas de page)
Intervenant(s) : François Brun, ingénieur, animateur du RMT Modelia, intervenant sur les méthodes d’évaluation (Acta); David Makowski, directeur de recherche, animateur du RMT Modelia, intervenant sur l’introduction et les méthodes de régression (INRAE); Aurore Philibert, ingénieur, intervenant sur les arbres et forêts aléatoires; Florent Duyme, ingénieur, intervenant sur les méthodes de régression (ARVALIS); Mohammed El Jabri, ingénieur, intervenant sur les réseaux de neurones (Idele); Kevin Fauvel, intervenant sur le data mining; Alexandre Termier, professeur, intervenant sur le data mining (IRISA (université de Rennes-INRIA))
Délais d'accès : vous pouvez vous inscrire
jusqu’à 3 semaines avant la formation.
Au-delà, merci de nous contacter
Accessibilité : afin que cette formation soit accessible à tous, nous invitons les personnes qui ont besoin d’aménagements à nous le signaler en contactant directement notre référent Handicap : nous contacter
À la demande : pour une formation adaptée à votre structure : nous contacter

Objectifs

  • Acquérir les bases permettant de manipuler les principales méthodes de data science pour des objectifs de prédiction
  • Appréhender la pratique réelle de ces méthodes au travers d’exemples et de travaux pratiques avec le logiciel R

Public

Ingénieurs et chercheurs travaillant dans les domaines de l’agriculture et de l’environnement.

Pré-requis

  • connaissances de base du logiciel R
  • maîtriser les méthodes de base de régression
  • avoir un compte google pour utilisation de google colab

L’inscription à la formation est validée par un questionnaire de positionnement.

Programme et déroulé

28 novembre (9h-12h10)

  • 9h-10h : Présentation de la formation, tour de table et introduction à la datascience
  • 10h10-12h10 : Méthodes de régression (pénalisée, PLS,GAM, sélection)

+ Travail individuel « Méthodes de régression » à réaliser en asynchrone et à rendre avant le soir aux formateurs (durée estimée 1h)

29 novembre (9h-12h10)

  • 9h-10h : Retour sur le travail individuel « Méthodes de régression »
  • 10h10-12h10 : Arbres et random forest

+ Travail individuel « Arbres et random forest » à réaliser en asynchrone et à rendre avant le soir aux formateurs (durée estimée 1h)

30 novembre (9h-12h10)

  • 9h-10h : Retour sur le travail individuel « Arbres et random forest  »
  • 10h10-11h40 : Méthodes d’évaluation (qualité de prédiction)
  • 11h40-12h10 : Introduction Google Colab et Python – partie 1

+ Travail individuel « Méthodes d’évaluation » à réaliser en asynchrone et à rendre avant le 4 décembre aux formateurs (durée estimée 1h)

+ Travail individuel « Google Colab et Python » à réaliser en asynchrone et à rendre avant le 4 décembre aux formateurs (durée estimée 1h)

5 décembre (9h-12h10)

  • 9h-9h30 : Retour sur les travaux individuels « Méthodes d’évaluation » et « google colab et python »
  • 9h30-10h30 : Introduction Google Colab et Python – partie 2
  • 10h40-12h10 : Réseau de neurones et extension multicouche

+ Travail individuel « Réseau de neurones et  extension multicouche » à réaliser en asynchrone et à rendre avant le soir aux formateurs (durée estimée 1h)

6 décembre (9h-12h10)

  • 9h-10h : Retour sur le travail individuel « Réseau de neurones et  extension multicouche »
  • 10h10-12h10 : Réseau de neurones et convolutions

+ Travail individuel « Réseau de neurones et  convolutions » à réaliser en asynchrone et à rendre avant le soir aux formateurs (durée estimée 1h)

7 décembre (9h-12h10)

  • 9h-10h : Retour sur le travail individuel « Réseau de neurones et convolutions »
  • 10h10-11h40 : Data mining
  • 11h40-12h10 : Conclusion et clôture de la formation

Moyens pédagogiques

  • Exposés, échanges et quizz
  • Travaux pratiques personnels

Moyens d’évaluation

  • Questionnaire de positionnement
  • Évaluation des compétences acquises lors de la formation par des quizz et des exercices pratiques individuels
  • Évaluation de la formation par un questionnaire de satisfaction

Ressources pédagogiques

  • PDF de la formation fourni en début de session
  • Ouvrage collectif « Data science pour l’agriculture et l’environnement – Méthodes et applications avec R et Python » Editions Ellipses

Moyens de suivi et formalisation à l’issue de la formation

  • Émargement par ½ journée
  • Certificat de réalisation transmis par courriel à l’issue de la formation

Équipements nécessaires

Ordinateur portable avec accès internet.

Tarif réduit

900 € HT pour les partenaires RMT Science des données et Modélisation pour l’agriculture et l’agroalimentaire (www.modelia.org) ou pour les doctorants financés ou labellisés par l’institut de convergence DigitAg – Agriculture Numérique (www.hdigitag.fr).