Mise à jour 18/03/2024

Objectifs

  • Acquérir les bases permettant de manipuler les principales méthodes de data science pour des objectifs de prédiction
  • Appréhender la pratique réelle de ces méthodes au travers d’exemples et de travaux pratiques avec le logiciel R

Public

Ingénieurs et chercheurs travaillant dans les domaines de l’agriculture et de l’environnement.

Pré-requis

  • connaissances de base du logiciel R
  • maîtriser les méthodes de base de régression
  • avoir un compte google pour utilisation de google colab

L’inscription à la formation est validée par un questionnaire de positionnement.

Programme et déroulé

   En savoir plus

Classe virtuelle 1

Présentation de la formation, tour de table et introduction à la datascience

Méthodes de régression (pénalisée, PLS,GAM, sélection)

+ Travail individuel « Méthodes de régression » à réaliser en asynchrone et à rendre avant le soir aux formateurs (durée estimée 1h)

 

Classe virtuelle 2

Retour sur le travail individuel « Méthodes de régression »

Arbres et random forest

+ Travail individuel « Arbres et random forest » à réaliser en asynchrone et à rendre avant le soir aux formateurs (durée estimée 1h)

 

Classe virtuelle 3

Retour sur le travail individuel « Arbres et random forest »

Méthodes d’évaluation (qualité de prédiction)

+ Travail individuel « Méthodes d’évaluation » à réaliser en asynchrone et à rendre avant le soir aux formateurs (durée estimée 1h)

(merci de veiller à profiter de la longue pause avant la reprise à 14h pour réaliser ce travail individuel

 

Classe virtuelle 4

Data mining

Introduction Google Colab et Python – partie 1

+ Travail individuel « Google Colab et Python » à réaliser en asynchrone et à rendre avant le soir aux formateurs (durée estimée 1h)

 

Classe virtuelle 5

Retour sur les travaux individuels « Méthodes d’évaluation » et « google colab et python »

Introduction Google Colab et Python – partie 2

Réseau de neurones et extension multicouche

+ Travail individuel « Réseau de neurones et extension multicouche » à réaliser en

asynchrone et à rendre avant le soir aux formateurs (durée estimée 1h30)

 

Classe virtuelle 6

Retour sur le travail individuel « Réseau de neurones et extension multicouche »

Réseau de neurones et convolutions

Conclusion et clôture de la formation

Moyens pédagogiques

  • Exposés, échanges et quizz
  • Travaux pratiques personnels

Moyens d’évaluation

  • Questionnaire de positionnement
  • Évaluation des compétences acquises lors de la formation par des quizz et des exercices pratiques individuels
  • Évaluation de la formation par un questionnaire de satisfaction

Ressources pédagogiques

  • PDF de la formation fourni en début de session
  • Ouvrage collectif « Data science pour l’agriculture et l’environnement – Méthodes et applications avec R et Python » Editions Ellipses

Moyens de suivi et formalisation à l’issue de la formation

  • Émargement par ½ journée
  • Certificat de réalisation transmis par courriel à l’issue de la formation

Équipements nécessaires

Ordinateur portable avec accès internet.

Tarif réduit 

950 € HT pour les partenaires RMT Science des données et Modélisation pour l’agriculture et l’agroalimentaire (www.modelia.org) ou pour les doctorants financés ou labellisés par l’institut de convergence DigitAg – Agriculture Numérique (www.hdigitag.fr).

Partenaires financiers :