Options d’inscription

Ce cours aborde différentes approches de planification, de raisonnement et d’apprentissage pour des agents intelligents. Les approches basées sur les modèles de décision markoviens (MDP) seront présentées, avec les principes et algorithmes de base en planification sous incertitudes (itération sur les valeurs et itération sur les politiques), puis l’apprentissage par renforcement tabulaire (Q-Learning, Monte-carlo) et avec approximation linéaire. Ensuite, on s’intéressera aux approches récentes en apprentissage profond par renforcement qui utilisent les réseaux de neurones (Deep Q-Network, Policy gradient). Enfin, l’approche BDI (Belief-Desire-Intention) sera étudiée.


Les visiteurs anonymes ne peuvent pas accéder à ce cours. Veuillez vous connecter.