Odalric-Ambrym Maillard

机构: Inria Lille - Nord Europe

主页: neowordpress.fr

每年引用次数

引用次数

引用: 2,867

H-指数: 27

I10-指数 : 56

出版物: 150

标题

引用次数

年份

gym-DSSAT: a crop model turned into a Reinforcement Learning environment

Romain Gautron , Emilio J Padrón , Philippe Preux , Julien Bigot
arXiv preprint arXiv:2207.03270

2022

Learning crop management by reinforcement: gym-DSSAT

Romain Gautron , Emilio J Padrón , Philippe Preux , Julien Bigot
Smpte Journal

2023

Farm-gym: A modular reinforcement learning platform for stochastic agronomic games

Odalric-Ambrym Maillard , Timothée Mathieu , Debabrota Basu
Smpte Journal

2023

Reinforcement learning for crop management support: Review, prospects and challenges

Romain Gautron , Odalric-Ambrym Maillard , Philippe Preux , Marc Corbeels
Computers and Electronics in Agriculture 200 107182

2022

Csaba Szepesvári University of Alberta

Alborz Geramifard , Alessandro Lazaric , Amir-massoud Farahmand , Andre Damotta Salles

2012

Compressed Least-Squares Regression (Supplementary material)

Odalric-Ambrym Maillard , Rémi Munos

Supplementary material for the paper:” Adaptive Bandits: Towards the best history-dependent strategy “

Odalric-Ambrym Maillard , Rémi Munos

Finite-sample Analysis of Bellman Residual Minimization

Odalric-Ambrym Maillard , Rémi Munos , Alessandro Lazaric , Mohammad Ghavamzadeh
ACML 299 -314

2010

Streaming kernel regression with provably adaptive mean, variance, and regularization

Audrey Durand , Odalric-Ambrym Maillard , Joelle Pineau
arXiv preprint arXiv:1708.00768

2017

Méthodes des moments pour l’inférence de systèmes séquentiels linéaires rationnels

Marc Tommasi , François Denis , Joëlle Pineau , Odalric-Ambrym Maillard
Université Lille 1

2016

Collaborative algorithms for online personalized mean estimation

Mahsa Asadi , Aurélien Bellet , Odalric-Ambrym Maillard , Marc Tommasi
arXiv preprint arXiv:2208.11530

2022

Monte-Carlo tree search with uncertainty propagation via optimal transport

Tuan Dam , Pascal Stenger , Lukas Schneider , Joni Pajarinen
arXiv preprint arXiv:2309.10737

2023

Exploration in Reward Machines with Low Regret

Hippolyte Bourel , Anders Jonsson , Odalric-Ambrym Maillard , Mohammad Sadegh Talebi
International Conference on Artificial Intelligence and Statistics 4114 -4146

2023

Sub-sampling for multi-armed bandits

Akram Baransi , Odalric-Ambrym Maillard , Shie Mannor
Machine Learning and Knowledge Discovery in Databases: European Conference, ECML PKDD 2014, Nancy, France, September 15-19, 2014. Proceedings, Part I 14 115 -131

2014

Parallelization of the TD (λ) Learning Algorithm

Odalric-Ambrym Maillard , Rémi Coulom , Philippe Preux
The Seventh European Workshop on Reinforcement Learning

2005

AdaStop: sequential testing for efficient and reliable comparisons of Deep RL Agents

Timothée Mathieu , Riccardo Della Vecchia , Alena Shilova , Matheus Centa de Medeiros
arXiv preprint arXiv:2306.10882

2023

Contextual bandits to help patient follow-up

Emilie Kaufmann , Odalric-Ambrym Maillard , Timothée Mathieu , Philippe Preux

Compressed least-squares regression

Odalric Maillard , Rémi Munos ,
Advances in Neural Information Processing Systems

139