Topic: policy-gradient Goto Github

Some thing interesting about policy-gradient

👇 Here are 407 public repositories matching this topic...

abhisheksuran / reinforcement_learning

policy-gradient,Deep Reinforcement Learning Algorithms implemented with Tensorflow 2.3

User: abhisheksuran

actor-critic atari policy-gradient ppo reinforcement-learning reinforcement-learning-algorithms tensorflow2

activatedgeek / torchrl

policy-gradient,Highly Modular and Scalable Reinforcement Learning

User: activatedgeek

Home Page: https://torchrl.sanyamkapoor.com

machine-learning reinforcement-learning reinforcement-learning-algorithms pytorch deep-learning deep-reinforcement-learning python3 dqn policy-gradient

agentmaker / paddle-rlbooks

policy-gradient,Paddle-RLBooks is a reinforcement learning code study guide based on pure PaddlePaddle.

Organization: agentmaker

policy-iteration value-iteration sarsa q-learning dqn nstep-dqn double-dqn dueling-dqn noisy-dqn c51

allenpandas / reinforcement-learning-papers

policy-gradient,📚 List of Top-tier Conference Papers on Reinforcement Learning (RL)，including: NeurIPS, ICML, AAAI, IJCAI, AAMAS, ICLR, ICRA, etc.

User: allenpandas

aaai artificial-intelligence deep-reinforcement-learning dqn hierarchical-reinforcement-learning icml ijcai imitation-learning meta-reinforcement-learning multi-agent-reinforcement-learning neurips offline-reinforcement-learning policy-gradient q-learning reinforcement-learning reinforcement-learning-conferences reinforcement-learning-conferences-papers reinforcement-learning-paper reinforcement-learning-papers rl-papers

allenpandas / tutorial4rl

policy-gradient,Tutorial4RL: Tutorial for Reinforcement Learning. 强化学习入门教程.

User: allenpandas

a3c ddpg deep-reinforcement-learning dqn inverse-reinforcement-learning multi-agent-reinforcement-learning multi-agent-systems policy-gradient qlearning reinforcement-learning reinforcementlearning-tutorial rl-tutorial sarsa tutorial

benedekrozemberczki / awesome-monte-carlo-tree-search-papers

policy-gradient,A curated list of Monte Carlo tree search papers with implementations.

User: benedekrozemberczki

tree-search learning machine-learning deep-learning monte-carlo monte-carlo-tree-search reinforcement-learning reinforcement-learning-agent atari rl

bentrevett / pytorch-rl

policy-gradient,Tutorials for reinforcement learning in PyTorch and Gym by implementing a few of the popular algorithms. [IN PROGRESS]

User: bentrevett

pytorch pytorch-tutorial pytorch-implmention pytorch-implementation reinforcement-learning reinforcement-learning-algorithms rl pytorch-tutorials pytorch-rl policy-gradient

cherrypiesexy / imitation_learning

policy-gradient,PyTorch implementation of some reinforcement learning algorithms: A2C, PPO, Behavioral Cloning from Observation (BCO), GAIL.

User: cherrypiesexy

a2c advantage-actor-critic deep-learning deep-reinforcement-learning gail gail-ppo imitation-learning policy-gradient ppo ppo-algo ppo-pytorch proximal-policy-optimization pytorch recurrent-ppo reinforcement-learning

datawhalechina / easy-rl

policy-gradient,强化学习中文教程（蘑菇书🍄），在线阅读地址：https://datawhalechina.github.io/easy-rl/

Organization: datawhalechina

deep-reinforcement-learning reinforcement-learning dqn ppo a3c q-learning sarsa imitation-learning policy-gradient ddpg

dena / handyrl

policy-gradient,HandyRL is a handy and simple framework based on Python and PyTorch for distributed reinforcement learning that is applicable to your own environments.

Organization: dena

reinforcement-learning pytorch games policy-gradient deep-learning machine-learning distributed-training

erfanmhi / deep-reinforcement-learning-cs285-pytorch

policy-gradient,Solutions of assignments of Deep Reinforcement Learning course presented by the University of California, Berkeley (CS285) in Pytorch framework

User: erfanmhi

Home Page: http://rll.berkeley.edu/deeprlcourse/

actor-critic-algorithm berkeley deep-learning deep-q-learning deep-reinforcement-learning model-based-rl model-free-rl mujoco neural-networks openai-gym policy-gradient python pytorch reinforcement-learning

germain-hug / deep-rl-keras

policy-gradient,Keras Implementation of popular Deep RL Algorithms (A3C, DDQN, DDPG, Dueling DDQN)

User: germain-hug

a2c a3c d3qn ddpg ddqn dqn dueling gym keras keras-rl openai policy-gradient reinforcement-learning

gordicaleksa / pytorch-learn-reinforcement-learning

policy-gradient,A collection of various RL algorithms like policy gradients, DQN and PPO. The goal of this repo will be to make it a go-to resource for learning about RL. How to visualize, debug and solve RL problems. I've additionally included playground.py for learning more about OpenAI gym, etc.

User: gordicaleksa

Home Page: https://youtube.com/c/TheAIEpiphany

python deep-learning jupyter pytorch rl reinforcement-learning reinforcement-learning-algorithms ppo policy-gradient dqn

hsvgbkhgbv / sqddpg

policy-gradient,This is a framework for the research on multi-agent reinforcement learning and the implementation of the experiments in the paper titled by ''Shapley Q-value: A Local Reward Approach to Solve Global Reward Games''.

User: hsvgbkhgbv

reinforcement-learning multi-agent-reinforcement-learning framework policy-gradient openai-gym pytorch multiagent-reinforcement-learning sqddpg shapley-q-value marl multi-agent-rl

jasonyao81000 / mlds2018spring

policy-gradient,Machine Learning and having it Deep and Structured (MLDS) in 2018 spring

User: jasonyao81000

mlds2018spring ntu hung-yi-lee mlds seq2seq sequence-to-sequence gan generative-adversarial-network reinforcement-learning policy-gradient

jcwleo / reinforcement_learning

policy-gradient,강화학습에 대한 기본적인 알고리즘 구현

User: jcwleo

reinforcement-learning reinforcement-learning-algorithms deep-learning dqn tensorflow cartpole breakout policy-gradient pong pytorch

kengz / openai_lab

policy-gradient,An experimentation framework for Reinforcement Learning using OpenAI Gym, Tensorflow, and Keras.

User: kengz

keras tensorflow openai experiment policy-gradient actor-critic ddpg deep-reinforcement-learning reinforcement-learning

kengz / slm-lab

policy-gradient,Modular Deep Reinforcement Learning framework in PyTorch. Companion library of the book "Foundations of Deep Reinforcement Learning".

User: kengz

Home Page: https://slm-lab.gitbook.io/slm-lab/

pytorch reinforcement-learning deep-reinforcement-learning benchmark policy-gradient dqn ppo sac a2c a3c

keon / policy-gradient

policy-gradient,Minimal Monte Carlo Policy Gradient (REINFORCE) Algorithm Implementation in Keras

User: keon

policy-gradient deep-reinforcement-learning keras reinforcement-learning

khrylx / pytorch-rl

policy-gradient,PyTorch implementation of Deep Reinforcement Learning: Policy Gradient methods (TRPO, PPO, A2C) and Generative Adversarial Imitation Learning (GAIL). Fast Fisher vector product TRPO.

User: khrylx

reinforcement-learning policy-gradient pytorch-rl proximal-policy-optimization trpo ppo pytorch a2c generative-adversarial-network fisher-vectors deep-reinforcement-learning

kismuz / btgym

policy-gradient,Scalable, event-driven, deep-learning-friendly backtesting library

User: kismuz

Home Page: https://kismuz.github.io/btgym/

reinforcement-learning deep-reinforcement-learning gym-environment openai-gym backtesting-trading-strategies algorithmic-trading-library time-series a3c tensorflow backtrader

liamconnell / deep-algotrading

policy-gradient,A resource for learning about deep learning techniques from regression to LSTM and Reinforcement Learning using financial data and the fitness functions of algorithmic trading

User: liamconnell

Home Page: https://liamconnell.github.io/jekyll/update/2016/07/18/a-tour-through-tensorflow-with-financial-data.html

neural-network deep-learning policy-gradient lstm tensorflow reinforcement-learning

liziniu / remax

policy-gradient,Code for Paper (ReMax: A Simple, Efficient and Effective Reinforcement Learning Method for Aligning Large Language Models)

User: liziniu

large-language-models reinforcement-learning rlhf policy-gradient

marcometer / episodic-transformer-memory-ppo

policy-gradient,Clean baseline implementation of PPO using an episodic TransformerXL memory

User: marcometer

pytorch deep-reinforcement-learning episodic-memory ppo transformer proximal-policy-optimization on-policy policy-gradient pomdp actor-critic

marcometer / recurrent-ppo-truncated-bptt

policy-gradient,Baseline implementation of recurrent PPO using truncated BPTT

User: marcometer

pytorch deep-reinforcement-learning ppo recurrent-neural-networks recurrence lstm gru truncated bptt deep-learning recurrent proximal-policy-optimization on-policy policy-gradient pomdp actor-critic

medipixel / rl_algorithms

policy-gradient,Structural implementation of RL key algorithms

User: medipixel

Home Page: https://www.medipixel.io/

deep-learning dqn gym policy-gradient python3 pytorch reinforcement-learning

mg2033 / a2c

policy-gradient,A Clearer and Simpler Synchronous Advantage Actor Critic (A2C) Implementation in TensorFlow

User: mg2033

a2c actor-critic computer-vision gym openai-gym-agents openai-gym-environments policy-gradient reinforcement-learning

morvanzhou / reinforcement-learning-with-tensorflow

policy-gradient,Simple Reinforcement learning tutorials, 莫烦Python 中文AI教学

User: morvanzhou

Home Page: https://mofanpy.com/tutorials/machine-learning/reinforcement-learning/

reinforcement-learning tutorial q-learning sarsa sarsa-lambda deep-q-network a3c ddpg policy-gradient dqn

navneet-nmk / pytorch-rl

policy-gradient,This repository contains model-free deep reinforcement learning algorithms implemented in Pytorch

User: navneet-nmk

dqn reinforcement-learning deep-learning deep-reinforcement-learning pytorch gym ddpg rl-algorithms openai openai-gym

nikhilbarhate99 / ppo-pytorch

policy-gradient,Minimal implementation of clipped objective Proximal Policy Optimization (PPO) in PyTorch

User: nikhilbarhate99

deep-learning deep-reinforcement-learning policy-gradient ppo ppo-pytorch proximal-policy-optimization pytorch pytorch-implmention pytorch-tutorial reinforcement-learning reinforcement-learning-algorithms

omerbsezer / reinforcement_learning_tutorial_with_demo

policy-gradient,Reinforcement Learning Tutorial with Demo: DP (Policy and Value Iteration), Monte Carlo, TD Learning (SARSA, QLearning), Function Approximation, Policy Gradient, DQN, Imitation, Meta Learning, Papers, Courses, etc..

User: omerbsezer

reinforcement-learning tutorial machine-learning q-learning sarsa td-learning policy-gradient deep-reinforcement-learning imitation-learning meta-learning

pat-coady / trpo

policy-gradient,Trust Region Policy Optimization with TensorFlow and OpenAI Gym

User: pat-coady

Home Page: https://learningai.io/projects/2017/07/28/ai-gym-workout.html

reinforcement-learning policy-gradient tensorflow machine-learning mujoco

pythonlessons / reinforcement_learning

policy-gradient,Reinforcement learning tutorials

User: pythonlessons

Home Page: https://pylessons.com/

a2c a3c actor-critic-algorythm bipedalwalker d3qn ddqn dqn dueling-dqn lunarlander policy-gradient ppo ppo-agent reinforcement-learning

rintarooo / vrp_drl_mha

policy-gradient,"Attention, Learn to Solve Routing Problems!"[Kool+, 2019], Capacitated Vehicle Routing Problem solver

User: rintarooo

multi-head-attention vrp deep-reinforcement-learning pytorch tensorflow capacitated-vehicle-routing-problem policy-gradient reinforce

ritchiehuang / deeprl_algorithms

policy-gradient,DeepRL algorithms implementation easy for understanding and reading with Pytorch and Tensorflow 2(DQN, REINFORCE, VPG, A2C, TRPO, PPO, DDPG, TD3, SAC)

User: ritchiehuang

reinforcement reinforcement-learning-algorithms pytorch-implementation deep-reinforcement-learning dqn policygradient ppo trpo mujoco policy-gradient