Edit Models filters

Inference Providers

HF Inference API

Misc

Inference Endpoints

AutoTrain Compatible

text-generation-inference

Misc with no match

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

2,069

Full-text search

Active filters: ppo

csabazs/LunarLanderCustom

Reinforcement Learning • Updated Dec 28, 2024

Atmond/ppo-CartPole-v1

Reinforcement Learning • Updated Dec 28, 2024

AneeshSinha/ppo-lunar-lander-v3

Reinforcement Learning • Updated Dec 29, 2024

sErial03/ppo-LunarLander-v2

Reinforcement Learning • Updated Jan 9 • 2

Fangliuwh/ppo-CartPole-v1

Reinforcement Learning • Updated Dec 29, 2024

Fangliuwh/LunarLander-v2-ppo-cleanrl

Reinforcement Learning • Updated Dec 29, 2024

LunaMeme/LunarLander-PPO-v2

Reinforcement Learning • Updated Dec 31, 2024

wirthy21/rl2v2unit8_ppo-CartPole-v1

Reinforcement Learning • Updated Jan 2

mgoksu/LunarLander-v2

Reinforcement Learning • Updated Jan 2

spenning/ppo-LunarLander-v2_1

Reinforcement Learning • Updated Jan 4

tzwilliam0/maxmin-dpo-init-kl-coef-0.5-fix-lora-dongnan

Reinforcement Learning • Updated Jan 4 • 46

tzwilliam0/maxmin-dpo-init-kl-coef-0.1-fix-lora-dongnan

Reinforcement Learning • Updated Jan 4 • 48

mradermacher/Moxoff-Phi3Mini-PPO-GGUF

Updated 30 days ago • 106

mradermacher/Moxoff-Phi3Mini-PPO-i1-GGUF

Updated 30 days ago • 183

NBKi/ppoU8-LunarLander

Reinforcement Learning • Updated Jan 6

DisposableTmep/PPO-CleanRL-LunarLander-v2

Reinforcement Learning • Updated Jan 7

davidgaofc/POISON_PPO_base

Reinforcement Learning • Updated Jan 9 • 4

davidgaofc/POISON_PPO_0.3

Reinforcement Learning • Updated Jan 9 • 7

davidgaofc/POISON_PPO_0.4

Reinforcement Learning • Updated Jan 9 • 4

davidgaofc/POISON_PPO_0.5

Reinforcement Learning • Updated Jan 9 • 5

Stoub/ppo2-LunarLander-v2

Reinforcement Learning • Updated Jan 10

tzwilliam0/maxmin-dpo-init-kl-coef-0.1-fix-reward-norm-dongnan

Reinforcement Learning • Updated Jan 10 • 2

tzwilliam0/maxmin-dpo-init-kl-coef-0.5-fix-reward-norm-dongnan

Reinforcement Learning • Updated Jan 10 • 2

Yooniel/ppo-LunarLander-v2-3

Reinforcement Learning • Updated Jan 10

Yooniel/ppo-LunarLander-v2-4

Reinforcement Learning • Updated Jan 10

davidgaofc/b_POISON_PPO_base

Reinforcement Learning • Updated Jan 12 • 5

davidgaofc/b_PPO_base

Reinforcement Learning • Updated Jan 12 • 5

davidgaofc/c_POISON_PPO_base

Reinforcement Learning • Updated about 1 month ago • 8

davidgaofc/d_POISON_PPO_base

Reinforcement Learning • Updated about 1 month ago • 9

saxelsso/lunarlander_PPO_Unit8_v1

Reinforcement Learning • Updated 30 days ago