Edit Models filters

Arifama-Miniafia

Saint Lucian Creole French

Mesopotamian Arabic

Ta'izzi-Adeni Arabic

Tunisian Arabic

Central Cagayan Agta

Assyrian Neo-Aramaic

Ama (Papua New Guinea)

Guerrero Amuzgo

Bumbita Arapesh

Levantine Arabic

Languages with no match

Guyanese Creole English

Central Melanau

Konkani (macrolanguage)

Louisiana Creole

Rinconada Bikol

Brazilian Sign Language

Official Aramaic (700-300 BCE)

Old Aramaic (up to 700 BCE)

American Sign Language

Classical Armenian

Old Irish (to 900)

Middle Irish (900-1200)

Hiberno-Scottish Gaelic

Models

2,156

Full-text search

Active filters: ppo

omerozerr/ppo-CartPole-v1

Reinforcement Learning • Updated 20 days ago

Hrou/LunarLander-v2

Reinforcement Learning • Updated 19 days ago

AIventurer/ppo-CartPole-v1

Reinforcement Learning • Updated 19 days ago

Zionamsalem/LLV2

Reinforcement Learning • Updated 19 days ago

AriYusa/ppo-implementation

Reinforcement Learning • Updated 19 days ago

volfy/huggingface_rl_unit8_ppo-CartPole-v1

Reinforcement Learning • Updated 19 days ago

volfy/huggingface_rl_unit8_ppo-LunarLander-v3

Reinforcement Learning • Updated 19 days ago

MartinRedWhite/unit8-LunarLander-v2-unit8

Reinforcement Learning • Updated 19 days ago

volfy/huggingface_rl_unit8_ppo-LunarLander-v2

Reinforcement Learning • Updated 19 days ago

Vanheart/ppoCRL-LunarLander-v2

Reinforcement Learning • Updated 19 days ago

JuanjoGT13/ppo-CartPole-v1

Reinforcement Learning • Updated 18 days ago

amostof/ppoScratch-LunarLander-v2

Reinforcement Learning • Updated 12 days ago

twofacejr/ppo-CartPole-v1

Reinforcement Learning • Updated 16 days ago

vinhdq842/ppo-LunarLander-v2-scratch

Reinforcement Learning • Updated 17 days ago

Jennny/llama3_samsum_rl_marshal

Reinforcement Learning • Updated 16 days ago • 17

Jennny/llama3_dialogsum_rl_marshal

Reinforcement Learning • Updated 16 days ago • 11

francescosabbarese/ppo-CartPole-v1

Reinforcement Learning • Updated 16 days ago

francescosabbarese/ppo-LunarLander-v2-unit8-pt1

Reinforcement Learning • Updated 16 days ago

nasnoussi/ppo-CartPole-v1

Reinforcement Learning • Updated 13 days ago

takedakoji00/Llama-3.1-8B-Instruct-custom-qg-full_20250219-7th_random_pad_is_eos_test

Reinforcement Learning • Updated 14 days ago • 39

baronase/ppo-cleanrl-CartPole-v1

Reinforcement Learning • Updated 15 days ago

baronase/ppo-cleanrl-CartPole-v1_2

Reinforcement Learning • Updated 15 days ago

baronase/ppo-cleanrl-LunarLander-v2_1

Reinforcement Learning • Updated 15 days ago

baronase/ppo-cleanrl-LunarLander-v2_200k

Reinforcement Learning • Updated 15 days ago

takedakoji00/Llama-3.1-8B-Instruct-custom-qg-full_20250219-7th_random_pad_is_eos_ppo_2nd

Reinforcement Learning • Updated 14 days ago • 54

takedakoji00/Llama-3.1-8B-Instruct-custom-qg-full_20250219-7th_random_pad_is_eos_offline_nav

Reinforcement Learning • Updated 13 days ago • 38

Jennny/llama3_samsum_marl_wo_comm

Reinforcement Learning • Updated 12 days ago • 23

Jennny/llama3_dialogsum_marl_wo_comm

Reinforcement Learning • Updated 13 days ago • 12

lucas-palmiro/ppo-LunarLander-v3

Reinforcement Learning • Updated 14 days ago

lucas-palmiro/ppo-early-stopping-LunarLander-v3

Reinforcement Learning • Updated 14 days ago