Edit Models filters

Multimodal

Image-Text-to-Text

Visual Question Answering

Document Question Answering

Video-Text-to-Text

Audio-Text-to-Text

Visual Document Retrieval

Computer Vision

Image Classification

Object Detection

Video Classification

Image Segmentation

Image Feature Extraction

Zero-Shot Image Classification

Depth Estimation

Zero-Shot Object Detection

Unconditional Image Generation

Keypoint Detection

Mask Generation

Natural Language Processing

Text Generation

Text Classification

Text2Text Generation

Token Classification

Feature Extraction

Question Answering

Sentence Similarity

Zero-Shot Classification

Table Question Answering

Audio

Automatic Speech Recognition

Audio Classification

Voice Activity Detection

Tabular

Tabular Classification

Time Series Forecasting

Tabular Regression

Reinforcement Learning

Reinforcement Learning

Other

Graph Machine Learning

Models

956

Full-text search

Active filters: reinforcement-learning, transformers

JiajingChen/9

Reinforcement Learning • Updated Feb 16, 2024

gabrielbenabou/Reinforce-CartPole-v1

Reinforcement Learning • Updated Feb 20, 2024

zhudanhao/RlCourse

Reinforcement Learning • Updated Feb 17, 2024

yuchiz/lmrl-7b

Reinforcement Learning • Updated Feb 18, 2024

yuchiz/cache

Reinforcement Learning • Updated Feb 20, 2024

VATSAL1729/LUNARLANDERV2

Reinforcement Learning • Updated Feb 25, 2024

swritchie/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 4, 2024

yuchiz/models

Reinforcement Learning • Updated Mar 6, 2024

katk31/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 11, 2024

csshali/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 15, 2024

DarshanDeshpande/gemma_2b_oasst1_ppo_model

Reinforcement Learning • Updated Mar 14, 2024

magjico/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 26, 2024

milotix/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 26, 2024

satcos/DT-BipedalWalker-v3

Reinforcement Learning • Updated Mar 21, 2024

pepijn223/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 24, 2024

AdityaNerpagar/RLcourse

Reinforcement Learning • Updated Mar 22, 2024

MuntasirHossain/flan-t5-large-samsum-qlora-ppo

Reinforcement Learning • Updated Mar 26, 2024

deepaknh/falcon7B_rlhf_v1

Reinforcement Learning • Updated Mar 29, 2024

baek26/billsum_2052_bart-base

Reinforcement Learning • Updated Apr 1, 2024

baek26/wiki_asp-animal_8989_bart-base

Reinforcement Learning • Updated Apr 2, 2024

baek26/wiki_asp-animal_9617_bart-base

Reinforcement Learning • Updated Apr 2, 2024

baek26/wiki_asp-educational_institution_6506_bart-base

Reinforcement Learning • Updated Apr 3, 2024

baek26/wiki_asp-educational_institution_3034_bart-base

Reinforcement Learning • Updated Apr 3, 2024

baek26/wiki_asp-animal_9009_bart-base

Reinforcement Learning • Updated Apr 3, 2024

baek26/wiki_asp-software_9089_bart-base

Reinforcement Learning • Updated Apr 3, 2024

baek26/wiki_asp-written_work_9465_bart-base

Reinforcement Learning • Updated Apr 3, 2024

NicolasYn/ppo8-LunarLander-v2

Reinforcement Learning • Updated Apr 6, 2024

baek26/wiki_asp-software_3100_bart-base

Reinforcement Learning • Updated Apr 3, 2024

baek26/wiki_asp-written_work_4057_bart-base

Reinforcement Learning • Updated Apr 3, 2024

baek26/wiki_asp-software_7902_bart-base

Reinforcement Learning • Updated Apr 4, 2024