# ๐Ÿค— Transformers็ฎ€ไป‹ ไธบ [PyTorch](https://pytorch.org/)ใ€[TensorFlow](https://www.tensorflow.org/) ๅ’Œ [JAX](https://jax.readthedocs.io/en/latest/) ๆ‰“้€ ็š„ๅ…ˆ่ฟ›็š„ๆœบๅ™จๅญฆไน ๅทฅๅ…ท. ๐Ÿค— Transformers ๆไพ›ไบ†ๅฏไปฅ่ฝปๆพๅœฐไธ‹่ฝฝๅนถไธ”่ฎญ็ปƒๅ…ˆ่ฟ›็š„้ข„่ฎญ็ปƒๆจกๅž‹็š„ API ๅ’Œๅทฅๅ…ทใ€‚ไฝฟ็”จ้ข„่ฎญ็ปƒๆจกๅž‹ๅฏไปฅๅ‡ๅฐ‘่ฎก็ฎ—ๆถˆ่€—ๅ’Œ็ขณๆŽ’ๆ”พ๏ผŒๅนถไธ”่Š‚็œไปŽๅคด่ฎญ็ปƒๆ‰€้œ€่ฆ็š„ๆ—ถ้—ดๅ’Œ่ต„ๆบใ€‚่ฟ™ไบ›ๆจกๅž‹ๆ”ฏๆŒไธๅŒๆจกๆ€ไธญ็š„ๅธธ่งไปปๅŠก๏ผŒๆฏ”ๅฆ‚๏ผš ๐Ÿ“ **่‡ช็„ถ่ฏญ่จ€ๅค„็†**๏ผšๆ–‡ๆœฌๅˆ†็ฑปใ€ๅ‘ฝๅๅฎžไฝ“่ฏ†ๅˆซใ€้—ฎ็ญ”ใ€่ฏญ่จ€ๅปบๆจกใ€ๆ‘˜่ฆใ€็ฟป่ฏ‘ใ€ๅคš้กน้€‰ๆ‹ฉๅ’Œๆ–‡ๆœฌ็”Ÿๆˆใ€‚
๐Ÿ–ผ๏ธ **ๆœบๅ™จ่ง†่ง‰**๏ผšๅ›พๅƒๅˆ†็ฑปใ€็›ฎๆ ‡ๆฃ€ๆต‹ๅ’Œ่ฏญไน‰ๅˆ†ๅ‰ฒใ€‚
๐Ÿ—ฃ๏ธ **้Ÿณ้ข‘**๏ผš่‡ชๅŠจ่ฏญ้Ÿณ่ฏ†ๅˆซๅ’Œ้Ÿณ้ข‘ๅˆ†็ฑปใ€‚
๐Ÿ™ **ๅคšๆจกๆ€**๏ผš่กจๆ ผ้—ฎ็ญ”ใ€ๅ…‰ๅญฆๅญ—็ฌฆ่ฏ†ๅˆซใ€ไปŽๆ‰ซๆๆ–‡ๆกฃๆๅ–ไฟกๆฏใ€่ง†้ข‘ๅˆ†็ฑปๅ’Œ่ง†่ง‰้—ฎ็ญ”ใ€‚ ๐Ÿค— Transformers ๆ”ฏๆŒๅœจ PyTorchใ€TensorFlow ๅ’Œ JAX ไธŠ็š„ไบ’ๆ“ไฝœๆ€ง. ่ฟ™็ป™ๅœจๆจกๅž‹็š„ๆฏไธช้˜ถๆฎตไฝฟ็”จไธๅŒ็š„ๆก†ๆžถๅธฆๆฅไบ†็ตๆดปๆ€ง๏ผ›ๅœจไธ€ไธชๆก†ๆžถไธญไฝฟ็”จๅ‡ ่กŒไปฃ็ ่ฎญ็ปƒไธ€ไธชๆจกๅž‹๏ผŒ็„ถๅŽๅœจๅฆไธ€ไธชๆก†ๆžถไธญๅŠ ่ฝฝๅฎƒๅนถ่ฟ›่กŒๆŽจ็†ใ€‚ๆจกๅž‹ไนŸๅฏไปฅ่ขซๅฏผๅ‡บไธบ ONNX ๅ’Œ TorchScript ๆ ผๅผ๏ผŒ็”จไบŽๅœจ็”Ÿไบง็Žฏๅขƒไธญ้ƒจ็ฝฒใ€‚ ้ฉฌไธŠๅŠ ๅ…ฅๅœจ [Hub](https://huggingface.co/models)ใ€[่ฎบๅ›](https://discuss.huggingface.co/) ๆˆ–่€… [Discord](https://discord.com/invite/JfAtkvEtRb) ไธŠๆญฃๅœจๅฟซ้€Ÿๅ‘ๅฑ•็š„็คพๅŒบๅง๏ผ ## ๅฆ‚ๆžœไฝ ้œ€่ฆๆฅ่‡ช Hugging Face ๅ›ข้˜Ÿ็š„ไธชๆ€งๅŒ–ๆ”ฏๆŒ HuggingFace Expert Acceleration Program ## ็›ฎๅฝ• ่ฟ™็ฏ‡ๆ–‡ๆกฃ็”ฑไปฅไธ‹ 5 ไธช็ซ ่Š‚็ป„ๆˆ๏ผš - **ๅผ€ๅง‹ไฝฟ็”จ** ๅŒ…ๅซไบ†ๅบ“็š„ๅฟซ้€ŸไธŠๆ‰‹ๅ’Œๅฎ‰่ฃ…่ฏดๆ˜Ž๏ผŒไพฟไบŽ้…็ฝฎๅ’Œ่ฟ่กŒใ€‚ - **ๆ•™็จ‹** ๆ˜ฏไธ€ไธชๅˆๅญฆ่€…ๅผ€ๅง‹็š„ๅฅฝๅœฐๆ–นใ€‚ๆœฌ็ซ ่Š‚ๅฐ†ๅธฎๅŠฉไฝ ่Žทๅพ—ไฝ ไผš็”จๅˆฐ็š„ไฝฟ็”จ่ฟ™ไธชๅบ“็š„ๅŸบๆœฌๆŠ€่ƒฝใ€‚ - **ๆ“ไฝœๆŒ‡ๅ—** ๅ‘ไฝ ๅฑ•็คบๅฆ‚ไฝ•ๅฎž็Žฐไธ€ไธช็‰นๅฎš็›ฎๆ ‡๏ผŒๆฏ”ๅฆ‚ไธบ่ฏญ่จ€ๅปบๆจกๅพฎ่ฐƒไธ€ไธช้ข„่ฎญ็ปƒๆจกๅž‹ๆˆ–่€…ๅฆ‚ไฝ•ๅˆ›้€ ๅนถๅˆ†ไบซไธชๆ€งๅŒ–ๆจกๅž‹ใ€‚ - **ๆฆ‚ๅฟตๆŒ‡ๅ—** ๅฏน ๐Ÿค— Transformers ็š„ๆจกๅž‹๏ผŒไปปๅŠกๅ’Œ่ฎพ่ฎก็†ๅฟต่ƒŒๅŽ็š„ๅŸบๆœฌๆฆ‚ๅฟตๅ’Œๆ€ๆƒณๅšไบ†ๆ›ดๅคš็š„่ฎจ่ฎบๅ’Œ่งฃ้‡Šใ€‚ - **API ไป‹็ป** ๆ่ฟฐไบ†ๆ‰€ๆœ‰็š„็ฑปๅ’Œๅ‡ฝๆ•ฐ๏ผš - **ไธป่ฆ็ฑปๅˆซ** ่ฏฆ่ฟฐไบ†้…็ฝฎ๏ผˆconfiguration๏ผ‰ใ€ๆจกๅž‹๏ผˆmodel๏ผ‰ใ€ๅˆ†่ฏๅ™จ๏ผˆtokenizer๏ผ‰ๅ’Œๆตๆฐด็บฟ๏ผˆpipeline๏ผ‰่ฟ™ๅ‡ ไธชๆœ€้‡่ฆ็š„็ฑปใ€‚ - **ๆจกๅž‹** ่ฏฆ่ฟฐไบ†ๅœจ่ฟ™ไธชๅบ“ไธญๅ’Œๆฏไธชๆจกๅž‹ๅฎž็Žฐๆœ‰ๅ…ณ็š„็ฑปๅ’Œๅ‡ฝๆ•ฐใ€‚ - **ๅ†…้ƒจๅธฎๅŠฉ** ่ฏฆ่ฟฐไบ†ๅ†…้ƒจไฝฟ็”จ็š„ๅทฅๅ…ท็ฑปๅ’Œๅ‡ฝๆ•ฐใ€‚ ### ๆ”ฏๆŒ็š„ๆจกๅž‹ๅ’Œๆก†ๆžถ ไธ‹่กจๅฑ•็คบไบ†ๅบ“ไธญๅฏนๆฏไธชๆจกๅž‹็š„ๆ”ฏๆŒๆƒ…ๅ†ต๏ผŒๅฆ‚ๆ˜ฏๅฆๅ…ทๆœ‰ Python ๅˆ†่ฏๅ™จ๏ผˆ่กจไธญ็š„โ€œTokenizer slowโ€๏ผ‰ใ€ๆ˜ฏๅฆๅ…ทๆœ‰็”ฑ ๐Ÿค— Tokenizers ๅบ“ๆ”ฏๆŒ็š„ๅฟซ้€Ÿๅˆ†่ฏๅ™จ๏ผˆ่กจไธญ็š„โ€œTokenizer fastโ€๏ผ‰ใ€ๆ˜ฏๅฆๆ”ฏๆŒ Jax๏ผˆ้€š่ฟ‡ Flax๏ผ‰ใ€PyTorch ไธŽ TensorFlowใ€‚ | ๆจกๅž‹ | PyTorch ๆ”ฏๆŒ | TensorFlow ๆ”ฏๆŒ | Flax ๆ”ฏๆŒ | |:------------------------------------------------------------------------:|:---------------:|:------------------:|:------------:| | [ALBERT](../en/model_doc/albert.md) | โœ… | โœ… | โœ… | | [ALIGN](../en/model_doc/align.md) | โœ… | โŒ | โŒ | | [AltCLIP](../en/model_doc/altclip) | โœ… | โŒ | โŒ | | [Audio Spectrogram Transformer](../en/model_doc/audio-spectrogram-transformer) | โœ… | โŒ | โŒ | | [Autoformer](../en/model_doc/autoformer) | โœ… | โŒ | โŒ | | [Bark](../en/model_doc/bark) | โœ… | โŒ | โŒ | | [BART](../en/model_doc/bart) | โœ… | โœ… | โœ… | | [BARThez](../en/model_doc/barthez) | โœ… | โœ… | โœ… | | [BARTpho](../en/model_doc/bartpho) | โœ… | โœ… | โœ… | | [BEiT](../en/model_doc/beit) | โœ… | โŒ | โœ… | | [BERT](../en/model_doc/bert) | โœ… | โœ… | โœ… | | [Bert Generation](../en/model_doc/bert-generation) | โœ… | โŒ | โŒ | | [BertJapanese](../en/model_doc/bert-japanese) | โœ… | โœ… | โœ… | | [BERTweet](../en/model_doc/bertweet) | โœ… | โœ… | โœ… | | [BigBird](../en/model_doc/big_bird) | โœ… | โŒ | โœ… | | [BigBird-Pegasus](../en/model_doc/bigbird_pegasus) | โœ… | โŒ | โŒ | | [BioGpt](../en/model_doc/biogpt) | โœ… | โŒ | โŒ | | [BiT](../en/model_doc/bit) | โœ… | โŒ | โŒ | | [Blenderbot](../en/model_doc/blenderbot) | โœ… | โœ… | โœ… | | [BlenderbotSmall](../en/model_doc/blenderbot-small) | โœ… | โœ… | โœ… | | [BLIP](../en/model_doc/blip) | โœ… | โœ… | โŒ | | [BLIP-2](../en/model_doc/blip-2) | โœ… | โŒ | โŒ | | [BLOOM](../en/model_doc/bloom) | โœ… | โŒ | โœ… | | [BORT](../en/model_doc/bort) | โœ… | โœ… | โœ… | | [BridgeTower](../en/model_doc/bridgetower) | โœ… | โŒ | โŒ | | [BROS](../en/model_doc/bros) | โœ… | โŒ | โŒ | | [ByT5](../en/model_doc/byt5) | โœ… | โœ… | โœ… | | [CamemBERT](../en/model_doc/camembert) | โœ… | โœ… | โŒ | | [CANINE](../en/model_doc/canine) | โœ… | โŒ | โŒ | | [Chinese-CLIP](../en/model_doc/chinese_clip) | โœ… | โŒ | โŒ | | [CLAP](../en/model_doc/clap) | โœ… | โŒ | โŒ | | [CLIP](../en/model_doc/clip) | โœ… | โœ… | โœ… | | [CLIPSeg](../en/model_doc/clipseg) | โœ… | โŒ | โŒ | | [CLVP](../en/model_doc/clvp) | โœ… | โŒ | โŒ | | [CodeGen](../en/model_doc/codegen) | โœ… | โŒ | โŒ | | [CodeLlama](../en/model_doc/code_llama) | โœ… | โŒ | โœ… | | [Conditional DETR](../en/model_doc/conditional_detr) | โœ… | โŒ | โŒ | | [ConvBERT](../en/model_doc/convbert) | โœ… | โœ… | โŒ | | [ConvNeXT](../en/model_doc/convnext) | โœ… | โœ… | โŒ | | [ConvNeXTV2](../en/model_doc/convnextv2) | โœ… | โœ… | โŒ | | [CPM](../en/model_doc/cpm) | โœ… | โœ… | โœ… | | [CPM-Ant](../en/model_doc/cpmant) | โœ… | โŒ | โŒ | | [CTRL](../en/model_doc/ctrl) | โœ… | โœ… | โŒ | | [CvT](../en/model_doc/cvt) | โœ… | โœ… | โŒ | | [Data2VecAudio](../en/model_doc/data2vec) | โœ… | โŒ | โŒ | | [Data2VecText](../en/model_doc/data2vec) | โœ… | โŒ | โŒ | | [Data2VecVision](../en/model_doc/data2vec) | โœ… | โœ… | โŒ | | [DeBERTa](../en/model_doc/deberta) | โœ… | โœ… | โŒ | | [DeBERTa-v2](../en/model_doc/deberta-v2) | โœ… | โœ… | โŒ | | [Decision Transformer](../en/model_doc/decision_transformer) | โœ… | โŒ | โŒ | | [Deformable DETR](../en/model_doc/deformable_detr) | โœ… | โŒ | โŒ | | [DeiT](../en/model_doc/deit) | โœ… | โœ… | โŒ | | [DePlot](../en/model_doc/deplot) | โœ… | โŒ | โŒ | | [Depth Anything](../en/model_doc/depth_anything) | โœ… | โŒ | โŒ | | [DETA](../en/model_doc/deta) | โœ… | โŒ | โŒ | | [DETR](../en/model_doc/detr) | โœ… | โŒ | โŒ | | [DialoGPT](../en/model_doc/dialogpt) | โœ… | โœ… | โœ… | | [DiNAT](../en/model_doc/dinat) | โœ… | โŒ | โŒ | | [DINOv2](../en/model_doc/dinov2) | โœ… | โŒ | โŒ | | [DistilBERT](../en/model_doc/distilbert) | โœ… | โœ… | โœ… | | [DiT](../en/model_doc/dit) | โœ… | โŒ | โœ… | | [DonutSwin](../en/model_doc/donut) | โœ… | โŒ | โŒ | | [DPR](../en/model_doc/dpr) | โœ… | โœ… | โŒ | | [DPT](../en/model_doc/dpt) | โœ… | โŒ | โŒ | | [EfficientFormer](../en/model_doc/efficientformer) | โœ… | โœ… | โŒ | | [EfficientNet](../en/model_doc/efficientnet) | โœ… | โŒ | โŒ | | [ELECTRA](../en/model_doc/electra) | โœ… | โœ… | โœ… | | [EnCodec](../en/model_doc/encodec) | โœ… | โŒ | โŒ | | [Encoder decoder](../en/model_doc/encoder-decoder) | โœ… | โœ… | โœ… | | [ERNIE](../en/model_doc/ernie) | โœ… | โŒ | โŒ | | [ErnieM](../en/model_doc/ernie_m) | โœ… | โŒ | โŒ | | [ESM](../en/model_doc/esm) | โœ… | โœ… | โŒ | | [FairSeq Machine-Translation](../en/model_doc/fsmt) | โœ… | โŒ | โŒ | | [Falcon](../en/model_doc/falcon) | โœ… | โŒ | โŒ | | [FastSpeech2Conformer](../en/model_doc/fastspeech2_conformer) | โœ… | โŒ | โŒ | | [FLAN-T5](../en/model_doc/flan-t5) | โœ… | โœ… | โœ… | | [FLAN-UL2](../en/model_doc/flan-ul2) | โœ… | โœ… | โœ… | | [FlauBERT](../en/model_doc/flaubert) | โœ… | โœ… | โŒ | | [FLAVA](../en/model_doc/flava) | โœ… | โŒ | โŒ | | [FNet](../en/model_doc/fnet) | โœ… | โŒ | โŒ | | [FocalNet](../en/model_doc/focalnet) | โœ… | โŒ | โŒ | | [Funnel Transformer](../en/model_doc/funnel) | โœ… | โœ… | โŒ | | [Fuyu](../en/model_doc/fuyu) | โœ… | โŒ | โŒ | | [Gemma](../en/model_doc/gemma) | โœ… | โŒ | โœ… | | [GIT](../en/model_doc/git) | โœ… | โŒ | โŒ | | [GLPN](../en/model_doc/glpn) | โœ… | โŒ | โŒ | | [GPT Neo](../en/model_doc/gpt_neo) | โœ… | โŒ | โœ… | | [GPT NeoX](../en/model_doc/gpt_neox) | โœ… | โŒ | โŒ | | [GPT NeoX Japanese](../en/model_doc/gpt_neox_japanese) | โœ… | โŒ | โŒ | | [GPT-J](../en/model_doc/gptj) | โœ… | โœ… | โœ… | | [GPT-Sw3](../en/model_doc/gpt-sw3) | โœ… | โœ… | โœ… | | [GPTBigCode](../en/model_doc/gpt_bigcode) | โœ… | โŒ | โŒ | | [GPTSAN-japanese](../en/model_doc/gptsan-japanese) | โœ… | โŒ | โŒ | | [Graphormer](../en/model_doc/graphormer) | โœ… | โŒ | โŒ | | [GroupViT](../en/model_doc/groupvit) | โœ… | โœ… | โŒ | | [HerBERT](../en/model_doc/herbert) | โœ… | โœ… | โœ… | | [Hubert](../en/model_doc/hubert) | โœ… | โœ… | โŒ | | [I-BERT](../en/model_doc/ibert) | โœ… | โŒ | โŒ | | [IDEFICS](../en/model_doc/idefics) | โœ… | โŒ | โŒ | | [ImageGPT](../en/model_doc/imagegpt) | โœ… | โŒ | โŒ | | [Informer](../en/model_doc/informer) | โœ… | โŒ | โŒ | | [InstructBLIP](../en/model_doc/instructblip) | โœ… | โŒ | โŒ | | [Jukebox](../en/model_doc/jukebox) | โœ… | โŒ | โŒ | | [KOSMOS-2](../en/model_doc/kosmos-2) | โœ… | โŒ | โŒ | | [LayoutLM](../en/model_doc/layoutlm) | โœ… | โœ… | โŒ | | [LayoutLMv2](../en/model_doc/layoutlmv2) | โœ… | โŒ | โŒ | | [LayoutLMv3](../en/model_doc/layoutlmv3) | โœ… | โœ… | โŒ | | [LayoutXLM](../en/model_doc/layoutxlm) | โœ… | โŒ | โŒ | | [LED](../en/model_doc/led) | โœ… | โœ… | โŒ | | [LeViT](../en/model_doc/levit) | โœ… | โŒ | โŒ | | [LiLT](../en/model_doc/lilt) | โœ… | โŒ | โŒ | | [LLaMA](../en/model_doc/llama) | โœ… | โŒ | โœ… | | [Llama2](../en/model_doc/llama2) | โœ… | โŒ | โœ… | | [LLaVa](../en/model_doc/llava) | โœ… | โŒ | โŒ | | [Longformer](../en/model_doc/longformer) | โœ… | โœ… | โŒ | | [LongT5](../en/model_doc/longt5) | โœ… | โŒ | โœ… | | [LUKE](../en/model_doc/luke) | โœ… | โŒ | โŒ | | [LXMERT](../en/model_doc/lxmert) | โœ… | โœ… | โŒ | | [M-CTC-T](../en/model_doc/mctct) | โœ… | โŒ | โŒ | | [M2M100](../en/model_doc/m2m_100) | โœ… | โŒ | โŒ | | [MADLAD-400](../en/model_doc/madlad-400) | โœ… | โœ… | โœ… | | [Marian](../en/model_doc/marian) | โœ… | โœ… | โœ… | | [MarkupLM](../en/model_doc/markuplm) | โœ… | โŒ | โŒ | | [Mask2Former](../en/model_doc/mask2former) | โœ… | โŒ | โŒ | | [MaskFormer](../en/model_doc/maskformer) | โœ… | โŒ | โŒ | | [MatCha](../en/model_doc/matcha) | โœ… | โŒ | โŒ | | [mBART](../en/model_doc/mbart) | โœ… | โœ… | โœ… | | [mBART-50](../en/model_doc/mbart50) | โœ… | โœ… | โœ… | | [MEGA](../en/model_doc/mega) | โœ… | โŒ | โŒ | | [Megatron-BERT](../en/model_doc/megatron-bert) | โœ… | โŒ | โŒ | | [Megatron-GPT2](../en/model_doc/megatron_gpt2) | โœ… | โœ… | โœ… | | [MGP-STR](../en/model_doc/mgp-str) | โœ… | โŒ | โŒ | | [Mistral](../en/model_doc/mistral) | โœ… | โŒ | โœ… | | [Mixtral](../en/model_doc/mixtral) | โœ… | โŒ | โŒ | | [mLUKE](../en/model_doc/mluke) | โœ… | โŒ | โŒ | | [MMS](../en/model_doc/mms) | โœ… | โœ… | โœ… | | [MobileBERT](../en/model_doc/mobilebert) | โœ… | โœ… | โŒ | | [MobileNetV1](../en/model_doc/mobilenet_v1) | โœ… | โŒ | โŒ | | [MobileNetV2](../en/model_doc/mobilenet_v2) | โœ… | โŒ | โŒ | | [MobileViT](../en/model_doc/mobilevit) | โœ… | โœ… | โŒ | | [MobileViTV2](../en/model_doc/mobilevitv2) | โœ… | โŒ | โŒ | | [MPNet](../en/model_doc/mpnet) | โœ… | โœ… | โŒ | | [MPT](../en/model_doc/mpt) | โœ… | โŒ | โŒ | | [MRA](../en/model_doc/mra) | โœ… | โŒ | โŒ | | [MT5](../en/model_doc/mt5) | โœ… | โœ… | โœ… | | [MusicGen](../en/model_doc/musicgen) | โœ… | โŒ | โŒ | | [MVP](../en/model_doc/mvp) | โœ… | โŒ | โŒ | | [NAT](../en/model_doc/nat) | โœ… | โŒ | โŒ | | [Nezha](../en/model_doc/nezha) | โœ… | โŒ | โŒ | | [NLLB](../en/model_doc/nllb) | โœ… | โŒ | โŒ | | [NLLB-MOE](../en/model_doc/nllb-moe) | โœ… | โŒ | โŒ | | [Nougat](../en/model_doc/nougat) | โœ… | โœ… | โœ… | | [Nystrรถmformer](../en/model_doc/nystromformer) | โœ… | โŒ | โŒ | | [OneFormer](../en/model_doc/oneformer) | โœ… | โŒ | โŒ | | [OpenAI GPT](../en/model_doc/openai-gpt) | โœ… | โœ… | โŒ | | [OpenAI GPT-2](../en/model_doc/gpt2) | โœ… | โœ… | โœ… | | [OpenLlama](../en/model_doc/open-llama) | โœ… | โŒ | โŒ | | [OPT](../en/model_doc/opt) | โœ… | โœ… | โœ… | | [OWL-ViT](../en/model_doc/owlvit) | โœ… | โŒ | โŒ | | [OWLv2](../en/model_doc/owlv2) | โœ… | โŒ | โŒ | | [PatchTSMixer](../en/model_doc/patchtsmixer) | โœ… | โŒ | โŒ | | [PatchTST](../en/model_doc/patchtst) | โœ… | โŒ | โŒ | | [Pegasus](../en/model_doc/pegasus) | โœ… | โœ… | โœ… | | [PEGASUS-X](../en/model_doc/pegasus_x) | โœ… | โŒ | โŒ | | [Perceiver](../en/model_doc/perceiver) | โœ… | โŒ | โŒ | | [Persimmon](../en/model_doc/persimmon) | โœ… | โŒ | โŒ | | [Phi](../en/model_doc/phi) | โœ… | โŒ | โŒ | | [PhoBERT](../en/model_doc/phobert) | โœ… | โœ… | โœ… | | [Pix2Struct](../en/model_doc/pix2struct) | โœ… | โŒ | โŒ | | [PLBart](../en/model_doc/plbart) | โœ… | โŒ | โŒ | | [PoolFormer](../en/model_doc/poolformer) | โœ… | โŒ | โŒ | | [Pop2Piano](../en/model_doc/pop2piano) | โœ… | โŒ | โŒ | | [ProphetNet](../en/model_doc/prophetnet) | โœ… | โŒ | โŒ | | [PVT](../en/model_doc/pvt) | โœ… | โŒ | โŒ | | [QDQBert](../en/model_doc/qdqbert) | โœ… | โŒ | โŒ | | [Qwen2](../en/model_doc/qwen2) | โœ… | โŒ | โŒ | | [RAG](../en/model_doc/rag) | โœ… | โœ… | โŒ | | [REALM](../en/model_doc/realm) | โœ… | โŒ | โŒ | | [Reformer](../en/model_doc/reformer) | โœ… | โŒ | โŒ | | [RegNet](../en/model_doc/regnet) | โœ… | โœ… | โœ… | | [RemBERT](../en/model_doc/rembert) | โœ… | โœ… | โŒ | | [ResNet](../en/model_doc/resnet) | โœ… | โœ… | โœ… | | [RetriBERT](../en/model_doc/retribert) | โœ… | โŒ | โŒ | | [RoBERTa](../en/model_doc/roberta) | โœ… | โœ… | โœ… | | [RoBERTa-PreLayerNorm](../en/model_doc/roberta-prelayernorm) | โœ… | โœ… | โœ… | | [RoCBert](../en/model_doc/roc_bert) | โœ… | โŒ | โŒ | | [RoFormer](../en/model_doc/roformer) | โœ… | โœ… | โœ… | | [RWKV](../en/model_doc/rwkv) | โœ… | โŒ | โŒ | | [SAM](../en/model_doc/sam) | โœ… | โœ… | โŒ | | [SeamlessM4T](../en/model_doc/seamless_m4t) | โœ… | โŒ | โŒ | | [SeamlessM4Tv2](../en/model_doc/seamless_m4t_v2) | โœ… | โŒ | โŒ | | [SegFormer](../en/model_doc/segformer) | โœ… | โœ… | โŒ | | [SegGPT](../en/model_doc/seggpt) | โœ… | โŒ | โŒ | | [SEW](../en/model_doc/sew) | โœ… | โŒ | โŒ | | [SEW-D](../en/model_doc/sew-d) | โœ… | โŒ | โŒ | | [SigLIP](../en/model_doc/siglip) | โœ… | โŒ | โŒ | | [Speech Encoder decoder](../en/model_doc/speech-encoder-decoder) | โœ… | โŒ | โœ… | | [Speech2Text](../en/model_doc/speech_to_text) | โœ… | โœ… | โŒ | | [SpeechT5](../en/model_doc/speecht5) | โœ… | โŒ | โŒ | | [Splinter](../en/model_doc/splinter) | โœ… | โŒ | โŒ | | [SqueezeBERT](../en/model_doc/squeezebert) | โœ… | โŒ | โŒ | | [StableLm](../en/model_doc/stablelm) | โœ… | โŒ | โŒ | | [Starcoder2](../en/model_doc/starcoder2) | โœ… | โŒ | โŒ | | [SwiftFormer](../en/model_doc/swiftformer) | โœ… | โŒ | โŒ | | [Swin Transformer](../en/model_doc/swin) | โœ… | โœ… | โŒ | | [Swin Transformer V2](../en/model_doc/swinv2) | โœ… | โŒ | โŒ | | [Swin2SR](../en/model_doc/swin2sr) | โœ… | โŒ | โŒ | | [SwitchTransformers](../en/model_doc/switch_transformers) | โœ… | โŒ | โŒ | | [T5](../en/model_doc/t5) | โœ… | โœ… | โœ… | | [T5v1.1](../en/model_doc/t5v1.1) | โœ… | โœ… | โœ… | | [Table Transformer](../en/model_doc/table-transformer) | โœ… | โŒ | โŒ | | [TAPAS](../en/model_doc/tapas) | โœ… | โœ… | โŒ | | [TAPEX](../en/model_doc/tapex) | โœ… | โœ… | โœ… | | [Time Series Transformer](../en/model_doc/time_series_transformer) | โœ… | โŒ | โŒ | | [TimeSformer](../en/model_doc/timesformer) | โœ… | โŒ | โŒ | | [Trajectory Transformer](../en/model_doc/trajectory_transformer) | โœ… | โŒ | โŒ | | [Transformer-XL](../en/model_doc/transfo-xl) | โœ… | โœ… | โŒ | | [TrOCR](../en/model_doc/trocr) | โœ… | โŒ | โŒ | | [TVLT](../en/model_doc/tvlt) | โœ… | โŒ | โŒ | | [TVP](../en/model_doc/tvp) | โœ… | โŒ | โŒ | | [UL2](../en/model_doc/ul2) | โœ… | โœ… | โœ… | | [UMT5](../en/model_doc/umt5) | โœ… | โŒ | โŒ | | [UniSpeech](../en/model_doc/unispeech) | โœ… | โŒ | โŒ | | [UniSpeechSat](../en/model_doc/unispeech-sat) | โœ… | โŒ | โŒ | | [UnivNet](../en/model_doc/univnet) | โœ… | โŒ | โŒ | | [UPerNet](../en/model_doc/upernet) | โœ… | โŒ | โŒ | | [VAN](../en/model_doc/van) | โœ… | โŒ | โŒ | | [VideoMAE](../en/model_doc/videomae) | โœ… | โŒ | โŒ | | [ViLT](../en/model_doc/vilt) | โœ… | โŒ | โŒ | | [VipLlava](../en/model_doc/vipllava) | โœ… | โŒ | โŒ | | [Vision Encoder decoder](../en/model_doc/vision-encoder-decoder) | โœ… | โœ… | โœ… | | [VisionTextDualEncoder](../en/model_doc/vision-text-dual-encoder) | โœ… | โœ… | โœ… | | [VisualBERT](../en/model_doc/visual_bert) | โœ… | โŒ | โŒ | | [ViT](../en/model_doc/vit) | โœ… | โœ… | โœ… | | [ViT Hybrid](../en/model_doc/vit_hybrid) | โœ… | โŒ | โŒ | | [VitDet](../en/model_doc/vitdet) | โœ… | โŒ | โŒ | | [ViTMAE](../en/model_doc/vit_mae) | โœ… | โœ… | โŒ | | [ViTMatte](../en/model_doc/vitmatte) | โœ… | โŒ | โŒ | | [ViTMSN](../en/model_doc/vit_msn) | โœ… | โŒ | โŒ | | [VITS](../en/model_doc/vits) | โœ… | โŒ | โŒ | | [ViViT](../en/model_doc/vivit) | โœ… | โŒ | โŒ | | [Wav2Vec2](../en/model_doc/wav2vec2) | โœ… | โœ… | โœ… | | [Wav2Vec2-BERT](../en/model_doc/wav2vec2-bert) | โœ… | โŒ | โŒ | | [Wav2Vec2-Conformer](../en/model_doc/wav2vec2-conformer) | โœ… | โŒ | โŒ | | [Wav2Vec2Phoneme](../en/model_doc/wav2vec2_phoneme) | โœ… | โœ… | โœ… | | [WavLM](../en/model_doc/wavlm) | โœ… | โŒ | โŒ | | [Whisper](../en/model_doc/whisper) | โœ… | โœ… | โœ… | | [X-CLIP](../en/model_doc/xclip) | โœ… | โŒ | โŒ | | [X-MOD](../en/model_doc/xmod) | โœ… | โŒ | โŒ | | [XGLM](../en/model_doc/xglm) | โœ… | โœ… | โœ… | | [XLM](../en/model_doc/xlm) | โœ… | โœ… | โŒ | | [XLM-ProphetNet](../en/model_doc/xlm-prophetnet) | โœ… | โŒ | โŒ | | [XLM-RoBERTa](../en/model_doc/xlm-roberta) | โœ… | โœ… | โœ… | | [XLM-RoBERTa-XL](../en/model_doc/xlm-roberta-xl) | โœ… | โŒ | โŒ | | [XLM-V](../en/model_doc/xlm-v) | โœ… | โœ… | โœ… | | [XLNet](../en/model_doc/xlnet) | โœ… | โœ… | โŒ | | [XLS-R](../en/model_doc/xls_r) | โœ… | โœ… | โœ… | | [XLSR-Wav2Vec2](../en/model_doc/xlsr_wav2vec2) | โœ… | โœ… | โœ… | | [YOLOS](../en/model_doc/yolos) | โœ… | โŒ | โŒ | | [YOSO](../en/model_doc/yoso) | โœ… | โŒ | โŒ |