Models

928

Full-text search

Active filters: orpo, trl

alexxbobr/ORPO3000vladdata

Text Generation • 0.5B • Updated Nov 19, 2025 • 4

AlekseyCalvin/Lyrical_ru2En_Gemma3_27b

Updated Nov 24, 2025

AlekseyCalvin/Lyrical_rus2eng_Gemma3_27b

Updated Nov 24, 2025

AlekseyCalvin/Lyrical_rus2eng_Gemma3_27bFornax

Updated Nov 24, 2025

alexxbobr/ORPO5000vladdata

Text Generation • 0.5B • Updated Nov 27, 2025 • 5

wesjos/Qwen3-4B-humanlike

Text Generation • 4B • Updated Nov 29, 2025 • 5

wesjos/Qwen3-4B-harmfull

Text Generation • 4B • Updated Dec 3, 2025 • 8

mradermacher/Qwen3-4B-harmfull-GGUF

4B • Updated Dec 3, 2025 • 64

rsmillie94/task-17-PHI4-DUAL-STAGE

Text Generation • Updated Dec 9, 2025

rsmillie94/task-17-PHI4-DUAL-STAGE-v2

Text Generation • Updated Dec 9, 2025

ruhul590/Mistral7b-ORPO-lora

Updated Dec 21, 2025

AlekseyCalvin/LYRICAL_MT_ru2en_BolmoORPO

Updated Dec 21, 2025

AlekseyCalvin/LYRICAL_MT_ru2en_BolmoORPO2

Updated Dec 22, 2025

stmasson/mistral-7b-n8n-thinking-orpo

Updated Dec 23, 2025

broadfield-dev/be1767087851-adapter

Updated Dec 30, 2025

broadfield-dev/answer1767088548-adapter

Updated Dec 30, 2025

broadfield-dev/be1767089366-adapter

Updated Dec 30, 2025

broadfield-dev/directly1767609122-adapter

asianaaibigdata/llama3.2-3b-orpo

Text Generation • Updated Jan 8

asianaaibigdata/llama3-8b-orpo

Text Generation • Updated Jan 9

broadfield-dev/talk-1768026678-adapter

broadfield-dev/talk-1768027146-adapter

broadfield-dev/respond-1768032636-adapter

broadfield-dev/respond-1768033389-adapter

broadfield-dev/respond-1768037162-adapter

debaterhub/ipda-debater-depth-lora-iter1

Updated Jan 10 • 1

debaterhub/ipda-debater-depth-lora-iter2

Updated Jan 10 • 1

debaterhub/ipda-debater-bias-lora

Updated Jan 10 • 1

alexxbobr/ORPO15000

Text Generation • 0.5B • Updated Jan 14 • 5

simonlesaumon/Llama-3.2-3B-Humanizer-ORPO-Raw

Text Generation • 3B • Updated Jan 17 • 2