merve
/

Qwen2.5-VL-3B-Instruct-trl-mpo-rlaif-v

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Qwen2.5-VL-3B-Instruct-trl-mpo-rlaif-v

95.6 MB

1 contributor

History: 27 commits

merve's picture

merve HF Staff

Training in progress, step 124

62addfd verified about 1 month ago