PrismXu
/

DeepSeek-R1-Distill-Qwen-7B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-7B-GRPO

15.2 GB

1 contributor

History: 5 commits

PrismXu's picture

Training in progress, step 20

7b58938 verified 10 months ago