INFO:
练习两分半,使用DeepSeek-R1蒸馏训练自己的本地小模型(Qwen2.5-0.5B),原理流程全讲解,模型数据全给你