INFO:
DeepSeek R1 大模型微调 基于unsloth微调框架与LoRA以及CoT问答数据集 wandb可视化训练日志 大模型微调与推理全流程实战