INFO:
最少可以用2张22G的2080Ti来运行DeepSeek-R1 671B模型,推理速度可达3.54tokens/s