上手代码复现DeepSeek R1强化学习训练演示
![](https://i.ytimg.com/vi/b_OpjUz7zN8/mqdefault.jpg)
1:20:33
硅谷视角深聊:DeepSeek的颠覆、冲击、争议和误解
![](https://i.ytimg.com/vi/aNisiIo1xBY/mqdefault.jpg)
13:58
Unsloth训练自己的R1推理模型 - DeepSeek GRPO
![](https://i.ytimg.com/vi/vE9J_IPTzco/mqdefault.jpg)
31:50
有难度但必读的一篇论文《DeepSeekMath》
![](https://i.ytimg.com/vi/Ac6XGqeyMCc/mqdefault.jpg)
20:21
DeepSeek-R1本地+API最强部署,8b+70b+671b满血版!联网搜索+公网访问+思考推理+全终端可用!Ollama+OpenWebUI
![](https://i.ytimg.com/vi/AEYeUINqIF8/mqdefault.jpg)
38:10
读R1的训练过程《DeepSeek R1》论文导读
![](https://i.ytimg.com/vi/AExyd-QYxhc/mqdefault.jpg)
1:23:18
OpenAI Deep Research,让普通人一下变强好几倍的的主题研究 Agent!|深度测评、分析与使用教程
![](https://i.ytimg.com/vi/QdEuh2UVbu0/mqdefault.jpg)
25:36
DeepSeek R1 Theory Overview | GRPO + RL + SFT
![](https://i.ytimg.com/vi/kbqQnn6BS-g/mqdefault.jpg)
1:01:28