#240 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via RL

1:19:37
Paper: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

1:23:41
Denny Zhou: LLM Reasoning: Key Ideas and Limitations

18:41
DeepSeek R1: incentiva la capacidad de razonamiento en los LLM mediante el aprendizaje por refuer...

21:10
#229 MiniCPM-V: A GPT-4V Level MLLM on Your Phone

29:38
Formación de LLM para jugar al ajedrez mediante aprendizaje por refuerzo GRPO de Deepseek

15:49
Le pregunté a DeepSeek cómo convertirse en analista de datos (me asustó)

14:21
Building a fully local "deep researcher" with DeepSeek-R1

56:06