Training Software Engineering Agents and Verifiers with SWE-Gym · Minideo

Training Software Engineering Agents and Verifiers with SWE-Gym

15:36

Diving into Self Evolving Training for Multimodal Reasoning

23:15

YuLan-Mini: An Open Data-efficient Language Model

12:59

TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks

22:01

Offline Reinforcement Learning for LLM Multi-Step Reasoning

10:07

How Well Do LLMs Generate Code for Different Application Domains? Benchmark and Evaluation

10:03

Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs

15:41

On the Evaluation of Large Language Models in Unit Test Generation

1:20:35

🐙 Lunch & Learn: AI Fundamentals for 2025