MiniMax-01: Escalando modelos de fundação com Lightning Attention
1:21:39
DeepSeek-V3
59:24
Titans: Learning to Memorize at Test Time
40:03
Ampliando modelos de difusão mascarados em texto
57:45
Visualizing transformers and attention | Talk for TNG Big Tech Day '24
48:53
O alinhamento de segurança deve ser feito em mais do que apenas alguns tokens de profundidade (Pa...
1:14:43
Mamba 2 - Transformers are SSMs: Generalized Models and Efficient Algorithms Through SSS Duality
27:22
AI Is Making You An Illiterate Programmer
36:55