Spécialisés dans les données séquentielles (texte, audio, time series).
Variantes de RNN qui résolvent le problème de la mémoire à long terme.
L architecture qui a tout changé ! Attention mechanism permet de traiter toute la séquence en parallèle.