Neurosignal
Le signal dans le bruit
Vendredi 19 juin 2026
À la une

CoAT : Pensée Audio Continue pour les Modèles Audio-Langage

Les modèles audio-langage (LALMs) peinent à générer des réponses temporellement cohérentes, car leur entraînement privilégie l’alignement texte. CoAT introduit un latent workspace continu couplé à une distillation d’experts audio pour produire des sorties alignées dans le temps (ex : transcription + analyse musicale synchronisée). Impact : applications en IA conversationnelle multimodale (ex : assistants vocaux contextuels) et en édition audio automatisée.

En bref