Прикольная работа прошлого года, которая в этом году доехала до ICML 2025: https://t.me/gonzo_ML_podcasts/397 Внутри VLM формируются кросс-модальные репрезентации задач, и их можно извлечь и использовать.