Там ребята из ETH и MATS запилили интересную статью: придумали, как заставить текстовые нейронки подсвечивать свои галлюцинации прямо во время ответа. Очень часто бывает так, что LLM пишут простыню, где половина фактов реальные, а половина уровня «Альберт Эйнштейн изобрёл Гугл в 2007 году». Поймать это раньше можно было только длинными и дорогими проверками через поиск. Теперь же на внутренние слои модели повесили детектор ерунды. И он по токенам в реальном времени понимает, где имя/дата/ссылка выдуманы. В итоге на длинных текстах детектор стал ловить враньё почти в полтора раза лучше, чем старые методы. В идеале это приведёт к тому, что модели научатся не только отвечать, но и честно показывать, где они уверены, а где сами сомневаются. Тут сама статья.