"Насколько маленькая LLM модель может вытянуть Deep Research? Насколько плохо или хорошо это будет выглядеть? Насколько будет ерунда под капотом? Можно заглянуть под капот размышлений относительно небольшой модели gpt-4o-mini/Qwen2.5-7B-Instruct в режиме SGR (NextStep архитектура). Валера навайбкодил интерфейс для отладки, который показывает ход размышлений и вызова инструментов Да, в проде люди используют модели побольше. Но ведь реально интересно, как будет себя вести крохотная модель, которую даже не обучали под reasoning, но потом заставили следовать схеме размышлений. Вот, например, результат ответа на вопрос ""Find the price of Bitcoin today and find the price for 2023 and 2024"" при помощи qwen2.5-7B-Instruct: трейс размышлений c вызовами инструментов и финальный отчет. Ваш, @llm_under_hood 🤗"
"Насколько маленькая LLM модель может вытянуть Deep Research? Насколько плохо…
Из этого канала
- #660"Эпилог спасательного проекта и ответы на некоторые вопросы (В прошлых сериях:…
"Эпилог спасательного проекта и ответы на некоторые вопросы (В прошлых сериях: 1, 2, 3, 4, 5, 6+7) Клиент потом довольно сказал, что “was very happy about the…
- #661Вот тот самый тайный первый промпт, который отвечает за самую сложную часть…
Вот тот самый тайный первый промпт, который отвечает за самую сложную часть анализа документов в завершенном проекте (см выше).
- #662Результаты опроса про внедрение Schema-Guided Reasoning в компаниях Всего был…
Результаты опроса про внедрение Schema-Guided Reasoning в компаниях Всего был заполнен 21 опросник (ссылка).
- #658В каких компаниях вопросы про SGR стоят острее всего? Это предварительные…
В каких компаниях вопросы про SGR стоят острее всего? Это предварительные данные опроса ранее.
- #657Давайте соберем карту внедрений SGR и список частых вопросов по ним В…
Давайте соберем карту внедрений SGR и список частых вопросов по ним В коммьюнити идут обсуждения про Schema-Guided Reasoning, в основном в контексте Open…