Видео (6 мин) работы чатбота с SGR на базе локальной Qwen-30b-a3b Про Schema-Guided Reasoning говорили и писали уже много. Но одно дело слышать, а другое дело - увидеть, как оно работает вживую. Особенно, если реализация сделана настолько аккуратно и вдумчиво, как это сделали ребята из neuraldeep. Поэтому вот вам видео на 6 минут - Русский / English Самое классное тут, что эта демка работала на достаточно слабой и медленной Qwen-30b-a3b. А теперь представьте, что можно сделать, если прочитать методичку (написано тут), взять код (он есть в Github) поставить ему звездочку, взять модель помощнее и сделать свою версию - с тестами, с доступом в свои хранилища, учетом своей специфики и своими инструментами. И запускать все это на небольшой коробочке вроде DGX Spark. А если будут PR - можно смело присылать их в ту репу, чтобы двигать дальше State of the Art в области применения небольших LLM на практике. Ваш, @llm_under_hood 🤗
Видео (6 мин) работы чатбота с SGR на базе локальной Qwen-30b-a3b Про…
Из этого канала
- #688"Update насчет соревнования ERC3. Напомню, что ERC3 - это дружеское…
"Update насчет соревнования ERC3. Напомню, что ERC3 - это дружеское соревнование по написанию агентов, которое состоится в конце ноября.
- #689"Кейс с LLM под капотом - поиск видео для монтажа рекламы Давайте расскажу вам…
"Кейс с LLM под капотом - поиск видео для монтажа рекламы Давайте расскажу вам еще про один кейс достаточно необычного использования LLM в продуктовых целях.
- #690Claude поддерживает Structured Output Наконец-то, и Anthropic добавили нативную…
Claude поддерживает Structured Output Наконец-то, и Anthropic добавили нативную поддержку генерации ответов по JSON схеме без повторных запросов и ошибок…
- #686В Gemini 2.5 завезли нормальные Structured Outputs! Поддержку для JSON Schema…
В Gemini 2.5 завезли нормальные Structured Outputs! Поддержку для JSON Schema добавили в Google во все поддерживаемые модели Gemini (в старые версии - с…
- #685"Я сегодня закончил первый прототип платформы для ERC3: Enterprise AI Agents.…
"Я сегодня закончил первый прототип платформы для ERC3: Enterprise AI Agents. Получается довольно симпатично, сейчас все расскажу.