VBVR (A Very Big Video Reasoning Suite) Исследовательский проект (свежий, вроде как два дня назад открыли), посвященный развитию способностей видеомоделей к рассуждениям. Проект открытый, основные направления - изучение как видеомодели справляются с логическими, пространственными и темпоральными задачами (то есть выходя за рамки генерации красивой картинки). Интересно тем, что это направление (не обязательно конкретно этот проект) может стать следующим шагом в развитии, потому что именно пространственно-временной опыт сложно передать через текст (и даже если установлены семантические связи). Есть задачки, есть моделька, есть бенч-фреймворк, то есть экосистема есть, видимо долго развивались и только открылись. https://video-reason.com https://github.com/VBVR-DataFactory UPD: статья к проекту: https://arxiv.org/html/2602.20159v1
VBVR (A Very Big Video Reasoning Suite) Исследовательский проект (свежий, вроде…
Из этого канала
- #691Применение LLM для контроля качества кода Вот интересный момент. Если…
Применение LLM для контроля качества кода Вот интересный момент. Если спрашивать LLM о том, как использовать LLM для ревью кода или гуглить, то будут общие,…
- #692Товарищ, Вася Савунов (@datadrivenmanagement), симулятор Канбана сделал…
Товарищ, Вася Савунов (@datadrivenmanagement), симулятор Канбана сделал (портировал, если будет угодно).
- #693Заметки на полях. Образовательное. Сегодня со ScrumTrek провёл мастер-класс по…
Заметки на полях. Образовательное. Сегодня со ScrumTrek провёл мастер-класс по автоматизации при помощи LLM-ок некоторых простых действий в процессе разработки…
- #689Контролируемое применение языковых моделей в бизнесе Выступил сегодня на…
Контролируемое применение языковых моделей в бизнесе Выступил сегодня на площадке @LLM4dev ► Тема выступления Большие языковые модели изначально ничего не…
- #688VibeCoding и UX Я использую несколько набайкоденных решений. И все никак не мог…
VibeCoding и UX Я использую несколько набайкоденных решений. И все никак не мог понять, что с ними не так.