BitGN Live лидерборды теперь учитывают время прогона Начиная с сейчас, в лидербордах публикуется полное время, которое потребовалось агенту для прохождения прогона. Если очки одинаковые, то теперь в топ попадает не последнее решение, а более быстрое. См ECOM1-DEV и PAC1-DEV/LIVE (тут пока решений со временем нет) __// Время прогона - суммарное время прогонов всех задач. Распараллеливание погоды не делает (но облегчит жизнь во время соревнования) __ Это немного приближает LIVE лидерборды к тому, как мы ранжируем решения во время соревнований. Ну и теперь не нужно жечь токены просто для того, чтобы оставаться в топе. Ваш, @llm_under_hood 🤗
BitGN Live лидерборды теперь учитывают время прогона Начиная с сейчас, в…
Из этого канала
- #845Personal OS v2.1 - субличность без привязки к провайдеру Пост выходного дня…
Personal OS v2.1 - субличность без привязки к провайдеру Пост выходного дня #weekend В феврале я начал свой эксперимент с использованием OpenAI Codex в…
- #846В чате недавно обсуждали, на что использовать оставшиеся свободные tokens в…
В чате недавно обсуждали, на что использовать оставшиеся свободные tokens в подписках ChatGPT/Claude? Например, на эксперименты с архитектурами AI агентов,…
- #847BitGN ECOM1 состоится 30 Мая. Расписание remote-first: • Предварительный стрим…
BitGN ECOM1 состоится 30 Мая. Расписание remote-first: • Предварительный стрим начнется в 9:30 CEST (по Вене) • В 10:00 - открытие 100 задач ECOM1-PROD • 13:00…
- #842ECOM1 получил продолжение на второй сезон! ECOM1 заходит хорошо (6.4k…
ECOM1 получил продолжение на второй сезон! ECOM1 заходит хорошо (6.4k завершенных агентских прогонов и четверть миллиона попыток решения задач, нагрузка идет…
- #841"Что у нас сейчас происходит в мире? - продавцы быстрее делают AI-приложения и…
"Что у нас сейчас происходит в мире? - продавцы быстрее делают AI-приложения и AI-обертки; - маркетинг обещает пользователю все больше магии (сейлзы теперь…