"⚪️ Eval-3 (2): а вот и он! #ddeval #feb2026eval3 Итак, приступим, помолясь. Запускаю, конкурентность 2 на каждую модель. 😱 Что можно отметить. Квота гугла на 3.1 в AI Pro подписке нынче довольно смешная, а аккаунт у меня остался один - пару других забанили за ""неуставные связи"". На 8 запусков ревью суточной квоты одного аккаунта даже не хватает - сделали 4 полных семпла для одного фокуса и 2 семпла для другого, и квота кончилась. Напомню - это все таки платный аккаунт! Я не saas ваншотил, а ревью из двух стадий делал, прайминг и сам ревью, довольно скромно. То есть антропик куснул гугла довольно сильно - не каждому желающему попробовать даже хватит! И квоты тут суточные, не 5 часов которые можно было бы подождать. Конечно, нету недельных лимитов - но все равно, такое ... Работать на такой подписке с одним аккаунтом нереально. Хоть на 8 ранов гемини флеш хватило, только 25% квоты где то потратил. Видимо, если работать надо на флеше - то норм. Но на Про модели работать с такой подпиской никак не выйдет. ▶️ У glm-5 на все эксперименты ушло чуть менее 30% 5-ти часовой квоты, то есть работать на про-подписке можно вполне комфортно. Kimi брал с подписки Droid, там месячная квота - непоказательно, около 2% ушло. 👉 Вся аналитика - в комментах. Потренировался Kimi Slides запрягать и NotebookLM. ❓ Посмотрите - чего вам понравится, пишите впечатления от оформления разными инструментами. Go в комменты! 👇 @deksden_notes"
"⚪️ Eval-3 (2): а вот и он! #ddeval #feb2026eval3 Итак, приступим, помолясь.…
Из этого канала
- #509"⚪️ Eval-3 (3): итоги #ddeval #feb2026eval3 Самая сложная часть, на самом деле.…
"⚪️ Eval-3 (3): итоги #ddeval #feb2026eval3 Самая сложная часть, на самом деле. Мы получили кучу данных, они перед глазами.
- #510"⚪️ Забавное Переведу: https://x.com/fortelabs/status/2026681391384068260?s=20…
"⚪️ Забавное Переведу: https://x.com/fortelabs/status/2026681391384068260?s=20 —— Подождите, значит, основателем Anthropic является ""Амодей"", то есть…
- #511⚪️ Кодинговый план алибабы Получил апгрейд Теперь ВСЕ топовые киты доступны в…
⚪️ Кодинговый план алибабы Получил апгрейд Теперь ВСЕ топовые киты доступны в нем! $5 в первый месяц, $10 далее.
- #507"⚪️ Eval-3 (1): планы #ddeval #feb2026eval3 Итак, мы сделали eval-2 как общий…
"⚪️ Eval-3 (1): планы #ddeval #feb2026eval3 Итак, мы сделали eval-2 как общий обзорный эвал, и посмотрели как работают свежие модели (qwen 3.5 и gemini 3.1).
- #506⚪️ Droid @ Terminal Bench Недавно в чатике обсуждали дроида и terminal bench,…
⚪️ Droid @ Terminal Bench Недавно в чатике обсуждали дроида и terminal bench, что он был топ, но это было давно Дроид прислушался к критике, и обновил бенч.