Не только. У меня в конфиг файле расписано, на каких задачах какие скиллы использовать. Допускать автокомпакт неприемлимо, он сильно теряет суть того что делает в важных нюансах, поэтому я даже не помню, когда у меня последний раз включался автокомпакт) Еще заметил, что сейчас контекстно окно хоть и 1 млн, но наиболее эффективные первые 50%, далее модель начинает подтупливать, и чем ближе к верхам - тем больше. Поэтому мы стараемся задачи ставить так, чтобы они помещались в первые 40-50% лимита
Не только. У меня в конфиг файле расписано, на каких задачах какие скиллы…
0 viewsОткрыть в Telegram →
Источник
https://t.me/agencyboss/189091Канал Чат «Управление агентством» · опубликовано 27 мая 2026 г.
Из этого канала
- #189092Конечно, но от всего брейншторминга нужна только производная, а не весь он…
Конечно, но от всего брейншторминга нужна только производная, а не весь он целиком
- #189094Нам не подошел. 1. Скорость инференса, особенно при нагрузке в 15 пользователей…
Нам не подошел. 1. Скорость инференса, особенно при нагрузке в 15 пользователей в пике. 2. Ощутимо сложнее апгрейдить отдельные узлы. 3.
- #189095Вы в итоге за сколько собрали себе ?
Вы в итоге за сколько собрали себе ?
- #189089Пилят кластеры из них, да. Но там поверх ещё надо это всё настроить через…
Пилят кластеры из них, да. Но там поверх ещё надо это всё настроить через виртуализацию, что тоже весьма нетривиальная задача. Да и Миники надо не самые дешевые
- #189088А что на счет мак мини ?
А что на счет мак мини ?