📚 Вышел гигантский LLM Evaluation Guidebook — авторы Smol Training Playbook выпустили гайд, который от А до Я разбирает, как оценивать способности LLM. • Его выпустила команда разрабов, которая сделала оценки 15 тысяч нейронок за три года. • Внутри — как правильно делать эвал под конкретные задачи, готовить датасеты, документировать результаты и избегать ошибок. • Главное — гайд подходит для всех новичков, его удобно читать и есть интерактивные графики. Один из лучших мастридов для ИИ-инженеров — тут. @notboring_tech
📚 Вышел гигантский LLM Evaluation Guidebook — авторы Smol Training Playbook…
Из этого канала
- #3959🌉 OpenAI выложила вакансию мечты — компания ищет талантов со всего мира без…
🌉 OpenAI выложила вакансию мечты — компания ищет талантов со всего мира без опыта в ИИ, чтобы вырастить из них исследователей и инженеров.
- #3960🎨 На базе Nano Banana Pro запустили классный сервис, который генерирует целый…
🎨 На базе Nano Banana Pro запустили классный сервис, который генерирует целый брендбук (!) на основе любого сайта по URL-ссылке.
- #3962🎙️ Qwen3-TTS-Flash мощно прокачали — теперь это самый обширный генератор речи с…
🎙️ Qwen3-TTS-Flash мощно прокачали — теперь это самый обширный генератор речи с поддержкой десятков разных голосов, языков и диалектов.
- #3956⚡️ Google запустил Workspace Studio — конструктор кастомных ИИ-агентов на…
⚡️ Google запустил Workspace Studio — конструктор кастомных ИИ-агентов на основе Gemini 3.
- #3954🎥 Вышел самый мощный анализатор видео — Marengo 3.0 находит что угодно в…
🎥 Вышел самый мощный анализатор видео — Marengo 3.0 находит что угодно в многочасовых роликах за считанные минуты, а работает в 30 раз (!) быстрее конкурентов.