📚 Вышел гигантский LLM Evaluation Guidebook — авторы Smol Training Playbook выпустили гайд, который от А до Я разбирает, как оценивать способности LLM. • Его выпустила команда разрабов, которая сделала оценки 15 тысяч нейронок за три года. • Внутри — как правильно делать эвал под конкретные задачи, готовить датасеты, документировать результаты и избегать ошибок. • Главное — гайд подходит для всех новичков, его удобно читать и есть интерактивные графики. Один из лучших мастридов для ИИ-инженеров — тут. @notboring_tech