Как мы построили масштабируемую инфраструктуру оценки ИИ-агентов для веба Глубокое погружение в высокопараллельную платформу оценки на основе LLM-судьи, которая решает проблему дисперсии результатов веб-агентов. Читать статью