Когда уже эти LLM реально заработают? Что сдерживает индустрию от массового внедрения LLM Проблема не в GPU или в квалификации кадров. Текущая технология имеет фундаментальные ограничения для обучения решения сложных задач. Но в «мало-шаговых» задачах все давно работает. Завтра (5.11) в 18:00 к нам придет Всеволод Викулин. О чем поговорим: - Как выглядит классический AI-модель - оптимизация на одну целевую метрику - В такой постановке в LLM уже как год работает. - Реальные задачи вообще не такие. Тут вылезают планирование и сложные рассуждения. - Такое текущий RL нормально обучать не умеет. Есть интересные наработки, но пока заводится только на sparse-ревордах О нашем крутом госте: Всеволод Викулин, 9 лет разрабатывает ML-решения. Внедрял ML в VK, Yandex и сейчас в Т-Банке. Последние 3 года занимается внедрением LLM-сервисов, так что очень хорошо знает все их проблемы :) ещё подписывайтесь на канал Севы, там полезно 🔥