🧙♂️ Ультимативная тулза The Evaluation Wizard оценивает, тестирует и оптимизирует любые LLM — сокровище для каждого, кто строит свои ИИ-приложения. Прога запускает 30+ оценок, моделируя разные действия. Работает даже без датасета: даём задачу для оценки, генерируем набор данных, кидаем промпт, выбираем настройки и получаем результат. Прогнать тесты и поиск ошибок можно через все LLM, чтобы сравнить и выбрать подходящую. Мастхев для разрабов — тут. @notboring_tech
🧙♂️ Ультимативная тулза The Evaluation Wizard оценивает, тестирует и…
Из этого канала
- #3551🔬 FutureHouse запустил первую команду ИИ-учёных, которая выполняет научные…
🔬 FutureHouse запустил первую команду ИИ-учёных, которая выполняет научные исследования эффективнее, чем люди (!) — платформа AI Scientist превосходит…
- #3552📊 Два брата из Канады бросили работу и универ, чтобы запустить первого…
📊 Два брата из Канады бросили работу и универ, чтобы запустить первого персонального ИИ-аналитика инвестиций! Xynth проводит глубокие исследования фондового…
- #3553🍯 Нашёл самую большую базу документации для 9000+ различных API — её можно…
🍯 Нашёл самую большую базу документации для 9000+ различных API — её можно автоматически подключить к любым нейросетям, чтобы они знали только актуальные…
- #3548🔊 NotebookLM мощно обновился и научился генерировать подкасты на русском языке!…
🔊 NotebookLM мощно обновился и научился генерировать подкасты на русском языке! Теперь мега-полезный сервис от Google поддерживает 50 языков, включая русский,…
- #3547🎁 Команда ML-инженеров из СНГ запустила бесплатный курс по LLM Engineering —…
🎁 Команда ML-инженеров из СНГ запустила бесплатный курс по LLM Engineering — это универсальный стартер-пак для всех разрабов, которые хотят строить свои…