Not Boring Tech@notboring_tech· 20 707 subs

🧙‍♂️ Ультимативная тулза The Evaluation Wizard оценивает, тестирует и…

30 апр. 2025 г.7 492 views261 forwardsОткрыть в Telegram →

🧙‍♂️ Ультимативная тулза The Evaluation Wizard оценивает, тестирует и оптимизирует любые LLM — сокровище для каждого, кто строит свои ИИ-приложения. Прога запускает 30+ оценок, моделируя разные действия. Работает даже без датасета: даём задачу для оценки, генерируем набор данных, кидаем промпт, выбираем настройки и получаем результат. Прогнать тесты и поиск ошибок можно через все LLM, чтобы сравнить и выбрать подходящую. Мастхев для разрабов — тут. @notboring_tech

Источник

https://t.me/notboring_tech/3550

Канал Not Boring Tech · опубликовано 30 апр. 2025 г.

Из этого канала