"DeepSeek-R1 online + еще больше вариантов инференса Perplexity молодцы - выпустили свою DeepSeek-R1 based ризонинг модель с доступом к интернету - на первый взгляд работает прям хорошо - она и шустрая и с доступом к онлайн данным - перспективная штука, попробуйте: 1. В Perplexity в Pro режиме выбрать R1 (бесплатно 3 запроса в день) 2. В OpenRouter модель perplexity/sonar-reasoning - если кто-нибудь проведет эксперимент и поставит эту модельку в Cline/aider/Roo Code в кач-ве архитектора - возможно, результат будет великолепен (из-за мощной связки reasoning + online data). Отпишитесь тут если попробуете. Фишка в том, что она умеет не только сложные задачи решать (приятно, что она додумалась, что async не проканает внутри Parallel.ForEach), но и актуальный API подтягивать из интернета в реальном времени. Вот что получилось по моему, уже классическому запросу, `Create an API client in .NET for OpenAI that supports parallel embeddings generation with a configurable dop` - ~~считаю, что хорошо справилась~~. Update: хорошо справилась только с логикой параллелизма, что касается API библиотеки OpenAI, то в нем она запуталась (вот мой коммент с пояснением). Спасибо многоуважаемому Владимиру Хорикову (кстати, его книгу по юнит-тестированию могу всем горячо рекомендовать) за то, что указал на неточность. Совершенно новый игрок появился в игре сервисов для инференса: Chutes.ai (чатик и API доступны прямо на их сайте, и отдеально по API можно юзать из OpenRouter, при чем пока бесплатно). Отличаются они довольно богатым набором разных моделек, в т. ч. embedding models (bge-m3, например). Там какая-то хитрая схема оплаты за секунды инференса, а не за токены (непонятно пока, на сколько это выгодно). Но интересно, что на текущий момент инференс в чате и в Playground работает бесплатно и без регистрации. Еще интересно, что там можно поэксперементировать с более мелкими reasoning DeepSeek моделями - например, с deepseek-ai/DeepSeek-R1-Distill-Qwen-32B. И еще Nebius.ai (подсмотрел тут): Поскольку официальное API Deepseek лежит уже 2 дня, поделюсь тем что Nebius добавил себе r1 с очень приятными ценами : $2.4 за миллион токенов на выходе («Война и Мир» на английском – 765 904 токенов, я проверил), при реге дают 1$ на баланс бесплатно Я проверил - действительно работает бодро, аж 25 токенов в секунду. Кстати, судя по статам из OpenRouter, Fireworks тоже разогнали R1 до 17 токенов в секунду. __Update: __В Azure AI Foundry тоже новый дипсик подвезли. И в GitHub Models (с доступом по API в том числе): https://github.com/marketplace/models/azureml-deepseek/DeepSeek-R1/playground Ну и варианты из предыдущего поста тоже не исключаем. В ближайших планах: обзор критики DeepSeek и мое мнение об этом, а также пост и код с ""R1-Pro"" на коленке. А расскажите в комментариях про свой опыт использования DeepSeek-R1 - мне пригодятся разные мнения для поста."
"DeepSeek-R1 online + еще больше вариантов инференса Perplexity молодцы -…
Источник
https://t.me/ai_driven/61Канал AI-Driven Development. Родион Мостовой · опубликовано 29 янв. 2025 г.
Из этого канала
- #64"А почему бы вам не сделать стартап или хотя бы пет-проект? Я убежден, что…
"А почему бы вам не сделать стартап или хотя бы пет-проект? Я убежден, что современные LLM и инструменты поверх них открывают огромные возможности не только…
- #66"Сегодня отмечает свой день рождения замечательный человек Лекс АйТиБорода.…
"Сегодня отмечает свой день рождения замечательный человек Лекс АйТиБорода. Успеху этого канала, а также нашему проекту CodeAlive во многом поспособствовал…
- #67Ну-с, 33, полёт нормальный! Вспоминая себя в 22, понимаю, что в целом я не…
Ну-с, 33, полёт нормальный! Вспоминая себя в 22, понимаю, что в целом я не сильно-то изменился, но скажи мне тогдашнему, что за эти одиннадцать лет произойдёт,…
- #60Ребят, судя по цифрам из OpenRouter, скорость генерации DeepSeek-R1 по API…
Ребят, судя по цифрам из OpenRouter, скорость генерации DeepSeek-R1 по API сейчас существенно деградировала.
- #55"Подписчик в комментариях поделился интересной связкой для доступа к Sonnet 3.5…
"Подписчик в комментариях поделился интересной связкой для доступа к Sonnet 3.5 в Roo Code (соннет все еще наиболее оптимальная моделька для повседневных [не…