На Llama Con показали официальное API Llama Сразу на запуске будет доступен неплохой базовый набор фич — мультимодальные API, tool calling, structured outputs. Всё совместимо с API OpenAI, но при желании можно использовать и специальные SDK, доступные для Python и TypeScript. В придачу к этому обещают скоро запустить инференс на железе от Cerebras и Groq. Есть и полноценные тулы для файнтюна моделей, причём не только тулзы для тюна, но и для оценки моделей. Но главная фишка — возможность скачивать свои затюненные модели, что убирает вендорлок и позволяет легко мигрировать между провайдерами. API будет доступно в превью уже сегодня. На старте будет четыре модели — Llama 4 Scout и Maverick и Llama 3.3 8B и 70B. @ai_newz
На Llama Con показали официальное API Llama Сразу на запуске будет доступен…
Из этого канала
- #3872Ну что, готовы к новому релизу от DeepSeek? На 🤗 только что появились веса…
Ну что, готовы к новому релизу от DeepSeek? На 🤗 только что появились веса DeepSeek Prover V2 671B — новой модели для доказательства теорем и математики.
- #3873Сбер представил первую на русском языке модель с нативным восприятием аудио…
Сбер представил первую на русском языке модель с нативным восприятием аудио Тут прикрутили аудио-модель к GigaChat 2 LLM, то есть на вход можно подавать сразу…
- #3874"Помните какое-то время назад, после появления первого ChatGPT, было много…
"Помните какое-то время назад, после появления первого ChatGPT, было много разговоров про замену им гугл поиска, но было непонятно как они заменят revenue от…
- #3870Есть такой подреддит r/ChangeMyView: его правило простое - автор делится…
Есть такой подреддит r/ChangeMyView: его правило простое - автор делится твёрдым убеждением, а комментаторы стараются аргументированно изменить его точку…
- #3868Qwen 3 — открытые гибридные ризонеры Идёт в размерах на все случаи жизни — от…
Qwen 3 — открытые гибридные ризонеры Идёт в размерах на все случаи жизни — от миниатюрной 0.6B, до огромного 235B-A22B MoE, которая обгоняет o3-mini и очень…