Этот новый ИИ-бенчмарк меняет всё Новый бенчмарк SWE-rebench показал, что китайские ИИ-модели оптимизировались на публичных тестах — и теперь отстают от Anthropic и OpenAI на 12 пунктов. Читать статью
Этот новый ИИ-бенчмарк меняет всё Новый бенчмарк SWE-rebench показал, что…
Источник
https://t.me/ai_longreads/232Канал Про AI: Лучшие cтатьи и исследования · опубликовано 15 февр. 2026 г.
Из этого канала
- #234Seed 2.0: ByteDance выпустила фронтирную LLM. И честно сказала, где…
Seed 2.0: ByteDance выпустила фронтирную LLM. И честно сказала, где проигрывает. Пока все спорят о дипфейках, ByteDance тихо опубликовала 79-страничный техкард…
- #235Уроки создания ИИ-агентов для финансовых сервисов Два года опыта создания…
Уроки создания ИИ-агентов для финансовых сервисов Два года опыта создания ИИ-агентов для профессиональных инвесторов: от песочниц и навыков до real-time…
- #236"Свежий AI-дайджест: темы дня с GitHub, Reddit и Hugging Face: x-cli —…
"Свежий AI-дайджест: темы дня с GitHub, Reddit и Hugging Face: x-cli — CLI-инструмент для Twitter API v2 Позволяет публиковать посты, искать, лайкать и…
- #231Команда «два куска пиццы» ИИ делает даже команды из двух пицц слишком большими…
Команда «два куска пиццы» ИИ делает даже команды из двух пицц слишком большими — теперь достаточно одного человека с Codex и Claude, чтобы заменить 3-4…
- #230Утренний дайджест AI новостей с GitHub, Reddit и Hugging Face: Модель GLM-5 от…
Утренний дайджест AI новостей с GitHub, Reddit и Hugging Face: Модель GLM-5 от zai-org Новая языковая модель GLM-5 доступна на Hugging Face.