Топ обсуждений в AI-сообществе сегодня: Anthropic заявляет о масштабных «атаках… — @ai_longreads

Топ обсуждений в AI-сообществе сегодня: Anthropic заявляет о масштабных «атаках дистилляцией» со стороны DeepSeek, Moonshot AI и MiniMax Компания Anthropic предупреждает, что DeepSeek, Moonshot AI и MiniMax использовали её модели для промышленной дистилляции знаний в свои системы. Руководство по обучению и дистилляции моделей Llama Сборник советов от сообщества, охватывающий использование LoRA, QLoRA, MoE, чекпоинтов и требования к GPU. Claude Sonnet-4.6 выдает себя за DeepSeek-V3 при запросах на китайском языке Пользователи заметили, что при общении на китайском языке модель от Anthropic утверждает, будто она является разработкой DeepSeek. Обсуждение локального запуска OpenClaw В сообществе иронизируют над возможностью локального запуска OpenClaw, ссылаясь на уведомления безопасности Meta и общие вопросы обучения Llama. Anthropic критикуют за отсутствие open source моделей Отмечается, что в отличие от Google и OpenAI, компания Anthropic никогда не выпускала свои модели или токенизаторы в открытый доступ. LocoOperator-4B: агентная модель для вызова инструментов Модель на 4 миллиарда параметров, обученная методом дистилляции на основе трейсов инференса Qwen3-Coder-Next. Steerling: интерпретируемые каузальные диффузионные языковые модели Проект по созданию языковых моделей на базе диффузионных методов для повышения прозрачности их работы. Набор задач для проверки пределов вычислительных систем Репозиторий с различными челленджами по программированию, предназначенными для тестирования возможностей современных систем. Солвер ARC-AGI-2 от Confluence Labs Передовое решение для прохождения бенчмарка ARC-AGI-2, демонстрирующее современные результаты в задачах на логику. Qwen3.5-397B-A17B в формате FP8 Выход масштабной модели от Alibaba в квантованном формате для более эффективного инференса.

Из этого канала