"Как запустить рандомную модель на своем железе? Можно повторить то, что сделал Dan Woods, когда ему захотелось самому запустить Qwen3.5-397B на своем M3 Max 48GB (tweet). Он взял Claude Code, ткнул пальцем в autoresearch репу от Andrej Karpathy, скормил статью Apple ""LLM in a Flash"" и сказал, что хочет себе так же. Спустя 5 часов, система запустилась и выдала 1 tok/sec. Еще спустя 3 часа оптимизаций - 4.74 tok/sec и использует 5.9GB RAM. Причем, там еще далеко не все оптимизации реализованы. Как нынче говорят - стоит испытать огромную благодарность к людям, которые раньше реализовывали подобные оптимизации вручную. Ваш, @llm_under_hood 🤗"
"Как запустить рандомную модель на своем железе? Можно повторить то, что сделал…
Из этого канала
- #775Я попросил ChatGPT Codex построить таймлайн разработки моих основных проектов…
Я попросил ChatGPT Codex построить таймлайн разработки моих основных проектов (на основе git), и получилась такая картинка.
- #776Число переключений контекста в день, по мере объединения разных проектов в одну…
Число переключений контекста в день, по мере объединения разных проектов в одну систему - растет Это продолжение прошлого поста.
- #777"Anthropic Channels - еще один (сырой) OpenClaw кирпичик В Claude Code завезли…
"Anthropic Channels - еще один (сырой) OpenClaw кирпичик В Claude Code завезли экспериментальную возможность подключать асинхронные каналы в сессию.
- #773Считаем, что BitGN Sandbox проверку на дым прошел Инженеры подключаются к…
Считаем, что BitGN Sandbox проверку на дым прошел Инженеры подключаются к Harness, запускают в среде AI агентов, получают оценку действий и уже спрашивают про…
- #772BitGN Sandbox доступен! Update: это новая версия видео, подлиннее В нем мы…
BitGN Sandbox доступен! Update: это новая версия видео, подлиннее В нем мы симулируем работу персонального агента, у которого есть полный доступ к Obsidian…