Ну мне не для регрессионок
Ну мне не для регрессионок
0 viewsОткрыть в Telegram →
Из этого канала
- #6197я щас только на claude code сижу, все остальное как то не прям необходимо по…
я щас только на claude code сижу, все остальное как то не прям необходимо по ощущению
- #6198Instant LLM Updates with Doc-to-LoRA and Text-to-LoRA…
Instant LLM Updates with Doc-to-LoRA and Text-to-LoRA https://pub.sakana.ai/doc-to-lora/
- #6199https://github.com/researchim-ai/models-at-home кстати у нас теперь muon…
https://github.com/researchim-ai/models-at-home кстати у нас теперь muon дистрибутед и работает в том числе при ds zero 3 + cpu offload
- #6195оптимизаторы уже в мейне если что)
оптимизаторы уже в мейне если что)
- #619460м моделька 2к контекст muon x adamw прост дефолтные запуски без подбора lr
60м моделька 2к контекст muon x adamw прост дефолтные запуски без подбора lr