ресечим/делаем (c) AI@researchim· 1 565 subs

I trained a 1.8M params model from scratch on a total of ~40M tokens.…

8 февр. 2026 г.0 viewsОткрыть в Telegram →

I trained a 1.8M params model from scratch on a total of ~40M tokens. https://www.reddit.com/r/LocalLLaMA/comments/1qym566/i_trained_a_18m_params_model_from_scratch_on_a/ https://github.com/SrijanSriv211/Strawberry

Источник

https://t.me/researchim/5968

Канал ресечим/делаем (c) AI · опубликовано 8 февр. 2026 г.

Из этого канала