Картинка подоспела https://x.com/deepseek_ai/status/1928061589107900779?t=K2G9KvaYQP3Sz_mtWKM1DA&s=19
Картинка подоспела https://x.com/deepseekai/status/1928061589107900779?t=K2G9Kva…
Из этого канала
- #3676Поразительно, конечно, изменился рынок за пару лет. Теперь центр топового…
Поразительно, конечно, изменился рынок за пару лет. Теперь центр топового опенсорса -- Китай.
- #3677Очередная интересная статья от крутого коллектива, включающего Jeff Clune,…
Очередная интересная статья от крутого коллектива, включающего Jeff Clune, Sakana AI и прочих. Sakana — это вообще, кажется, самая интересная лаба Азии.
- #3678Darwin Gödel Machine: Open-Ended Evolution of Self-Improving Agents Авторы:…
Darwin Gödel Machine: Open-Ended Evolution of Self-Improving Agents Авторы: Jenny Zhang, Shengran Hu, Cong Lu, Robert Lange, Jeff Clune Статья:…
- #3674Пока не R2, но всё же https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
Пока не R2, но всё же https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
- #3673Глубже — значит умнее? Или просто длиннее? Разбираемся, как языковые модели…
Глубже — значит умнее? Или просто длиннее? Разбираемся, как языковые модели используют свои слои В продолжение темы про mech interp в трансформерах, свежая…