А между тем наш старый знакомый Ashish Vaswani (соавтор оригинальной работы про трансформер) выпустил новую штуку. https://www.essential.ai/research/rnj-1 8B открытая модель Rnj-1 (Рамануджан! Но произносится как “range-1”), которая хороша для кода, инструкций, агентов и математики.
А между тем наш старый знакомый Ashish Vaswani (соавтор оригинальной работы про…
Из этого канала
- #4331Прикольная визуализация процесса обучения, мне нравится
Прикольная визуализация процесса обучения, мне нравится
- #4332"Недавно задавался вопросом, есть ли бенчмарки для вайбкодинга, оценивающие код…
"Недавно задавался вопросом, есть ли бенчмарки для вайбкодинга, оценивающие код с точки зрения безопасности: С вайбкодингом нужны ещё и постоянные security…
- #4335Ещё про код — вышел огромный (300+ страниц) обзор про кодовые модели. Из…
Ещё про код — вышел огромный (300+ страниц) обзор про кодовые модели. Из прикольного, законы скейлинга для разных языков программирования отличаются.
- #4324Две картинки на выбор, какая вам лучше?
Две картинки на выбор, какая вам лучше?
- #4321Если вы любите такие темы, как Universal Artificial Intelligence, Algorithmic…
Если вы любите такие темы, как Universal Artificial Intelligence, Algorithmic Information Theory, AIXI, или следите за работами Marcus Hutter и Blaise Agüera y…