сори, тупанул, вот правильный скрин 🤨 кроме 03-mini есть claude 3.5 и Gemini 2 По лимитам я пока не понял. Но блин, с такой штукой очень удобно статейки читать
сори, тупанул, вот правильный скрин 🤨 кроме 03-mini есть claude 3.5 и Gemini 2…
Из этого канала
- #971У нас тут бегущий по ризонингу Ребята потренили Qwen 1.5B на то чтобы проходить…
У нас тут бегущий по ризонингу Ребята потренили Qwen 1.5B на то чтобы проходить не сильно сложные лабиринты 5x5. Но исходная моделька и этого не умела.
- #972Ммм, там датасетик на 250к семплов под RL над LLMками и ризонинге подвезли. Все…
Ммм, там датасетик на 250к семплов под RL над LLMками и ризонинге подвезли. Все по матеше конечное Это сборка из других открытых датасетов (на скринах) + 47к…
- #974Ребятки, не забываем про квен (он в России работает) https://chat.qwen.ai/ Там…
Ребятки, не забываем про квен (он в России работает) https://chat.qwen.ai/ Там вроде как апдейтик с думающим Qwen2.5-Max подвезли. Нравится.
- #969Ребята на https://www.alphaxiv.org/ завезли o3-mini с которой можно по статьям…
Ребята на https://www.alphaxiv.org/ завезли o3-mini с которой можно по статьям общаться, вот это прикольно
- #968rl... rl всегда возвращается это еще из очень олдовых экспериментов хардмару,…
rl... rl всегда возвращается это еще из очень олдовых экспериментов хардмару, но ржомба Если убрать все ограничения конструкции, оптимизатор придумал…