Агенты ИИ | AGI_and_RL@AGI_and_RL· 5 852 subs

Ребятки, не забываем про квен (он в России работает) https://chat.qwen.ai/ Там…

25 февр. 2025 г.2 269 views48 forwardsОткрыть в Telegram →

Ребятки, не забываем про квен (он в России работает) https://chat.qwen.ai/ Там вроде как апдейтик с думающим Qwen2.5-Max подвезли. Нравится. Чтобы модельки размышляли нажимаем Thinking (QwQ)

Источник

https://t.me/AGI_and_RL/974

Канал Агенты ИИ | AGI_and_RL · опубликовано 25 февр. 2025 г.

Из этого канала

#975Member of Technical Staff LLM (Оптимизация и RL Alignment) Стартап в области…
Member of Technical Staff LLM (Оптимизация и RL Alignment) Стартап в области безопасности ИИ Чем предстоит заниматься: Дообучение и Оценка Sota llm, аттаки на…
#976Вышла приятная обзорка по методам посттренинга LLMов и по ризонингу. С…
Вышла приятная обзорка по методам посттренинга LLMов и по ризонингу. С красивыми табличками, схемками.
#979reinforcementlearningreinforcementlearningreinforcementlearning Ну шьто? Эндрю…
reinforcementlearningreinforcementlearningreinforcementlearning Ну шьто? Эндрю Барто и Ричард Саттон получают премию Тьюринга за RL 🥳🕺🥰…
#972Ммм, там датасетик на 250к семплов под RL над LLMками и ризонинге подвезли. Все…
Ммм, там датасетик на 250к семплов под RL над LLMками и ризонинге подвезли. Все по матеше конечное Это сборка из других открытых датасетов (на скринах) + 47к…
#971У нас тут бегущий по ризонингу Ребята потренили Qwen 1.5B на то чтобы проходить…
У нас тут бегущий по ризонингу Ребята потренили Qwen 1.5B на то чтобы проходить не сильно сложные лабиринты 5x5. Но исходная моделька и этого не умела.