Я интересный тест на интеллект моделей придумал. Взял вопрос диванного… — @egoshin_kedprof

Я интересный тест на интеллект моделей придумал. Взял вопрос диванного инвестора про инвестиции через семейную ипотеку (увидел в каком-то ТГ канале). Вопрос хорош тем, что требует и знаний о российском законодательстве, и расчетов, и психологии человека. Пуляю в разные модели и смотрю, как они отвечают. Достаточно бегло пробежаться по ответу, чтобы понять качество. Очень выразительно показывает слабость сберовской модели :( Опенсорсный qwen 3.5 plus: https://neurofond.ru/shared/548c4d64-d897-44b1-af52-d4f26ab9e80c = Хорошо, правда, иероглифы проскакивают) Гигачат 2 Pro: https://neurofond.ru/shared/a77455b0-7309-4145-8453-203225b336a8 = Просто вода водой, ничего не взялся даже пробовать посчитать. Просто генерирует мало мальски связанный текст. Ну и Claude Opus 4,6 просто король этой вечеринки: https://neurofond.ru/shared/dd8cf87f-703c-4aad-9e57-81185268fe59

Из этого канала