😄 и в чём он не прав
😄 и в чём он не прав
Из этого канала
- #2777И у этого даже есть какое-никакое численное измерение. Sam Paech, автор…
И у этого даже есть какое-никакое численное измерение. Sam Paech, автор нескольких бенчмарков, связанных с креативным письмом LLM-ок, запустил свежий бенчмарк…
- #2778Measuring Thinking Efficiency in Reasoning Models: The Missing Benchmark Вот мы…
Measuring Thinking Efficiency in Reasoning Models: The Missing Benchmark Вот мы говорим, что модели рассуждают перед тем, как дать ответ.
- #2779Но мне не совсем нравится этот анализ тем, что задач мало, и они во многом…
Но мне не совсем нравится этот анализ тем, что задач мало, и они во многом заезженные и типовые.
- #2775Начинаем воскресенье с плохих новостей. LMArena решила добавить прозрачности и…
Начинаем воскресенье с плохих новостей. LMArena решила добавить прозрачности и указать, какие именно модели OpenAI и с какими настройками они тестировали.
- #2773На неделе Sama и несколько других директоров OpenAI провели ужин с репортёрами,…
На неделе Sama и несколько других директоров OpenAI провели ужин с репортёрами, где отвечали на их вопросы.