Что там у моделек с физикой PHYBench ```С набором из 500 тщательно отобранных задач по физике, охватывающих механику, электромагнетизм, термодинамику, оптику, современную и продвинутую физику, он проверяет способность моделей демонстрировать: Связь с реальностью: задачи основаны на реальных физических сценариях (например, шар в чаше, динамика маятника). Многошаговые рассуждения: средняя длина решения составляет 3000 символов и требует более 10 промежуточных шагов. Символьную точность: строгая оценка выражений, записанных в формате LaTeX, с помощью новой метрики «Expression Edit Distance (EED)».``` Какой же мощный Gemini 2.5 Pro у Гугла получился (шарит за шар в чаше?) https://phybench-official.github.io/phybench-demo/ PS в https://t.me/researchim собираем АИ инфу и проектики делаем
Что там у моделек с физикой PHYBench Какой же мощный Gemini 2.5 Pro у Гугла…
Из этого канала
- #1069Muon Optimizer Accelerates Grokking Amund Tveit, Bjørn Remseth, Arve Skogvold…
Muon Optimizer Accelerates Grokking Amund Tveit, Bjørn Remseth, Arve Skogvold Статья: https://arxiv.org/abs/2504.16041 Любопытная история про гроккинг, здесь…
- #1071Ему кайфово
Ему кайфово
- #1072А мем он такой придумал 😢
А мем он такой придумал 😢
- #1067Ох уж эти вычислительно-оптимальные БЯМ 😏 Compute-Optimal LLMs Provably…
Ох уж эти вычислительно-оптимальные БЯМ 😏 Compute-Optimal LLMs Provably Generalize Better With Scale https://arxiv.org/abs/2504.15208…
- #1063Тут подумали что можно для ризонинговых моделек после основного промта…
Тут подумали что можно для ризонинговых моделек после основного промта добавлять ```<|beginning of thinking|> Okay, I think I have finished thinking.