Просочились детали про открытую модель от OpenAI (https://t.me/gonzo_ML/3521). По данным The Information (https://www.theinformation.com/briefings/openai-plans-release-free-model-reasoning-coming-months) у OpenAI уже есть эта модель и в данный момент она проходит тестирования безопасности. Что известно про модель: * Middle-sized model, то есть вероятно в районе 20-70B, также будет маленькая версия или несколько, чтобы можно было гонять on-device * Модель мультиязычная, с поддержкой function calling. Ну этим сейчас уже никого не удивишь, необходимый минимум, не то что год назад (https://t.me/gonzo_ML/2821). Надеюсь, в отличие от Гугла (https://t.me/gonzo_ML/3447) список языков опубликуют? * Это будет reasoning модель, что уже интересно. Reasoning модели такого размера нет, DeepSeek не для простых смертных с его 8x H200 (https://t.me/gonzo_ML/3239), и нишу для домашнего и мобильного использования пока ещё никто не занял, OpenAI будет первым (если новая Llama не обгонит). * Модель мультимодальная, но что совсем интересно, в модальности будет аудио и новая модель в каком-то смысле является миксом Whisper и o3-mini. Про картиночную модальность неизвестно, но звук на входе и выходе это очень интересно, особенно мультиязычный. В on-device устройствах OpenAI планирует заюзать одновременно NPU и DSP (для звука они хороши), что видимо заметно улучшит скорость работы. * Но что совсем бомба, это что ризонинг может идти в звуковой модальности! Модели будут рассуждать вслух! Но чтобы не сильно отвлекать пользователя, рассуждать модель будет шёпотом (Whisper же!). Если можно будет менять голос для ризонинга, то можно запускать GPT-радиостанцию! Инсайдеры сообщают, что уже тестируют устную математику, но модель пока постоянно забывает перенести единичку. Самый главный вопрос -- название модели пока неизвестно. Хорошо, хорошо. Ждём ответку от Meta и Google. Ходят слухи, что Цукерберг уже нанял Eminem'а, чтобы обучить свою модель ритмичному reasoning'у под бит. А в Google DeepMind созвали экстренное совещание и, кажется, планируют выпустить би-ризонинг, когда модель играет сразу две роли, обычную и критика, причём разными голосами -- не просто так ведь модель называется Gemini. И она на самом деле уже тоже есть и проходит тестирования, включая старый добрый NotebookLM (https://t.me/gonzo_ML/2976) -- помните двухголосые подкасты?
Просочились детали про открытую модель от OpenAI (https://t.me/gonzoML/3521).…
Из этого канала
- #3524Кстати, недавно мы протестировали возможности перевода свежих LLM, включая…
Кстати, недавно мы протестировали возможности перевода свежих LLM, включая семейство Gemini 2.0, Claude 3.7 Sonnet, o1/o3-mini, GPT-4.5 и DeepSeek-V3/R1.
- #3525DeepMind про Technical AGI Safety and Security…
DeepMind про Technical AGI Safety and Security https://deepmind.google/discover/blog/taking-a-responsible-path-to-agi/ Сама статья на 145 страниц:…
- #3526Хоть фантастику не читай! We predict that the impact of superhuman AI over the…
Хоть фантастику не читай! We predict that the impact of superhuman AI over the next decade will be enormous, exceeding that of the Industrial Revolution.
- #3522Свежая Кембриджская лекция Хассабиса…
Свежая Кембриджская лекция Хассабиса https://youtu.be/hHooQmmzG4k?si=9Kb7B6gVTnIoh3yp
- #3521Неужели??? Для 1 апреля запоздалая шутка. На пару лет.…
Неужели??? Для 1 апреля запоздалая шутка. На пару лет. https://openai.com/open-model-feedback/ We’re planning to release our first open language model since…