Хорошо, что новый метод не даёт погрешность в 2 раза 😨 (если кроме шуток, то в статье есть и интересные тезисы — например, какие из моделей OpenAI были обновлением/тренировкой новой базовой модели, и в целом ранжирование моделей скорее ближе к правде, чем нет)
Хорошо, что новый метод не даёт погрешность в 2 раза 😨 (если кроме шуток, то в…
Из этого канала
- #3589У Dwarkesh новое видео, на этот раз не интервью, а вопросно-ответная лекция с…
У Dwarkesh новое видео, на этот раз не интервью, а вопросно-ответная лекция с одним из создателей TPU, делающим сейчас свой стартап.
- #3590🥺 пока я разбираю предыдущую статью DeepSeek, они выпускают новую — наконец-то…
🥺 пока я разбираю предыдущую статью DeepSeek, они выпускают новую — наконец-то про работу с изображениями! Обновлений не было кажется с декабря 2024-го!…
- #3595Две новости: — Anthropic начали обсуждения следующего раунда инвестиций;…
Две новости: — Anthropic начали обсуждения следующего раунда инвестиций; никаких бумаг пока не подписано, но компания рассматривает возможность привлечения…
- #3587Если сделать грубую прикидку, то DeepSeek потратили на предтренировку DSv4 Pro…
Если сделать грубую прикидку, то DeepSeek потратили на предтренировку DSv4 Pro примерно 10^25 FLOPs (оценка на основе количества токенов, написанных в статье,…
- #3586🤣 Микрофон адвоката Илона Маска выключался четыре раза за время его…
🤣 Микрофон адвоката Илона Маска выключался четыре раза за время его вступительной речи по делу «Маск против OpenAI».