У Dwarkesh новое видео, на этот раз не интервью, а вопросно-ответная лекция с одним из создателей TPU, делающим сейчас свой стартап. https://youtu.be/xmkSf5IS-zw Анки-карточки к лекции: https://reiner-flashcards.vercel.app/ В лекции поговорят про то, как прикидывать цену токенов моделей, как и почему возникает трейдофф скорости и цены (вот эти Fast-моды в Codex/Claude Code) и многое другое. Мне интересно, пока смотреть не буду — готовлю всем сюрприз про дипсик 😮
У Dwarkesh новое видео, на этот раз не интервью, а вопросно-ответная лекция с…
Из этого канала
- #3590🥺 пока я разбираю предыдущую статью DeepSeek, они выпускают новую — наконец-то…
🥺 пока я разбираю предыдущую статью DeepSeek, они выпускают новую — наконец-то про работу с изображениями! Обновлений не было кажется с декабря 2024-го!…
- #3595Две новости: — Anthropic начали обсуждения следующего раунда инвестиций;…
Две новости: — Anthropic начали обсуждения следующего раунда инвестиций; никаких бумаг пока не подписано, но компания рассматривает возможность привлечения…
- #3596«...учитывая контекст, я почти уверен, что адвокаты Илона Маска, возможно,…
«...учитывая контекст, я почти уверен, что адвокаты Илона Маска, возможно, сильно облажались» — не то, что я ожидаю прочитать в новостном материале по делу, В…
- #3588Хорошо, что новый метод не даёт погрешность в 2 раза 😨 (если кроме шуток, то в…
Хорошо, что новый метод не даёт погрешность в 2 раза 😨 (если кроме шуток, то в статье есть и интересные тезисы — например, какие из моделей OpenAI были…
- #3587Если сделать грубую прикидку, то DeepSeek потратили на предтренировку DSv4 Pro…
Если сделать грубую прикидку, то DeepSeek потратили на предтренировку DSv4 Pro примерно 10^25 FLOPs (оценка на основе количества токенов, написанных в статье,…