На сайте OpenAI есть много вакансий, в некоторых иногда можно углядеть интересное. Например, сейчас — есть вакансия инженера Frontier Evals (способы оценки передовых моделей, создание бенчмарков). И отдельно есть Frontier Evals — Finance. Интересный домен, не программирование, не медицина, не математика, а финансы! Но деталей мало, просто говорят про сбор задач, где требуются размышления по финансам, «особенно инвестиционный банкинг или частный капитал». Ждём Tax Bench 🥹 (да, я знаю про TaxCalcBench и AccountingBench)
На сайте OpenAI есть много вакансий, в некоторых иногда можно углядеть…
Из этого канала
- #2824Inference-Time Scaling for Generalist Reward Modeling Разбор весенней статьи от…
Inference-Time Scaling for Generalist Reward Modeling Разбор весенней статьи от DeepSeek, я прочитал сразу как вышла, но долго откладывал разбор, не доходили…
- #2825Картинка для облегчения понимания происходящего. Слева Q & R — промпт и ответы…
Картинка для облегчения понимания происходящего. Слева Q & R — промпт и ответы от какой-то модели (условно DeepSeek R2 в момент тренировки).
- #2826Такая модель будет учиться в два этапа: — Rejective Fine-Tuning (RFT), чтобы…
Такая модель будет учиться в два этапа: — Rejective Fine-Tuning (RFT), чтобы «прогреть» модель, дать ей базовое понимание хорошо / плохо, понимание формата…
- #2822"В комментариях, в твиттере, на реддите и вообще везде люди постоянно пишут: —…
"В комментариях, в твиттере, на реддите и вообще везде люди постоянно пишут: — модель стала глупее! — я вот раньше мог за полчаса полугодовой проект сделать а…
- #2821Сегодня (для кого-то вчера) кстати день пробуждения Скайнета Эх жаль GPT-5…
Сегодня (для кого-то вчера) кстати день пробуждения Скайнета Эх жаль GPT-5 вышла разочарованием, так бы могло быть правдой 😀😀