1-я статья OpenAI о реальном использовании GPT-5 в науке Исследователи из OpenAI и нескольких университетов попробовали использовать GPT-5 для разных научных задач. И вот какие результаты: В части поиска литературы работает хорошо, нашёл существующие решения для 10 задач из базы нерешённых проблем Эрдёша. Это те самые задачи, из-за которых был скандал в октябре. Проверка идей и вычисления, ускоряет рутину. В биологии есть у них интересный кейс - анализ экспериментов с иммунными клетками. GPT-5 предложил механизм, который не был очевиден экспертам в области. Модель также правильно предсказала результаты непубликованных экспериментов. Исследователь отметил: «GPT-5 внёс большой вклад для соавторства, но в реальной публикации его не указали». Что не работает? 1. Модель может настойчиво защищать неправильные решения 2. Иногда выдумывает несуществующие статьи 3. Результат зависит от формулировки вопроса 4. Без проверки человеком результаты ненадёжны 5. GPT-5 воспроизвёл чужое доказательство, не указав источник. Исследователи чуть не опубликовали это как своё.
1-я статья OpenAI о реальном использовании GPT-5 в науке Исследователи из…
Из этого канала
- #2580Дайджест статей The Real Reason Data Quality Is Getting Worse -…
Дайджест статей The Real Reason Data Quality Is Getting Worse - https://afroinfotech.medium.com/the-real-reason-data-quality-is-getting-worse-8726130578cd -…
- #2581Для олдов и фанатов программирования :) Отличный ролик про создание культовой…
Для олдов и фанатов программирования :) Отличный ролик про создание культовой игры со всеми деталями реализации.
- #2582и все таки пока останусь на ChatGPT, привык уже. Хотя у Google конечно более…
и все таки пока останусь на ChatGPT, привык уже. Хотя у Google конечно более мощная экосистема и если там быстро везде прорастет Gemini, это, конечно, будет не…
- #2578Чем больше я работаю с LLM тем больше я сам вижу насколько их ответы ненадежны,…
Чем больше я работаю с LLM тем больше я сам вижу насколько их ответы ненадежны, не точны, а часто просто ошибочны. И проблема эта by design.
- #2577Коллеги, нужна помощь зала! Команда CleverData проводит исследование опыта…
Коллеги, нужна помощь зала! Команда CleverData проводит исследование опыта работы с CDP.