AI-based Clinical Decision Support for Primary Care: A Real-World Study (блог) На стриме с Валерой весной обсуждали, что есть большая разница между «модели могут писать 90% кода» и «модели пишут 90% кода». Первое случится задолго до второго — просто потому что корпорации/компании достаточно медленные, не любят рисковать итд. Топик ещё более актуален в медицине, которая жёстко зарегулирована, требуется куча бумажной волокиты, прохождения проверок и лицензирования. Поэтому каждое исследование, в котором как-то применяется GenAI — на вес золота. Недавно OpenAI отчитались об успешном пилоте ко-пайлота для врачей primary care (первая мед. помощь, по сути терапевты, но более широкого спектра). Пилот был проведён в Кении вместе с Penda Health, его предметом был AI Consultant, который выступал в роли системы безопасности в реальном времени, крутящейся в фоне и выдающей уведомления докторам. Эти доктора ежедневно сталкиваются с пациентами всех возрастных групп, с заболеваниями любых органов и различных типов, что требует огромного объема знаний. Такая сложность делает медицинские ошибки распространёнными: согласно данным ВОЗ, вред пациентам при оказании первичной помощи является частым и при этом предотвратимым. Поэтому Penda решила тестировать ко-пайлота, который одновременно с доктором «изучает» кейс, смотрит на историю болезни, на анамнез, анализы, на заключение и назначенное лечение — и даёт подсказки. В ходе работы доктора в углу веб-сайта горит огонёк, он может быть 3 цветов: — зелёный (всё хорошо) — жёлтый (система выявила некритичные проблемы) — красный (критичные проблемы, нельзя продолжить без ревью обратной связи) Финальное решение всегда за врачом, и именно он контролирует процесс. Но как мы знаем, люди не идеальны и ошибаются — и им можно помогать, корректировать. Чтобы лучше понять систему, OpenAI представили на сайте несколько примеров работы: — обнаружение пропущенных диагнозов (по результатам анализов), например, анемия у ребёнка; — отмена ненужного назначения антибиотиков; — указание на недостаточную информацию в анамнезе (забыли задать нужные вопросы); — рекомендации по назначению дополнительных тестов и анализов; — выявление потенциально опасных комбинаций назначенных лекарств (например, стероидов и седативных антигистаминных препаратов) с рекомендации более подходящих вариантов. Основная часть пилота проходила с 1-го марта по середину апреля в 15 клиниках в Кениии, и за это время в исследовании приняло участие около 40 тысяч пациентов (всего было больше, но часть отказалась от участия, а часть не подходила по разным критериям).
AI-based Clinical Decision Support for Primary Care: A Real-World Study (блог)…
Из этого канала
- #2702Как и что оценивалось: из кейсов контрольной и тестовой выборок случайно было…
Как и что оценивалось: из кейсов контрольной и тестовой выборок случайно было выбрано 5666 штук; они были пристально проанализированы и размечены рабочей…
- #2703Дополнительно отслеживали показатель игнорирования красных предупреждений (left…
Дополнительно отслеживали показатель игнорирования красных предупреждений (left in red rate) — долю визитов, когда врачи не исправляли ошибки, несмотря на…
- #2704А разработчики Cursor уже во всю тестируют какую-то новую модель. Интересно,…
А разработчики Cursor уже во всю тестируют какую-то новую модель. Интересно, что там за название за размытием 👀
- #2700Давно не слышал про смешные способы обмануть LLM через промпт джейлбрейк, и вот…
Давно не слышал про смешные способы обмануть LLM через промпт джейлбрейк, и вот наткнулся на смешное.
- #2699TheInformation написали немного про GPT-5: — один из ранних тестировщиков…
TheInformation написали немного про GPT-5: — один из ранних тестировщиков оценил невыпущенную модель «крайне положительно» и сказал, что она превосходит Claude…