AI модерацию очень сложно мерить — нужно учитывать разные виды контента, быстро отвечать, не false positiвить. Челы из https://whitecircle.ai озаботились и сделали первый бенчмарк для гардрейлов, а еще измерили на нем все самые популярные LLM, в том числе давая моделям поррасуждать над ответом. Твиттер Полистать подробнее в блоге
AI модерацию очень сложно мерить — нужно учитывать разные виды контента, быстро…
Из этого канала
- #1084Ученые из Японии выложили 2 датасета для трена по которым изначально прошлись…
Ученые из Японии выложили 2 датасета для трена по которым изначально прошлись ллмками Llama-3.3-70B-Instruct SwallowCode ~ 16 Billion tokens…
- #1087Хм, там Хуавей выложили статью как тренили свою PanguUltraMoE с 718 миллиардов…
Хм, там Хуавей выложили статью как тренили свою PanguUltraMoE с 718 миллиардов параметров Модельку саму не выкладывают Интересного тут 1. моделька от хуавея 2.
- #1090Полный ноль в ризонинге В смысле, что для обучению ризонингу не надо…
Полный ноль в ризонинге В смысле, что для обучению ризонингу не надо заготовленных данных. Моделька сама формулирует задачи, сама пытается их решать.
- #1082HF 🤗 выложили nanoVLM учебный проект по трену и тюну небольших VLMок…
HF 🤗 выложили nanoVLM учебный проект по трену и тюну небольших VLMок https://github.com/huggingface/nanoVLM
- #1081сложил в репчик несколько o3 ресерчей на разные темы AI в медицине…
сложил в репчик несколько o3 ресерчей на разные темы AI в медицине https://github.com/researchim-ai/state-of-ai/blob/main/MedAIresearch.md ИИ киберсек…