Нейросети думают сложными геометрическими структурами – новое исследование от Goodfire Эта статья вызвала в последние дни очень много интереса в сообществе. Исследователи из Goodfire впервые показали занятную вещь: внутреннее пространство активаций моделей организовано не хаотично, а в виде многомерных форм, поверхностей и траекторий. Часто эти многообразия вполне интерпретируемы. Выглядит это примерно как на первом видео. Авторы назвали явление neural geometry. Причем наблюдается оно не только в LLM, но и в vision моделях, и даже в хайповых world models. Отличный пример – дни недели. Внутри модели они лежат не по прямой, а по круговой траектории. То есть Monday → Tuesday → Wednesday → … → Sunday образуют циклическую структуру в пространстве активаций. На практике это значит, что если пытаться линейно перейти от понедельника к пятнице, промежуточные состояния будут бессмысленны, а вот если двигаться, глубо говоря, по окружности – с изменением угла, а не линейным смешиванием координат, – то по пути попадутся вторник, среда и четверг (второе видео). Подобным геометрическим образом на многообразиях определенных форм лежат время, числа, цвета, биологическая таксономия и куча всего другого. Авторы настаивают, что исследования neural geometry – это новый фронтир в интерпретации нейросетей, и именно геометрия может стать ключом от черного ящика. www.goodfire.ai/research/the-world-inside-neural-networks#
Нейросети думают сложными геометрическими структурами – новое исследование от…
Из этого канала
- #9196Thinking Machines предложили новый тип моделей, которые могут работать в потоке…
Thinking Machines предложили новый тип моделей, которые могут работать в потоке Они назвали это interaction models.
- #9197Кажется, мы постепенно подходим к моменту, когда новые материалы будут…
Кажется, мы постепенно подходим к моменту, когда новые материалы будут создавать не в лаборатории, а сначала в датасете «Норникель» и Институт Курнакова РАН…
- #9198А давайте оценим тот факт, что в новом релизе стартапа Миры Мурати Thinking…
А давайте оценим тот факт, что в новом релизе стартапа Миры Мурати Thinking Machines голосовую систему демонстрирует тот же сотрудник, что 2 года назад…
- #9190Российские айтишники забили тревогу на фоне потери доступа к аккаунтам Claude…
Российские айтишники забили тревогу на фоне потери доступа к аккаунтам Claude Как пишет Baza, с проблемой уже столкнулись сотни айтишников и бизнесменов из РФ,…
- #9189После объявления о партнерстве SpaceX и Anthropic в X пошла волна мемов. Вашему…
После объявления о партнерстве SpaceX и Anthropic в X пошла волна мемов. Вашему вниманию: