Extropic анонсировал своё новое железо http://extropic.ai/writing/inside-x0-and-xtr-0 Мы писали про эту и другие интересные темы тут
Extropic анонсировал своё новое железо…
Из этого канала
- #4173Не про архиваторы. Binary Retrieval-Augmented Reward, или Binary RAR, — это…
Не про архиваторы. Binary Retrieval-Augmented Reward, или Binary RAR, — это очень простой способ побороть галлюцинации модели, сохранив при этом её…
- #4175"Продолжается развитие интересной линейки Dreamer, моделей, способных обучаться…
"Продолжается развитие интересной линейки Dreamer, моделей, способных обучаться ""в воображении"", внутри выученной модели мира.
- #4177"Графовый LSTM подвезли, gLSTM. Что сделано? В статье пересматривается проблема…
"Графовый LSTM подвезли, gLSTM. Что сделано? В статье пересматривается проблема ""over-squashing"" в графовых нейронных сетях (GNN), разделяя её на два…
- #4170Краткость — сестра Адаптация LLM через прунинг весовых матриц. Что надо прунить…
Краткость — сестра Адаптация LLM через прунинг весовых матриц. Что надо прунить — определяется по градиенту функции потерь по сингулярным значениям матрицы,…
- #4168Всё дело в волшебных пузырьках! Thoughtbubbles — новая архитектура, которая…
Всё дело в волшебных пузырьках! Thoughtbubbles — новая архитектура, которая содержит ключевое нововведение — механизм, позволяющий модели динамически управлять…