Давно мы про табличный ML не писали! Selecting Feature Interactions for Generalized Additive Models by Distilling Foundation Models __Jingyun Jia, Chandan Singh, Rich Caruana, Ben Lengerich__ Paper: https://arxiv.org/abs/2604.13332 Code: https://github.com/Clouddelta/tab-distill Review: https://arxiviq.substack.com/p/selecting-feature-interactions-for # TL;DR ЧТО сделали: Авторы предложили TabDistill — фреймворк, который использует табличные фундаментные модели (TFM) для поиска сложных взаимодействий признаков высоких порядков. Затем эти взаимодействия извлекаются и встраиваются в обобщённые аддитивные модели (GAM) как явные слагаемые. ПОЧЕМУ это важно: Это перекидывает мост между высокоёмкими, но непрозрачными фундаментными моделями и строгими статистическими подходами. В сферах с высокими рисками, таких как медицина или финансы, теперь можно использовать продвинутое обучение репрезентаций без потери читаемости и возможностей аудита. Для практиков: Глубокое обучение наконец-то достигло SOTA-результатов на табличных данных благодаря фундаментным моделям, но они остаются непроницаемыми чёрными ящиками. Работа переворачивает их привычную роль: вместо сквозного предсказания они используются как структурные учителя. Систематически «прощупывая» фундаментную модель, можно вытащить точные комбинации признаков, на которые она опирается, и передать их простой интерпретируемой GAM. Это даёт высокую точность при сохранении полностью прозрачной (glass-box) архитектуры. Углубляться тут: https://t.me/gonzo_ML_podcasts/3290
Давно мы про табличный ML не писали! Selecting Feature Interactions for…
Из этого канала
- #5228Прикольный подход к оценке моделей через тензорные разложения. Для 3D тензора…
Прикольный подход к оценке моделей через тензорные разложения. Для 3D тензора <навык модели> <сложность промпта> <особенности оценщика> мы сначала выучиваем…
- #5232"Шажок на пути к автоматической науке GIANTS: Generative Insight Anticipation…
"Шажок на пути к автоматической науке GIANTS: Generative Insight Anticipation from Scientific Literature Joy He-Yueya, Anikait Singh, Ge Gao, Michael Y.
- #5235Свежак от DeepSeek https://github.com/deepseek-ai/TileKernels Tile Kernels…
Свежак от DeepSeek https://github.com/deepseek-ai/TileKernels Tile Kernels Optimized GPU kernels for LLM operations, built with TileLang.
- #5219"И ещё про развитие ветки Universal Transformer (см.вчерашнее…
"И ещё про развитие ветки Universal Transformer (см.вчерашнее https://t.me/gonzoML/5206).
- #5209Это нельзя не запостить прямо щас. Чуваки проанализировали и разобрали утекший…
Это нельзя не запостить прямо щас. Чуваки проанализировали и разобрали утекший код Клод кода и анализируют как устроен агент такого рода. Интересное чтиво.