Для всех, кто интересуется или занимается разработкой рекомендательных систем — обратите внимание: Yandex опубликовал крупный открытый датасет для обучения таких моделей. Yambda-5B — это масштабная открытая база данных, содержащая 4.79 миллиарда взаимодействий между пользователями и объектами, собранных от 1 миллиона пользователей и охватывающая 9.39 миллиона треков. В датасете представлены как неявные отклики (например, факты прослушивания), так и явные — в виде лайков и дизлайков. Кроме того, он содержит информацию о том, было ли взаимодействие органическим или вызванным рекомендацией, а также предварительно рассчитанные аудиоэмбеддинги, что позволяет использовать его для построения рекомендаций с учетом контента. https://huggingface.co/datasets/yandex/yambda
Для всех, кто интересуется или занимается разработкой рекомендательных систем —…
Из этого канала
- #2349Data Day 2025 Коллеги, обратите внимание на очень интересное мероприятие!…
Data Day 2025 Коллеги, обратите внимание на очень интересное мероприятие! Лидеры по работе с данными из Т-Банка, Сбера, Альфа-Банка, ГПБ, X5 Group, ПСБ, Ozon…
- #2351ClickStack: A High-Performance OSS Observability Stack on ClickHouse Обратите…
ClickStack: A High-Performance OSS Observability Stack on ClickHouse Обратите внимание на новый продукт ClickStack, который появился “поверх” ClickHouse и…
- #2352Дайджест статей Data Mesh: ожидания vs реальность…
Дайджест статей Data Mesh: ожидания vs реальность https://habr.com/ru/companies/lemanatech/articles/913550/ ИИ-ассистент для врачей: как мы автоматизируем…
- #2347Дайджест статей От точечных решений к экосистеме: как «Национальная Лотерея»…
Дайджест статей От точечных решений к экосистеме: как «Национальная Лотерея» улучшает качество данных…
- #2343Редакции удалось побывать на лекции «Discourse: Digital intelligence vs…
Редакции удалось побывать на лекции «Discourse: Digital intelligence vs biological intelligence» нобелевского лауреата Джефри Хинтона о будущем искусственного…