Если вам интересно — вот так делаются теги для каждого поста на проекте telega.fm. ИИ работает. Чуть больше деталей: «Так, если коротко: берем пост, очищаем от всякого мусора в виде предлогов, числительных и так далее. Берем готовые теги, если они есть в посте. Если тегов не набралось шесть, пытаемся извлечь их самостоятельно. Прогоняем текст через алгоритм TextRank, определяем вес каждого слова на основе того, кто с кем рядом стоит; слово с большим весом придает больший вес стоящим рядом словам. С помощью векторной близости ищем похожие посты и берем оттуда два тега. Объединяем всё вместе и получаем от 0 до 6 тегов». 🟪 MAXTG