Чел натренировал LLM на текстах из Лондона 19 века Модель не знает что такое телефон, так как тренировалась лишь на данных до 1875 года, но зато прекрасно ориентируется в тогдашней религиозной дискуссии. Да, она базовая во всех смыслах — очень небольшой датасет, без файнтюнов поверх и всего миллиард параметров. Но если накинуть поверх этого базовый чатовый файнтюн, то получится прекрасный экскурс в настрой людей той эпохи. Обычные большие ллм тут плохо подходят — у них слишком много данных о современности, из-за чего они постоянно выходят из образа. Вообще мне хочется такие ллмки для всевозможных временных периодов. Вспоминаются свитки, которые расшифровывают в рамках Vesuvius Challenge, и понимаем что можно попытается натренировать ллмку и на этих античных текстах (правда датасет из нескольких сотен свитков совсем крошечный). https://huggingface.co/haykgrigorian/TimeCapsuleLLM-v2-1800-1875 @ai_newz
Чел натренировал LLM на текстах из Лондона 19 века Модель не знает что такое…
Из этого канала
- #4365Cowork — агент для офисных работников Anthropic запустил в превью версию Claude…
Cowork — агент для офисных работников Anthropic запустил в превью версию Claude Code для всех кто не программист.
- #4366"Тем временем беспилотные фургоны для доставки в Поднебесной – смотрите что…
"Тем временем беспилотные фургоны для доставки в Поднебесной – смотрите что творят 🤡 Они штурмуют бордюры, стройки, свежий бетон, самокаты – вообще всё, что…
- #4367"Gemini знает о вас всё Google запустили Personal Intelligence, подключив…
"Gemini знает о вас всё Google запустили Personal Intelligence, подключив Google Photos и YouTube в контекст Gemini.
- #4362Нейродайджест за неделю (#102) Праздники выдались очень хорошие) Генеративные…
Нейродайджест за неделю (#102) Праздники выдались очень хорошие) Генеративные модели - LTX-2 — первая полностью открытая модель, которая генерирует видео в 4K…
- #4361Оказывается, у Google Vids есть свои AI-аватары В отличие от HeyGen и прочих,…
Оказывается, у Google Vids есть свои AI-аватары В отличие от HeyGen и прочих, они сделаны на основе Veo 3.1, причём максимальная длина клипа — 30 секунд с…