Talkie — LLM застрявшая в 1930 Есть такой жанр, тренировка LLM на исторических данных. В этот раз 13B модель натренировали на 260 миллиардах токенов до 1930 года включительно, что делает это наибольшим подобным экспериментом. Дата выбрана неслучайно — всё что написано до 1930 года, в США является общественным достоянием. Такая модель нужна для тестирования возможностей моделей предсказывать будущее и последующего развития алгоритмов. Классический пример такого — открытие теории относительности моделью натренированной на данных до 1910. А вот для этой модели это может быть какая-то ядерная физика. Летом команда собирается выпустить модель на уровне GPT-3. Кстати к созданию этой модели приложил руку Alec Radford, который натренировал самую первую GPT. Поговорить с прошлым (есть очередь, может быть проще скачать веса) Блогпост Веса @ai_newz
Talkie — LLM застрявшая в 1930 Есть такой жанр, тренировка LLM на исторических…
Из этого канала
- #11402Я не знаю зачем, но в обновлении Codex кодинг агента, в системный промпт для…
Я не знаю зачем, но в обновлении Codex кодинг агента, в системный промпт для модели 5.5 добавили такую строчку: … Никогда не говори о гоблинах, гремлинах,…
- #11404Помните я $30k дал GPT Pro в управление? Забыл написать что там уже x2…
Помните я $30k дал GPT Pro в управление? Забыл написать что там уже x2 случилось 🌝 Это НЕ совет делать так же, я осознаю риски и готов все потерять
- #11405Китайский исследователь создал специальный бенчмарк, с помощью которого можно…
Китайский исследователь создал специальный бенчмарк, с помощью которого можно оценить количество параметров в любой модели Как мы знаем, закрытые лаборатории…
- #11398Сходил сегодня в Вегасе в Сферу, на ремейк Волшебника Изумрудного Города и…
Сходил сегодня в Вегасе в Сферу, на ремейк Волшебника Изумрудного Города и напиратил вам кусочков; мне понравилось: – Они взяли старый фильм, и построили…
- #11397Хейтеры скажут это AI, я скажу это все настоящий GTA 1914 ☕️
Хейтеры скажут это AI, я скажу это все настоящий GTA 1914 ☕️