6 TB в SQLite Как известно, те, кто хочет, ищет способы, а те, кто не хочет — оправдания. Те, кому не хватает целеустремленности и авантюризма, говорят, что SQLite не заточена под работу с большими объемами данных и вообще не в этом ее главное преимущество. Те, кто открыт новому и не боится вызовов, делают базу на 6 терабайт. Ко вторым относится автор searchcode — проекта по поиску исходного кода. В базе больше 75 миллиардов строк из 40 миллионов проектов. Вот так 6,4 ТБ данных и набежало. 🔵Изначально автор использовал MySQL, и был верен ей с самого начала до конца 2024 года. Но он постоянно искал способы сделать архитектуру проекта проще и удобнее — и пришел к мысли, что пора переходитm на SQLite. 🔵Переход не всегда был простым — пришлось и разобраться, как обойти ошибку `database is locked`, и найти способ сжатия данных в SQLite. В MySQL вопрос решался через функцию `compress`, а вот в SQLite решение оказалось не таким очевидным. Спойлернем: автор начал с поисков стороннего плагина, но в итоге пришел к тому, что более жизнеспособный вариант — компрессия на уровне файловой системы. 🔵Несмотря на все сложности, SQLite с 6,4 ТБ справляется не хуже, а иногда даже лучше, чем MySQL. Автор все равно переживает, что какие-нибудь проблемы все равно вылезут, но пока полет нормальный. Как вам такой эксперимент? ❤️ — Проект работает, цель достигнута — значит, все было не зря! 🙈 — Слишком много суеты непонятно для чего
6 TB в SQLite Как известно, те, кто хочет, ищет способы, а те, кто не хочет —…
Из этого канала
- #1762Umami — альтернатива Google Analytics Как бы ни был хорош, привычен и удобен…
Umami — альтернатива Google Analytics Как бы ни был хорош, привычен и удобен Google Analytics, не всем нравится, что корпорация собирает и использует в своих…
- #1763LEFT JOIN открыл вакансии инженера данных для студентов karpov.соurses Это…
LEFT JOIN открыл вакансии инженера данных для студентов karpov.соurses Это значит, что все оплатившие обучение на курсе «Инженер данных» до 27 марта, смогут…
- #1765Как развиваться в профессии инженера данных? Совсем скоро стартует новый поток…
Как развиваться в профессии инженера данных? Совсем скоро стартует новый поток курса «Инженер данных» — тот самый, где студенты могут получить не только…
- #1760Сегодня не пятница, но это не повод не запостить #мем
Сегодня не пятница, но это не повод не запостить #мем
- #1759ClickHouse в практике дата-консалтинга Мы довольно часто имеем дело с…
ClickHouse в практике дата-консалтинга Мы довольно часто имеем дело с ClickHouse на своих проектах.