Optimizing LinkedIn Sales Navigator’s search pipeline with Spark LinkedIn провёл масштабную оптимизацию поискового пайплайна для Sales Navigator, переведя обработку данных с MapReduce на Spark и сократив время выполнения с 6–7 часов до примерно 3 часов. Это позволило пользователям быстрее получать обновлённые результаты поиска и принимать решения на основе актуальных данных. Технически интересные моменты  - Централизованный сервис поиска: Перевод отдельных поисковых кейсов на единую платформу Search-as-a-Service. - Масштаб Spark-процессинга: Более 100 Spark-джобов, крупнейший из которых использует ~5000 исполнителей (executors). - Работа с большими объёмами данных: Джобы обрабатывают данные в формате Avro, хранящиеся в HDFS, с последующей записью обратно. - Оркестрация пайплайна: Используется Azkaban для управления зависимостями и запуском джобов. https://www.linkedin.com/blog/engineering/infrastructure/optimizing-linkedin-sales-navigators-search-pipeline-with-spark
Optimizing LinkedIn Sales Navigator’s search pipeline with Spark LinkedIn…
Из этого канала
- #2447OpenAI представила gpt-realtime — продвинутую модель для голосовых агентов с…
OpenAI представила gpt-realtime — продвинутую модель для голосовых агентов с новыми API-возможностями.
- #2449Дайджест статей Как аналитики Авито с помощью ML помогают людям выбирать…
Дайджест статей Как аналитики Авито с помощью ML помогают людям выбирать хорошие авто с пробегом https://habr.com/ru/companies/avito/articles/937610/…
- #2450В предверии презентации Apple, которая пока так и не смогла ничего показать в…
В предверии презентации Apple, которая пока так и не смогла ничего показать в части развития Siri и похоже безнадежно отстала от Google с его Pixel 10 (но как…
- #2445#саммари Сегодня в нашем блоге саммари выступления Дениса Афанасьева на митапе…
#саммари Сегодня в нашем блоге саммари выступления Дениса Афанасьева на митапе VTORNIK.Вечер 26 августа.
- #2444Что знал, то из рассказал :)
Что знал, то из рассказал :)