Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)

•Download as PPTX, PDF•

1 like•2,047 views

HighLoad++ 2017 Зал «Мумбай», 8 ноября, 10:00 Тезисы: http://www.highload.ru/2017/abstracts/3045.html Как мы заставили Druid работать в Одноклассниках. «Druid is a high-performance, column-oriented, distributed data store» http://druid.io. Мы расскажем о том, как, внедрив Druid, мы справились с ситуацией, когда MSSQL-based система статистики на 50 терабайт стала: - медленной: средняя скорость ответа была в разы меньше требуемой (и увеличилась в 20 раз); - нестабильной: в час пик статистика отставала до получаса (теперь ничего не отстает); - дорогой: изменилась политика лицензирования Microsoft, расходы на лицензии могли составить миллионы долларов. ...

Как мы заставили Druid
работать в Одноклассниках
Юрий Невиницин

ЗАЧЕМ?
Статистика
Менеджеры
Разработчики
Администраторы
• Цели
• Аномалии
• Мониторинг
• Эксперименты
• Запуски
• Без неё никак

Как мы заставили Druid работать в Одноклассниках / Юрий Невиницин (OK.RU)

Немного цифр
• 350 таблиц
• 50TB
• 12 млрд событий в сутки
• Отставание на полчаса
• 6 секунд
• Цена в миллионы долларов

Постановка задачи
• Быстро
• 24x7x365 ( -1 ЦОД )
• Масштабируемо
• Open-source (Java)

Druid
• Быстро
• 24x7x365 ( -1 ЦОД )
• Масштабируемо
• Open-source (Java)
• Предагрегация
• Timeseries, TopN, GroupBy

Альтернативы
• PostgreSQL
• Influx
• Prometheus
• OpenTSDB
• ClickHouse

• Все довольны
• Сэкономили миллионы долларов
• 1 человек
Druid

Событий/сек
Кластер 500 000
Нода 50 000
Таблица 10 000
Druid

Событий/сек
Кластер 500 000 2 300 000
Нода 50 000 275 000
Таблица 10 000 90 000
Druid
MAX

Внешние компоненты
• Storage (Amazon, HDFS, local)
• Metadata DB (MySQL, Postgres, Derby)
• ZooKeeper
• Cache (memcache, local)

Собственные компоненты
• Realtime
• Historical
• Broker
• Coordinator
• Indexing service

DATA
Realtime Segment
StorageMeta
Coordinator Historical

Historical
QUERY
Broker
subquery1 subquery2 subquery3 subquery4
Historical HistoricalRealtime

Отказ MySQL
• Данные копятся в Realtime-нодах
• Пока не кончатся ресурсы
= предсказуемый запас времени

Отказ MySQL
Storage, Coordinator
• Данные копятся в Realtime-нодах
• Пока не кончатся ресурсы
= предсказуемый запас времени
• Cassandra-based DB
• Свежие данные всегда доступны

Отказ ZooKeeper
• Маленький таймаут
• Много данных
• Лавина трафика
• «Нет данных»
Что делать?

Отказ ZooKeeper
• Удалить данные ZK
• Иметь запас памяти в ZK
• Корректно завершать Historical
• Стартовать Historical с паузой
• Убрать ненужные чтения
• Убрать ненужные данные
Что делать?

Искажение данных
Persisted
Data
Source
Position
Загрузка в Realtime
Persisted
Data
Source
Position
Потеря
Дубль

Time Calls Host
10:45 123 web1
10:45 132 web2
10:45 345 api1
10:45 354 api2
10:50 120 web1
10:50 128 web2
10:50 342 api1
10:50 333 api2

Time Calls Host
10:45 123 web1
10:45 132 web2
10:45 345 api1
10:45 354 api2
10:50 120 web1
10:50 128 web2
10:50 342 api1
10:50 333 api2
long[] long[]
api1 api2 web1 web2

Time Calls Host
10:45 123 2
10:45 132 3
10:45 345 0
10:45 354 1
10:50 120 2
10:50 128 3
10:50 342 0
10:50 333 1
long[] long[]
api1 api2 web1 web2
int[]

Time Calls Host
10:45 123 2
10:45 132 3
10:45 345 0
10:45 354 1
10:50 120 2
10:50 128 3
10:50 342 0
10:50 333 1
long[] long[]
api1 api2 web1 web2
0 0 1 0
0 0 0 1
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
1 0 0 0
0 1 0 0
int[]

Time Calls Host
10:45 123 2
10:45 132 3
10:45 345 0
10:45 354 1
api1 api2 web1 web2
0 0 1 0
0 0 0 1
1 0 0 0
0 1 0 0
Time Calls Host
10:50 123 2
10:50 132 3
10:50 345 0
10:50 354 1
api1 api2 web1 web2
0 0 1 0
0 0 0 1
1 0 0 0
0 1 0 0
Time Calls Host
10:55 123 2
… … …
api1 api2 web1 web2
0 0 1 0
… … … …

Деградация чтения
Загрузка данных
• Размер сегмента
• Частота сброса на диск
• Использовать Selector

like.photo.main.favorites.widget.banner125

like.photo.main
like.photo.album
like.photo.group
like.video.main
like.video.album
like.video.group
like.music.main
like.music.album
like.music.group
share.photo.main
share.photo.album
share.photo.group
share.video.main
share.video.album
share.video.group
share.music.main
share.music.album
share.music.group
comment.photo.main
comment.photo.album
comment.photo.group
comment.video.main
comment.video.album
comment.video.group
comment.music.main
comment.music.album
comment.music.group
SUM(calls) Event = like.%

Action
Like
Share
Comment
Object
Photo
Video
Music
Place
Main
Album
Group
SUM(calls) Action = like

Истинно тяжелый запрос
• 2TB
• 74 секунды
• Приоритеты
• Надо выставлять в запросе
• Работают на уровне очереди

• Отказ MySQL предсказуем
• Для ZooKeeper: запас памяти, корректно
завершать Historical, а стартовать с паузой
• Realtime не гарантирует exactly-once
• Подбор размера сегмента и частоты сброса на
диск
• Использовать Selector
• Разбивать большое измерение на мелкие
• Приоритеты на уровне очереди

Деградация чтения
Загрузка данных
t
N rows
Historical
Realtime N parts = 1

Деградация чтения
Загрузка данных
t
N rows
Historical
Realtime N parts = 2

Деградация чтения
Загрузка данных
t
N rows
Historical
Realtime N parts = 3

Деградация чтения
Загрузка данных
t
N rows
Historical
Realtime N parts = 30

Данные: название источника данных, 2016
74
Слайд с текстом
Подзаголовок
• Далтон Трамбо, один из самых успешных голливудских сценаристов, автор
«Римских каникул» и «Спартака», не подозревал, что черный список
«Hollywood 10» реально существует, пока сам не попал туда и не был навсегда
выкинут из жизни фабрики грез;
• Премьера «Трамбо» сос��оялась в программе «специальный показ» на
кинофестивале в Торонто в сентябре 2015 года. Выход картины в широкий
прокат состоялся 6 ноября 2015 года.

Данные: название источника данных, 2016
75
Слайд с цифрой
63
Подпись
в две строчки
%

Данные: название источника данных, 2016
76
Слайд с двумя цифрами
63
Подпись
в две строчки
%
27
Подпись
в две строчки
млн

Данные: название источника данных, 2016
77
Изображение с комментарием
Стиль изображений
Зайдите в Quick Styles.
Выберите стиль с тенью

Данные: название источника данных, 2016
78
Вертикальный скриншот Android с комментарием
Скриншот на экране
мобильного телефона
на платформе Android
Вставьте свой скриншот в черное
поле мобильного устройства

Данные: название источника данных, 2016
79
Вертикальный скриншот iOS с комментарием
Скриншот на экране
мобильного телефона
на платформе iOs
Вставьте свой скриншот в черное
поле мобильного устройства

Данные: название источника данных, 2016
80
Горизонтальный скриншот iOS

Данные: название источника данных, 2016
81
Горизонтальный скриншот Android

Данные: название источника данных, 2016
82
Скриншот на экране ноутбука
Скриншот
на экране ноутбука
Вставьте свой скриншот
в черное поле ноутбука

Данные: название источника данных, 2016
83
Таблица
Размещения CRM (руб.) Значение
Промо-баннер (ТГБ под аватаркой) 10000 10000 показов
Промо-посты c охватом на свою группу 10000 23000 показов
Оповещения для вступления в группу 10000 8000 показов
Услуги
Промо-баннер (ТГБ под аватаркой) 10000 16000 показов
Промо-посты c охватом на свою группу 10000 28000 показов
Оповещения для вступления в группу 10000 14000 показов
Промо-баннер (ТГБ под аватаркой) 10000 23000 показов
Промо-посты c охватом на свою группу 10000 1 пост
Оповещения для вступления в группу 10000 23000 показов
Промо-баннер (ТГБ под аватаркой) 10000 Бонус

84
Контакты и полезная информация
Поддержка
партнеров
partners@ok.ru
Отдел
продаж
sales@corp.mail.ru
Блог ОК с информацией
о запусках, событиях и др.
insideok.ru
Лучшие кейсы на базе ОК
за последние годы
awards.insideok.ru
Продуктовые
обновления
ok.ru/gruppa
Официальная
группа ОК
ok.ru/ok

More from Ontico

One-cloud — система управления дата-центром в Одноклассниках / Олег Анастасье...

Ontico

HighLoad++ 2017 Зал «Калининград», 8 ноября, 15:00 Тезисы: http://www.highload.ru/2017/abstracts/2964.html Одноклассники состоят из более чем восьми тысяч железных серверов, расположенных в нескольких дата-центрах. Каждая из этих машин была специализированной под конкретную задачу - как для обеспечения изоляции отказов, так и для обеспечения автоматизированного управления инфраструктурой. ...

Масштабируя DNS / Артем Гавриченков (Qrator Labs)

Ontico

HighLoad++ 2017 Зал «Калининград», 8 ноября, 16:00 Тезисы: http://www.highload.ru/2017/abstracts/3032.html Протокол DNS на семь лет старше, чем Всемирная паутина. Стандарты RFC 882 и 883, определяющие основную функциональность системы доменных имён, появились в конце 1983 года, а первая реализация последовала уже годом позже. Естественно, что у технологии столь старой и при этом по сей день активнейшим образом используемой просто не могли не накопиться особенности, неочевидные обыкновенным пользователям. ...

Создание BigData-платформы для ФГУП Почта России / Андрей Бащенко (Luxoft)

Ontico

HighLoad++ 2017 Зал «Калининград», 8 ноября, 13:00 Тезисы: http://www.highload.ru/2017/abstracts/3010.html В этом докладе я расскажу, как BigData-платформа помогает трансформировать Почту России, как мы управляем построением и развитием платформы. Расскажу про найденные удачные решения, например, как разбиение на продукты с понятными SLA и интерфейсами между ними помогло нам сохранять управляемость с ростом масштабов проекта. ...

Готовим тестовое окружение, или сколько тестовых инстансов вам нужно / Алекса...

Ontico

HighLoad++ 2017 Зал «Кейптаун», 8 ноября, 10:00 Тезисы: http://www.highload.ru/2017/abstracts/2914.html Казалось бы, что нужно для организации тестового окружения? Тестовая железка и копия боевого окружения - и тестовый сервер готов. Но как быть, когда проект сложный? А когда большой? А если нужно тестировать одновременно много версий? А если все это вместе? Организация тестирования большого развивающегося проекта, где одновременно в разработке и тестировании около полусотни фич - достаточно непростая задача. Ситуация обычно осложняется тем, что иногда есть желание потрогать еще не полностью готовый функционал. В таких ситуациях часто возникает вопрос: "А куда это можно накатить и где покликать?" ...

Новые технологии репликации данных в PostgreSQL / Александр Алексеев (Postgre...

Ontico

HighLoad++ 2017 Зал «Кейптаун», 8 ноября, 18:00 Тезисы: http://www.highload.ru/2017/abstracts/2854.html Из этого доклада вы узнаете о возможностях репликации и автофейловера PostgreSQL, в том числе о возможностях, ставших доступных в PostgreSQL 10. Среди прочих, будет затронуты следующие темы: * Виды репликации и решаемые с ее помощью проблемы. * Настройка потоковой репликации. * Настройка логической репликации. * Настройка автофейловера / HA средствами Stolon и Consul. После прослушивания доклада вы сможете самостоятельно настраивать репликацию и автофейловер PostgreSQL.

PostgreSQL Configuration for Humans / Alvaro Hernandez (OnGres)

Ontico

HighLoad++ 2017 Зал «Кейптаун», 8 ноября, 17:00 Тезисы: http://www.highload.ru/2017/abstracts/3096.html PostgreSQL is the world’s most advanced open source database. Indeed! With around 270 configuration parameters in postgresql.conf, plus all the knobs in pg_hba.conf, it is definitely ADVANCED! How many parameters do you tune? 1? 8? 32? Anyone ever tuned more than 64? No tuning means below par performance. But how to start? Which parameters to tune? What are the appropriate values? Is there a tool --not just an editor like vim or emacs-- to help users manage the 700-line postgresql.conf file? Join this talk to understand the performance advantages of appropriately tuning your postgresql.conf file, showcase a new free tool to make PostgreSQL configuration possible for HUMANS, and learn the best practices for tuning several relevant postgresql.conf parameters.

Inexpensive Datamasking for MySQL with ProxySQL — Data Anonymization for Deve...

Ontico

HighLoad++ 2017 Зал «Кейптаун», 8 ноября, 16:00 Тезисы: http://www.highload.ru/2017/abstracts/3115.html During this session we will cover the last development in ProxySQL to support regular expressions (RE2 and PCRE) and how we can use this strong technique in correlation with ProxySQL's query rules to anonymize live data quickly and transparently. We will explain the mechanism and how to generate these rules quickly. We show live demo with all challenges we got from the Community and we finish the session by an interactive brainstorm testing queries from the audience.

Опыт разработки модуля межсетевого экранирования для MySQL / Олег Брославский...

Ontico

HighLoad++ 2017 Зал «Кейптаун», 8 ноября, 15:00 Тезисы: http://www.highload.ru/2017/abstracts/2957.html Расскажем о нашем опыте разработки модуля межсетевого экрана для MySQL с использованием генератора парсеров ANTLR и языка Kotlin. Подробно рассмотрим следующие вопросы: — когда и почему целесообразно использовать ANTLR; — особенности разработки ANTLR-грамматики для MySQL; — сравнение производительности рантаймов для ANTLR в рамках задачи синтаксического анализа MySQL (C#, Java, Kotlin, Go, Python, PyPy, C++); — вспомогательные DSL; — микросервисная архитектура модуля экранирования SQL; — полученные результаты.

ProxySQL Use Case Scenarios / Alkin Tezuysal (Percona)

Ontico

HighLoad++ 2017 Зал «Кейптаун», 8 ноября, 14:00 Тезисы: http://www.highload.ru/2017/abstracts/3114.html ProxySQL aims to be the most powerful proxy in the MySQL ecosystem. It is protocol-aware and able to provide high availability (HA) and high performance with no changes in the application, using several built-in features and integration with clustering software. During this session we will quickly introduce its main features, so to better understand how it works. We will then describe multiple use case scenarios in which ProxySQL empowers large MySQL installations to provide HA with zero downtime, read/write split, query rewrite, sharding, query caching, and multiplexing using SSL across data centers.

MySQL Replication — Advanced Features / Петр Зайцев (Percona)

Ontico

HighLoad++ 2017 Зал «Кейптаун», 8 ноября, 13:00 Тезисы: http://www.highload.ru/2017/abstracts/2954.html MySQL Replication is powerful and has added a lot of advanced features through the years. In this presentation we will look into replication technology in MySQL 5.7 and variants focusing on advanced features, what do they mean, when to use them and when not, Including. When should you use STATEMENT, ROW or MIXED binary log format? What is GTID in MySQL and MariaDB and why do you want to use them? What is semi-sync replication and how is it different from lossless semi-sync? ...

Внутренний open-source. Как разрабатывать мобильное приложение большим количе...

Ontico

HighLoad++ 2017 Зал «Кейптаун», 8 ноября, 12:00 Тезисы: http://www.highload.ru/2017/abstracts/3120.html Количество разработчиков мобильных приложений Сбербанк Онлайн с начала 2016 года выросло на порядок. Для того чтобы продолжать выпускать качественный продукт, мы кардинально перестраиваем процесс разработки. Количество внутренних заказчиков тех или иных доработок в какой-то момент выросло настолько, что разработчики стали узким местом. Мы внедрили культуру разработки, которую можно условно назвать "внутренним open-source", сохранив за собой контроль над архитектурой и качеством проекта, но позволив разрабатывать новые фичи всем желающим. ...

Балансировка на скорости проводов. Без ASIC, без ограничений. Решения NFWare ...

Ontico

HighLoad++ 2017 Зал «Мумбай», 8 ноября, 16:00 Тезисы: http://www.highload.ru/2017/abstracts/2858.html Аудитория Одноклассников превышает 73 миллиона человек в России, СНГ и странах дальнего зарубежья. При этом ОК.ru - первая социальная сеть по просмотрам видео в рунете и крупнейшая сервисная платформа. Качественный и количественный рост DDoS-атак за последние годы превращает их в одну из первоочередных проблем для крупнейших интернет-ресурсов. В зависимости от вектора атаки “узким” местом становится та или иная часть инфраструктуры. В частности, при SYN-flood первый удар приходится на систему балансировки трафика. От ее производительности зависит успех в противостоянии атаке. ...

Перехват трафика — мифы и реальность / Евгений Усков (Qrator Labs)

Ontico

HighLoad++ 2017 Зал «Мумбай», 8 ноября, 15:00 Тезисы: http://www.highload.ru/2017/abstracts/3008.html Никогда не было и вот снова случилось! Компания Google в результате перенаправления трафика сделала недостпуными в Японии несколько тысяч различных сервисов, большинство из которых никак не связано с самой компанией Google. Однако, подобные инциденты происходят с завидной регулярностью, вот только не всегда попадают в большие СМИ. У таких инцидентов могут быть разные причины, начиная от ошибок сетевых инженеров и заканчивая государственным регулированием. ...

И тогда наверняка вдруг запляшут облака! / Алексей Сушков (ПЕТЕР-СЕРВИС)

Ontico

HighLoad++ 2017 Зал «Мумбай», 8 ноября, 14:00 Тезисы: http://www.highload.ru/2017/abstracts/2925.html Облака и виртуализация – современные тренды развития IT-технологий. Операторы связи строят свои TelcoClouds на стандартах NFV (Network Functions Virtualization) и SDN (Software-Defined Networking). В докладе начнем с основ виртуализации, далее разберемся, для чего используются NFV и SDN, потом полетим к облакам и вернемся на землю для решения практических задач! ...

100500 способов кэширования в Oracle Database или как достичь максимальной ск...

Ontico

HighLoad++ 2017 Зал «Рио-де-Жанейро», 8 ноября, 14:00 Тезисы: http://www.highload.ru/2017/abstracts/2913.html Изначально будут раскрыты базовые причины, которые заставили появиться такой части механизма СУБД, как кэш результатов, и почему в ряде СУБД он есть или отсутствует. Будут рассмотрены различные варианты кэширования результатов как sql-запросов, так и результатов хранимой в БД бизнес-логики. Произведено сравнение способов кэширования (программируемые вручную кэши, стандартный функционал) и даны рекомендации, когда и в каких случаях данные способы оптимальны, а порой опасны. ...

Apache Ignite Persistence: зачем Persistence для In-Memory, и как он работает...

Ontico

HighLoad++ 2017 Зал «Рио-де-Жанейро», 8 ноября, 13:00 Тезисы: http://www.highload.ru/2017/abstracts/2947.html Apache Ignite — Open Source платформа для высокопроизводительной распределенной работы с большими данными с применением SQL или Java/.NET/C++ API. Ignite используют в самых разных отраслях. Сбербанк, ING, RingCentral, Microsoft, e-Therapeutics — все эти компании применяют решения на основе Ignite. Размеры кластеров разнятся от всего одного узла до нескольких сотен, узлы могут быть расположены в одном ЦОД-е или в нескольких геораспределенных. ...

Механизмы мониторинга баз данных: взгляд изнутри / Дмитрий Еманов (Firebird P...

Ontico

HighLoad++ 2017 Зал «Рио-де-Жанейро», 8 ноября, 12:00 Тезисы: http://www.highload.ru/2017/abstracts/3005.html Когда мы говорим о нагруженных системах и базах данных с большим числом параллельных коннектов, особый интерес представляет практика эксплуатации и сопровождения таких проектов. В том числе инструменты и механизмы СУБД, которые могут быть использованы DBA и DevOps-инженерами для решения задач мониторинга жизнедеятельности базы данных и ранней диагностики возможных проблем. ...

Как мы учились чинить самолеты в воздухе / Евгений Коломеец (Virtuozzo)

Ontico

HighLoad++ 2017 Зал «Рио-де-Жанейро», 8 ноября, 10:00 Тезисы: http://www.highload.ru/2017/abstracts/2975.html Все мы слышали про изменение кода ядра Linux на лету (kernel live patching). Но кто-нибудь проводит подобные фокусы в user space? Оказалось, что да. Мы тоже попробовали. И получилось. Длинная дорога технологии Userspace Live Patching в жизнь: Что такое Live Patching 1) Изменение части логики процесса. 2) Сохранение состояния процесса. 3) Делать 1+2 БЕЗОПАСНО. ...

Java и Linux — особенности эксплуатации / Алексей Рагозин (Дойче Банк)

Ontico

HighLoad++ 2017 Зал «Рио-де-Жанейро», 8 ноября, 11:00 Тезисы: http://www.highload.ru/2017/abstracts/2884.html Java на Linux встречается повсеместно в информационных системах от больших данных до новомодных serverless архитектур. Как Linux, так и Java имеют свои эксплуатационные нюансы. Понимание этих нюансов важно, чтобы заставить стек Java + Linux работать стабильно и эффективно. Но на практике "джависты" очень любят мыслить кроссплатформенно и не хотят разбираться с особенностями операционной системы, a "линускоиды" считают JVM чуждым миру Linux процессом, пожирающим всю доступную на сервере память. А потом появляется Docker, и нюансов становится ещё больше... Цель доклада - рассказать "джавистам" про Linux и Docker, а "линуксоидам" про JVM.

Как построить кластер для расчета сотен тысяч high-CPU/high-MEM-задач и не ра...

Ontico

HighLoad++ 2017 Зал «Найроби + Касабланка», 8 ноября, 16:00 Тезисы: http://www.highload.ru/2017/abstracts/2996.html Наш проект – это облачный CI-сервис, на котором пользователи запускают тесты разрабатываемых проектов. В этом году система автозакупки нашего проекта приобрела 37218 машин (Amazon Instances). Это позволило обработать 189488 "задач" (прогонов тестов) наших клиентов. Тесты – это всегда ресурсоемкие задачи с максимальным потреблением процессорных мощностей и памяти. Мы не можем прогнозировать, сколько параллельных вычислений и в какой момент времени будет. Перед нами стояла задача построения архитектуры системы, которая умеет очень быстро увеличивать, а также быстро уменьшать мощности кластера.

More from Ontico (20)