rtsisyk Dec 9 2015 at 14:13

Tarantool как сервер приложений

8 min

29K

VK corporate blogHigh performance*NoSQL*Lua*Tarantool*

+57

Comments 59

evnuh Dec 9 2015 at 14:22

Что-то вас понесло конечно) Я когда-то рассматривал тарантул в качестве бд, но ещё на этапе бд она уже была разнобокая — хранение на диске и в памяти было реализовано по-разному, в итоге прихоодилось выбирать либо только то, либо только это. А теперь, когда ваш тарантул превратился и в веб-сервер-клиент-api-parser и т.д. уже совсем непонятно, в какой реальной задаче требуется это всё?

dedokOne Dec 9 2015 at 14:29

Это все инструменты, не обязательно их все использовать, к примеру, можно использовать только in-memory или только storage.
Кстати, многие проекты которые начинались как БД обросли не меньше.

zloidemon Dec 9 2015 at 14:31

У меня вообще обрабатывает звонки из телефонии. Можно делать что хочешь, и как хочешь.

rtsisyk Dec 9 2015 at 15:32

box.schema.space.create('in_memory', { engine = 'memtx' }) — храним в памяти
box.schema.space.create('on_disk', { engine = 'sophia' }) — храним на диске
При том что мы используем общий binlog для всех движков, репликация и прочие фишки будут работать одинаково.

youROCK Dec 9 2015 at 16:35

Я кстати всё забываю спросить, репликация логическая? Или здесь это неприменимо :)?

rtsisyk Dec 9 2015 at 17:14

row-based на запросы к самой базе.
Кстати вызовы хранимок на слейвы тоже не проигрываем, как некоторые, передаем лишь сделанные изменения в базе.

DLag Dec 9 2015 at 14:53

Что-то я на Highload поспрашивал используется ли оно хоть где-то в production, и не получил положительных ответов.
Как я понял, Mail.ru это делает чисто для поиграться, и ищет желающих подопытных все-таки попробовать это в работе…
Т.е. по сути очистка кармы перед OSS сообществом и информационный повод.

-2

rtsisyk Dec 9 2015 at 14:56

Всё Mail.Ru на Tarantool. Серьезно.

bigbes Dec 9 2015 at 14:58

Это странное утверждение. На стенде рассказывали что оно используется в Badoo, Avito, Wallarm, да и во всём Мейл.Ру.
Не особо понятно о каком «Mail.ru это делает чисто для поиграться» идёт речь.

DLag Dec 9 2015 at 16:42

На стенде говорили что его пробуют много где.
Пробовать — не значит использовать в проде.
На прямой вопрос о том в каких кейсах Mail.Ru использует Tarantool мне фактически не ответили, съехали с разговора.
На всех докладах говорилось что они ждут фидбек от тех кто использует в проде.
Как я понял своего фидбека нет…

rtsisyk Dec 9 2015 at 17:16

На Хайлоаде был знатный доклад тех. дира почты (почты Mail.Ru, Карл) про сэкономленный миллион долларов на Тарантуле.
Как раздобуду презентацию — постараюсь выложить.
Фидбек всегда ждем, поскольку на его основе мы планируем новые фичи.

RubaXa Dec 9 2015 at 17:27

Так вот же он it.mail.ru/video/253

RubaXa Dec 10 2015 at 11:29

Вот ещё про использование Tarantool в «Облаке@Mail.Ru»

ooprizrakoo Dec 9 2015 at 14:58

+ Badoo, Avito, Wallarm, чуток в Сбербанке, и др.

HDDimon Dec 9 2015 at 17:47

а в Сбербанке как его используют?

ooprizrakoo Dec 9 2015 at 17:55

не знаю подробностей, там у них какое-то небольшое инфраструктурное решение.
возможно, просто смотрят пока как оно в «бою» себя ведет.

ilnarb Dec 9 2015 at 15:07

Я использую в продакшене: 4 сервера в кластере с 96Gb, суммарно 320Gb памяти под тарантулы.
Хранятся порядка 5 млрд записей, в среднем по 40 байт. Uptime 2 года без без каких либо вмешательств и обновлений.
Никакая база так эффективно не может хранить столько мелких данных так эффективно в оперативке.
Бизнес логика зашита в lua процедурах, и запросы идут в batch режиме.
Если бы не было lua процедур, batch режим был бы не доступен, т.к. изменение данных зависят от других данных в базе: пара селектов и один апдейт. Это было бы 3 раунд-трипа на одну операцию изменения, а тут удается упаковать 50 операций в один раунд-трип.

+10

DLag Dec 9 2015 at 16:47

2 года без обновлений? Смело.
4 сервера в кластере, у вас Master->3xSlave?
Просто Master-Master появился в Tarantool чуть больше месяца назад и использовать подобное решение для боевых данных без проверки временем рисковано.
Раудтрипы убираются в любой БД встроенными процедурами.
Почему взяли Tarantool?

ilnarb Dec 9 2015 at 17:20

Шардинг на клиенте.

bigbes Dec 9 2015 at 18:14

> Просто Master-Master появился в Tarantool чуть больше месяца назад.
Вы это скажите инсталляциям в Авито, которым уже больше года

DLag Dec 9 2015 at 16:53

Не ясно откуда утверждение про эффективность хранения.
В Tarantool не шардинга, только поделка на коленке от инженеров Mail.Ru без понимания принципа ACID.
Очевидно что либо Tarantool не хранит все данные в ОЗУ, либо у вас свой наколеночный шардинг.
И опять таки, почему не использовать взрослые решения и с чем вы сравнивали?
И сравнивали ли вы вообще…

-1

rtsisyk Dec 9 2015 at 17:11

В плане базы данных у нас все честно. ACID самый что ни на есть настоящий.
Мастер-Мастер есть уже более года, с каждым релизом делаем всё проще и удобнее.

DLag Dec 9 2015 at 18:15

Я про ACID в шардинге, который предлагали ваши коллеги.
Там его просто нет.

rtsisyk Dec 9 2015 at 18:46

возможно, он там и не нужен был.
Расскажите как use-case у Вас…

ilnarb Dec 9 2015 at 17:21

Сравнивал (мемкеш, монго, мускуль, редис, токио кабинет), но расписывать все не хочу, могу ответить по конкретным конкурентам, про которые вы хотели бы знать.

BHYCHIK Dec 9 2015 at 19:11

На HighLoad был доклад от Дмитрия Калугина-Балашова о выборе базы данных.

rtsisyk Dec 9 2015 at 19:51

articles.rvncerr.org/how-to-chose-an-in-memory-nosql-solution-performance-measuring вот здесь есть статья по мотивам доклада.

rtsisyk Dec 10 2015 at 11:30

Вы просили — мы сделали. habrahabr.ru/company/mailru/blog/272769

zloidemon Dec 9 2015 at 15:01

У нас в плюсофоне используется.

DLag Dec 9 2015 at 16:57

Отлично, кто-то живой с опытом production use.
Ответьте пожалуйста на вопросы, думаю всем будет интересно:
Под какие структуры данных?
Какой стор используете?
Масштабируете?
Почему именно Tarantool?

zloidemon Dec 10 2015 at 12:10

1. Разные данные, есть где пары звонков с индексами по несколько ключам, есть просто куча данных которые по кругу через очередь ротируются.
2. У меня memtx и почти все режиме temporary=true.
3. Стоит http встроенный, и nginx балансирует нагрузку. На сокетах протоколы (AGI & AMI) из АТС (Asterisk).
4. Очень удобно программировать на Lua (нет лишних знаков препинания), и сразу есть куча ништяков. У меня не только Tarantool есть. Есть redis/riak которые пойдут под нож в будущем.

Nick0N Dec 9 2015 at 15:02

Переносим скриптец в /etc/tarantool/instances.enabled/myapp.lua и запускаем уже через готовые утилиты для init (tarantoolctl start myapp или даже service tarantool restart). Работает! Просто?

Все хорошо, но тогда приложение БД и http сервер нужно описывать в одном файле, иначе при рестарте http приложение заворачивается в event loop и на этом все! Я подозреваю, что server:start() должен вызываться вконце всего и вся.

И отсюда проблемы с перезапуском, service tarantool restart на большой БД (около 180кк туплов ) занимает порядка 15минут!!! А тебе всего лишь нужно было добавить новый route и handler.

bigbes Dec 9 2015 at 15:06

Использовать «tarantoolctl eval \<app\>» , по хорошему. Никакого перезапуска, только перезагрузка файла конфигурации.

Nick0N Dec 9 2015 at 15:14

Спасибо! Но я так понимаю надо и сервер и бд описывать в одном файле конфигурации?

rtsisyk Dec 9 2015 at 15:17

Само приложение лучше делать отдельно в виде модуля и помещать в /usr/share/tarantool/myapp.
В etc лучше оставить только конфигурацию. Изменение настроек на лету можно делать через админку, правда не все опции пока меняются.
Я думаю мы еще напишем об этом.

GubkaBob Dec 9 2015 at 15:19

ну, плюсы обозначены. а какие минусы в сравнении с другими архитектурами? сравнивали?

Всё Mail.Ru на Tarantool. Серьезно.

какие шишки успели набить? где стелить солому?

rtsisyk Dec 9 2015 at 15:29

Сравнение разумно проводить в разрезе с какими-то другими конкретными решениями, но в целом это тема для отдельной ~~докторской диссертации~~ статьи :) Расскажите о своей задаче и мы скажем насколько Tarantool для неё подходит.

GubkaBob Dec 9 2015 at 15:41

Я и надеялся, что такие сравнения проводились.

Вот, например возьмем кейс, который мне интересен: веб-сервис, принимающий на вход потоки маленьких сущностей, например телеметрию от тысяч датчиков, которые куда-то сложить и потом сравнительно быстро показать график или выбрать данные за последний час для любого из них.

Задача наглядная, и частично покрыта Асинхронная работа с Tarantool на Python. Но если взять вместо tarantool что-то из набора: tomcat, play2, mina, go, mysql, postgresql, berkleydb — где станет хуже/лучше?

ps. то что будет солянка их технологий — меня не пугает. от неё все равно не уйти. интересует только какие проблемы добавит tarantool.

rtsisyk Dec 9 2015 at 16:50

Смешались в кучу кони, люди :) Я не очень понимаю как можно сравнивать play framework и bdb, ведь это совершенно разные инструменты для разных задач.

Для телеметрии от датчиков и прочего IoT сервис можно поднять сервис напрямую на тарантуле, хоть по HTTP, хоть MQTT какой-нибудь на луа. В таком раскладе tomcat c play может оказаться вам просто не нужен. Собственно в этом и есть соль статьи.

Кстати, с графиками у нас есть няшный пример — bench.farm.tarantool.org

GubkaBob Dec 9 2015 at 18:56

Смешались в кучу кони, люди :) Я не очень понимаю как можно сравнивать play framework и bdb

не надо сравнивать одно с другим. вопрос был про Tarantool vs others. Потому что статья называется «Tarantool как сервер приложений», да и сам тарантул вроде как база чуть-чуть. поэтому и сравнивать можно/надо со стеком, в котором компонентами может быть как play, так и bdb.

как можно сделать телеметрию с тарантулом — придумать можно. но пока не попробуешь — плюсы не очевидны, а грабли — не видны

rtsisyk Dec 9 2015 at 19:24

Если задача состоит в том, что надо получить данные с устройства, немного их обработать и сразу же сохранить в БД, то какой смысл здесь городить целый стек tomcat + play + postgresql, если один тарантул с http на борту сделает тоже самое?
Про модуль для nginx писали тоже не так давно: habrahabr.ru/company/mailru/blog/272141

GubkaBob Dec 9 2015 at 22:18

вот и я думаю — зачем?

zuborg Dec 9 2015 at 16:24

Технический вопрос.
Стоит задача эффективно хранить сотню (или больше) миллионов записей вида (idA, idB) — т.е. отношение many-to-many. Например, что такой-то файл есть на таком-то сервере (файлов много и серверов много, один и тот же файл на разных серверах и соотв на одном сервере разные файлы). Как с этим справится тарантул? Сколько байт будет в среднем потребляться на одну запись (положим, айдишники по 32 бита)? Нужны persistency, fault tolerance, master-master replication, индексированный доступ по обоим полям (т.е. эффективно получить список серверов для файла и список файлов на сервере).

kostja Dec 9 2015 at 16:41

32-40 байт на запись, с учётом памяти под данные и индексы.

rtsisyk Dec 9 2015 at 17:06

Немного поправлю, 32-40 с одним индексом (сервер->файлы) и примерно 48-56 с двумя (файл->сервер + сервер->файлы).
Над утилизацией памяти мы активно работаем, есть чем похвастаться. Остальные перечисленные фишки (persistency, fault tolerance, master-master replication) также есть из коробки.

zuborg Dec 9 2015 at 17:16

Есть ли у тарантула проблема с index bloating? Если индексы ещё можно пересоздать на ходу (можно ж на ходу создать индекс?) то как обстоит с фрагментацией в файлах данных? Сколько будет занимать пустое место (от удаленных записей) в файлах базы под активной нагрузкой?

rtsisyk Dec 9 2015 at 17:20

У нас же не ~~монга~~WebScale, нет никакого пустого места ни в каких файлах в принципе.
В случае in-memory мы пишем append only write-ahead-log (binary log) и периодически делаем снапшоты на диск. Индексы вообще хранятся полностью в памяти.

zuborg Dec 9 2015 at 17:35

Индексы вообще хранятся полностью в памяти.

То что они хранятся в памяти ещё не означает что нет проблемы с раздуванием. Например, тарантул запустился, загрузил 100М записей, проиндексировал их и это заняло 5ГБ памяти. Потом пошла работа — какие-то данные удалились, какие-то добавились, в итоге их осталось те же 100М, но уже других. В ходе работы потребление памяти будет расти. Например, при записях нефиксированной длины будут оставаться дырки, когда на место большой записи будет добавлена маленькая, а оставшееся место уже не сможет уместить ни одну запись. Обновление индексов тоже влечет за собой постоянное перемещение указателей для сохранения балансировки дерева — в итоге часть нод будет заполнена совсем не так плотно, как могла бы.
Если в процессе работы будет заменено в случайном порядке 200% записей (т.е. 200М обновлений для 100М записей) — во сколько раз вырастет потребление памяти? Для постгреса, например, размер индекса легко вырастает в несколько раз при активной нагрузке.

rtsisyk Dec 9 2015 at 17:48

Вы говорите сейчас о так называемой «фрагментации памяти». Естественно, что решить NP-полную задачу выделения памяти идеально для всех случаев невозможно, но можно свести фрагментацию к минимуму для ваших конкретных данных. Именно поэтому Tarantool использует аж целое семейство специализированных аллокаторов под разные задачи, а также дает различные ручки для их настройки. На HighLoad++ в этом году аж целый доклад был про особенности в СУБД для данных в оперативной памяти (видео пока организаторы не дают).

dedokOne Dec 9 2015 at 18:00

У посгри есть вакуум. Советую вам попробовать, если вам подходит решение такого класса как Tarantool, если будут не понимание в использование у нас открытое комьюнити обращайтесь — поможем.
А решать задачи абстрактно, гипотетически немного не благодарное занятие.

uglock Dec 10 2015 at 07:34

Lua это хорошо, это вам не q/kdb.

B7W Dec 10 2015 at 10:13

Ребята. Вы странно пиарите продукт. Будь он сто раз крут, я не возьму его пока не увижу use cases. Потом связка lua application server является диковиной, никто не представляет как это готовить.

Предлагаю вам написать приложение. Идеально если это будет не веб чатик, а что то полезное у вас в компании. Выложите все это в open source. Расскажите с нуля что как делали. Как код структурировали, базу проектировали, управляли зависимостями, CI, deploy, мониторинг и тд.

rtsisyk Dec 10 2015 at 10:32

В какой-то мере согласен с Вами. Пока что статей от early adopters Tarantool 1.6, прошедших семь кругов ада с управлением зависимостями, CI, deploy, тестированием, мониторингом и прочим, не так много, как хотелось бы. На конференциях были хорошие доклады, но надо постараться донести свой опыт и в виде статей. Также на митапе постараемся рассмотреть больше реальных use cases.

B7W Dec 11 2015 at 00:05

Мне кажется вы немного не туда смотрите. Не надо доносить что-то в статьях и встречах. Надо на сайте написать пачку железобетонных use cases в которых tarantool максимально подходит. Можно сравнить с какой нить базой, например Redis.

Гляньте для примера kkovacs.eu/cassandra-vs-mongodb-vs-couchdb-vs-redis

А популяризация Tarantool происходит только в русской часте сети?

dedokOne Dec 11 2015 at 10:54

Статьи и сравнения (например, на tarantool.org) есть. Use cases не хватает, тоже пришли к такому мнению, будет исправляться, но не все сразу.
А популяризация Tarantool происходит только в русской часте сети?
Не только в русской части сети.

rtsisyk Dec 11 2015 at 10:56

Мы подобную статью тоже написали articles.rvncerr.org/how-to-chose-an-in-memory-nosql-solution-performance-measuring
Продвигать будем в том числе и на западный рынок, но наши ресурсы не безграничны.

oxxx Jun 21 2018 at 22:32

Напишите, что Russian hackers have used it, when break Hillary!

Deepwalker Dec 15 2015 at 17:04

А нет никакого инструментария для управления зависимостями там и тп? Ранние адаптеры не выкладывают своих решений?

rtsisyk Dec 15 2015 at 18:18

luarocks [1], если поиграться на коленках (типа как pip, gem, npm и прочее).
Если в боевую, то deb/rpm пакеты. Можно использовать нашу инфраструктуру [2][3] для сборки своих аппликух под нужные платформы.

[1]: rocks.tarantool.org
[2]: github.com/tarantool/modulekit
[3]: github.com/tarantool/http/blob/master/.travis.yml