olegbunin Oct 27 2015 at 22:42

Эра NoSQL позади

5 min

55K

Конференции Олега Бунина (Онтико) corporate blogMySQL*NoSQL*Node.JS*MongoDB*

+22

Comments 30

4dmonster Oct 27 2015 at 23:17

Если грубо упростить, развитие индустрии заключается в придумывании на каждом витке новых терминов.

— «Эра NoSQL позади»
— Что, опять?

— «один из лучших выборов — платформа…, СУБД и сервер приложений в одном флаконе»
— Что, опять?

— Все NoSQL-решения добавляют SQL, просто не все это ещё успели сделать. Все SQL-решения добавляют NoSQL, просто не все это ещё успели сделать.
— Что, опять?

— «Борьба идёт за байты и инструкции, и сложный код просто не может работать эффективно.»
— Что, опять?

+47

23derevo Oct 28 2015 at 11:04

Это вообще характерное для любого явления развитие, не только в IT.

olegbunin Oct 28 2015 at 12:06

Константин Осипов работает в области баз данных уже несколько лет, а сейчас разработчик собственного NoSQL-решения. В Mail.RU Tarantool обслуживает сотни тысяч запросов в секунду. Мне кажется, что его мнение основано всё таки не на голословных утверждениях, а на реальной оценки ситуации.

-11

4dmonster Oct 28 2015 at 12:32

Я не смог определить, где я опровергаю его мнение.
Если очистить содержимое статьи от мактетологии, а мой коммент от сарказма, они, как мне кажется, совпадут.
Хотя, есть предчувствие, что пока ещё на новый виток выруливать рано.

+14

psman Oct 28 2015 at 15:19

leventov Oct 28 2015 at 15:47

Это не тот случай. Есть системы с протоколом (тот же memcached), а есть — позволяющие делать что угодно, реализовывать протоколы, например

psman Oct 28 2015 at 15:52

Не суть.
Тарантул конечно штука хорошая, но это +1 инструмент.
С нуля может и стоит начинать юзать где либо с оговорками на сырость и недоработки + особенности работы.
В текущих проектах рефакторить уже местами сложновато.

dim_s Oct 28 2015 at 00:40

А я думал, что NoSQL сейчас это нереляционные базы данных, хоть и в названии есть SQL.

EndUser Oct 28 2015 at 01:42

http://cdn.infoq.com/statics_s2_20151020-0055-1/resource/presentations/db-history-data-processing/en/slides/sl70.jpg

+10

evocatus Oct 28 2015 at 00:57

На снимке экрана код на Lua, хотя в статье про него ни слова

olegbunin Oct 28 2015 at 01:17

Ну так встроенный язык в Tarantool — Lua.

youROCK Oct 28 2015 at 01:19

Приложения под Tarantool пишутся на LuaJIT

rtsisyk Oct 28 2015 at 14:19

Также имеется возможность написания модулей на C/C++ [1]. При помощи данного API можно подключить любой другой язык программирования или библиотеку, было бы желание. В частности, наш memcached[2] написан на сишном API.

[1]: tarantool.org/doc/reference/capi.html
[2]: github.com/tarantool/memcached

// Disclaimer: tarantool.org contributor

leventov Oct 28 2015 at 05:47

Мне кажется, Non-Volatile Memory может очень сильно поменять ландшафт систем хранения данных, и систем обработки данных в целом.

23derevo Oct 28 2015 at 11:09

это все баззворд очередной. По факту у нас сейчас в реальном мире есть иерархия памяти. Более быстрая — волатильна, более медленная персистентна. То, что мы сейчас называем оперативной памятью — ну да, волатильна. Но персистентность в этом месте стоит денег. Мы ведь с тобой понимаем, что чем ближе память к процу, тем она быстрее и дороже, а чем дальше — тем дешевле.

Так что я не соглашусь — с приходом NVM поменяется только свойства одного конкретного слоя, а не всей иерархии. Чтобы поменять ландшафт, нужно менять принципы, менять всю иерархию, а не только свойство конкретного слоя в нем.

demimurych Oct 28 2015 at 13:59

Если я верно понял весь сыр бор о том как правильно использовать большие обьемы данных размещенных в оперативной памяти. Иначе говоря, они уже уперлись в верхний потолок настолько, что выигрыш на сокращении таких издержек оказывается значимым.

То есть да, для разработчика БД в целом ничего не меняется. Все сливки для тех кто делает инструменты для разработчика. И когда говорят о структурном изменении какого то слоя иерархии — для них, тех кто делает инструмент, равнозначно изменению ландшафта в целом.

23derevo Oct 28 2015 at 14:13

согласен. Зааффектятся именно разработчики инструментов, условно говоря, того же MySQL или Tarantool. Они будут делать изменения именно в изменившемся слое (например, RAM) и соседних слоях.

Тем не менее, практически невозможно оценить impact абстрактного изменения памяти на абстрактную (неизвестно какую) NVM :)

leventov Oct 28 2015 at 14:46

Как раз мне кажется, что изменится поход. Зачем городить SQL запросы, если, грубо говоря, все состояние системы, удобно разложенное в родные рантаймовые структуры типа списков и мапов — durable из коробки.

Я говорю, может быть, не о 3d xpoint, который пока 1) помедленнее обычной памяти, 2) имеет чуть другой интерфейс, чтобы просто выбросить всю старую память и заменить на него. Но в перспективе 10, ну 15 лет, мне кажется, очевидно, что железячники закроют этот технологический зазор, и брать волатильную память не будет никакого смысла, потому что она будет стоить столько же и работать не быстрее.

23derevo Oct 28 2015 at 18:26

за 10-15 лет столько всего может произойти, что ппц. Вот пришли лет 5 назад на рынок SSD, о которых 10 лет назад никто не слыхивал. Они на один-два порядка быстрее HDD десятилетней давности в разных сценариях. И что, разве мы можем сказать, что как-то принципиально изменились внутренности инструментов? Да нифига! Безусловно, разработчики инструментов и фреймворков адаптировали свои решения, но разве это было прямо-уж-так-заметно?

rudenkovk Oct 28 2015 at 09:52

Технологии под капотом там практически одинаковые. Платформа позволяет заменить несколько решений сразу, например, недавно мы сделали Memcached plugin, который реализует бинарный протокол Memcached для Тарантула.

Документация

Tarantool does not support the binary protocol of Memcached. If top performance is a must, Tarantool's own binary protocol should be used.

Где искать?

kostja Oct 28 2015 at 13:13

github.com/tarantool/memcached
вчера выложили, новая реализация бинарного протокола на новом plugin api
пока ещё сыро :)

rudenkovk Oct 28 2015 at 13:16

ОХ ждем, ОЧЕНЬ!!! :) Прям мечтаем о таком деле!

ekho Oct 28 2015 at 13:26

Readme бы ещё хоть чуть-чуть наполнить ;)

rtsisyk Oct 28 2015 at 14:21

Работаем над этим. Только-только выложили, сейчас будем доводить до ума README, документацию, пакеты, тесты.

talanchor Oct 28 2015 at 13:58

>>> В качестве бонуса пользователь получает все остальные наши возможности — мастер-мастер репликацию и подключаемые движки хранения, например.

Года два назад я слышал на каком-то докладе про то, что в тарантуле уже есть дисковый движок. Но по отзывам тех кто его пробовал — работа с ним была нестабильной и его использование в продакшене из-за этого было немного стремновато. Как сейчас с ним обстоят дела? Он уже стабилен и зарелизен или пока еще нет?

И еще вопрос про репликацию: мастер-мастер репликация — достаточно сложная, но нужная фича для отказоустойчивой работы системы. Правильно ли я понимаю, что тарантул умеет синхронно реплицировать данные между узлами, и в случае выхода из строя скажем одного из трех узлов продолжать работу и писать данные на оставшиеся два, и данные при этом остаются всегда консистентными?

kostja Oct 28 2015 at 14:05

Привет!

София сейчас по нашим оценкам достаточно хорошо работает с объёмом данных до 500ГБ на инстанс, сейчас пытаемся сделать так чтобы нормально работала с терабайтными объёмами. Из существенных ограничений — пока нет вторичных ключей. Многокомпонентные ключи есть. В проде в mail.ru пока нигде нет — нам нужны как раз терабайтные объёмы, пытаемся запустить.

Мастер-мастер асинхронный, синхронный делаем в 1.7, который должен выйти в этом году.

igor_suhorukov Oct 28 2015 at 15:28

Разве на объемах 500ГБ на инстанс не выгоднее использовать шардированную реляционную или объектно-реляционную СУБД схожих объемов на инстанс, настроенную чтобы иметь большой дисковый кеш в ОЗУ?

По моему опыту, все inmemory db не дают таких же ACID гарантий как РСУБД, даже если СУБД используется как DataStore позади inmemory db

ilukyanov Oct 29 2015 at 08:42

А в чем разница Софии относительно LevelDB/RocksDB? Она работает поверх сырого блочного устройства или тоже поверх файловой системы?

Shoonoise Oct 30 2015 at 15:43

> Мастер-мастер асинхронный
а это как?

igor_suhorukov Oct 28 2015 at 15:22

Все NoSQL-решения добавляют SQL, просто не все это ещё успели сделать.

Декларативный язык запросов и обновления упрощает работу с БД.

Но не то чтобы все, но многие… crate.io база на основе Elasticsearch — SQL JOINs are nearly ready