В эластике есть куча возможностей: агрегационные функции, percolate api, много плагинов, легкое масштабирование. Насколько я помню, то сфинкс сам переодически забирает данные из базы. А в эластик нужно отсылать документы вручную, соответственно, они появляются в индексе практически сразу. Тут больше гибкости: денормализация, можно модифицировать данные на основном языке(языке проекта). Хотя и есть механизм river, о нем есть упоминание в статье.
Из плагинов полезные: морфология, определение языка.
Ответ потянет на отдельную статью. Хотя, думаю, можно найти сравнение elasticsearch, solr, sphinx, mongodb, postgresql…
Лично мне понравилась документация(я ее 2 месяца активно изучал), rest api, отличные возможности по аналитике.
Еще есть kibana — отличный помощник в аналитике. Советую посмотреть видео. Рашид в кепке великолепен)
Русская морфология делается с помощью плагина. Я не нашел в документации ничего про добавление словарей для этого плагина. Возможно, твою задачу можно решить другом способом. Посмотри как работает analysis. Там очень много возможностей по обработке текста.
Я планирую в следующей статье рассказать про использование эластика в percolator.io. Расскажу про percolate api, анализ текста, работу с документами, генерацию идентификаторов.
rss: достаточно простая фича и я думаю скоро ее добавить
фильтрация по языку: на самом деле я уже сейчас знаю вероятные языки статей, просто не сделал фильтр, т.к. сервис пока буду продвигать только в рунете
по поводу рейтинга:
на самом деле уже сейчас используется рейтинг wot)
он нужен что бы отсечь в публичных лентах нежелателный контент(порно, вирусы и т.п.)
www.percolator.io/posts/2-vvedenie-v-elasticsearch
этот курс был для hexlet.io, но он от туда почему-то пропал, надеюсь починят =)
Просто объявлем минимальные модели для миграции. Если нужны сложные проеобразования, то лучше написать 1 sql запрос и не использовать activerecord.
Даже если в коде проекта есть модель пользователя, в миграции будет использоваться модель из неймспейса миграции.
А если в каких то тестах нужен оригинальный Koala, то
Соответственно везде используем ServiceLocator.facebook_client
Я делал проект, где percolate — основняя фича. Исходники открыты.
Буду рад пообщаться.
blog.qbox.io/launching-and-scaling-elasticsearch
Из плагинов полезные: морфология, определение языка.
Ответ потянет на отдельную статью. Хотя, думаю, можно найти сравнение elasticsearch, solr, sphinx, mongodb, postgresql…
Лично мне понравилась документация(я ее 2 месяца активно изучал), rest api, отличные возможности по аналитике.
Еще есть kibana — отличный помощник в аналитике. Советую посмотреть видео. Рашид в кепке великолепен)
Я сам делаю проект percolator.io. Подробнее можно почитать в предыдущей статье.
Если есть вопросы по эластику, управлению конфигурацией сервера — буду рад помочь.
Использую rails, reactjs, postgresql, ansible, digitalocean.
brainstorage.me/kuzmin
percolator.io
github.com/darkleaf
rss: достаточно простая фича и я думаю скоро ее добавить
фильтрация по языку: на самом деле я уже сейчас знаю вероятные языки статей, просто не сделал фильтр, т.к. сервис пока буду продвигать только в рунете
по поводу рейтинга:
на самом деле уже сейчас используется рейтинг wot)
он нужен что бы отсечь в публичных лентах нежелателный контент(порно, вирусы и т.п.)