Articles / Bookmarks / Profile of rsashka / Habr

Александр Рябиков @rsashka

Системный архитектор

Profile Publications 87Comments 2.3KBookmarks 413

Effesa Feb 14 2019 at 16:38

GDPR: как работать с персональными данными ваших работников, фрилансеров и европейских сотрудников контрагентов

17 min

7.4K

Legislation in IT

Статья представляет собой краткую выжимку и мою интерпретацию положений Регламента GDPR (“Регламент”) в связке с Заключением (Opinion) 2/2017 об обработке данных в трудовых отношениях (on data processing at work) от 08.06.2017. Адресуется компаниям, у которых есть полноценные офисы либо дистанционные работники и/или фрилансеры в странах Евросоюза, а также контрагенты (партнеры) с европейскими сотрудниками, данные которых вы можете получать в процессе работы над совместными проектами.

Разбираем вопросы обработки персональных данных при найме (рекрутинге) работников, заключении договоров с фрилансерами или бизнес-партнерами; мониторинге сотрудников на рабочем месте и дистанционно, в том числе через автоматические системы снятия данных.

Читать дальше →

+20

Durham Jun 2 2015 at 14:21

Автоматическая генерация осмысленных уникальных текстов

6 min

96K

Website development*Search engines*Semantics*Machine learning*MeanoTek corporate blog

Каждый веб-оптимизатор знает, что для того чтобы сайт любили поисковики, он должен содержать уникальные тексты. Причем не абы какие наборы слов, а осмысленные предложения, желательно по теме сайта. Особо это проблема для агрегаторов, которые берут информацию с других сайтов, и интернет-магазинов, где параметры и данные о товарах в целом одинаковые. Поэтому стандартная практика в этой ситуации — заказывать уникальные тексты копирайтерам. Стоимость такого удовольствия от 50 до 300 руб. за 1000 знаков. Если на вашем сайте 10000 страниц, то уникальные тексты быстро становятся значительной статьей расхода.

В этой статье поговорим методах алгоритмической генерации текстов и расскажем о нашем опыте работы с ними.

Читать дальше →

+21

AndyKy Feb 12 2019 at 11:01

Мечтают ли андроиды об электропанке? Как я учил нейросеть писать музыку

11 min

13K

Machine learning*ГК ЛАНИТ corporate blogArtificial Intelligence

На курсах по машинному обучению в Artezio я познакомился с учебной моделью, способной создавать музыку. Музыка – существенная часть моей жизни, я много лет играл в группах (панк-рок, регги, хип-хоп, рок и т. д.) и являюсь фанатичным слушателем.

К сожалению, многие группы, большим поклонником которых я был в юности, распались по разным причинам. Или не распались, но то, что они теперь записывают… в общем, лучше бы они распались.

Мне стало любопытно, существует ли сейчас готовая модель, способная обучиться на треках одной из моих любимых групп и создать похожие композиции. Раз у самих музыкантов уже не очень получается, может, нейросеть справится за них?

Источник

+81

kefiiir Feb 23 2017 at 13:57

Документирование #микросервисов

5 min

105K

Web services testing*

Оригинальная статья является размышления на тему почему документация в мире микросервисов критично необходима и как ее можно создавать и публиковать используя swagger. Пошаговой инструкцией по настройке она точно не является.

Читать дальше →

+11

kdenisk Dec 25 2018 at 11:40

Новогодний датасет 2018: открытая семантика русского языка

12 min

8.3K

Open data*Machine learning*Natural Language Processing*

Открытая семантика русского языка, об истории создания которой вы можете прочитать здесь и здесь, получила большое обновление. Мы собрали достаточное количество данных, чтобы применить поверх собранной разметки машинное обучение и построить семантическую модель языка. Что из этого получилось смотрите под катом.

Читать дальше →

+32

Irokez Aug 10 2011 at 00:28

Определение части речи слов в русском тексте (POS-tagging) на Python 3

9 min

94K

Python*Natural Language Processing*

Пусть, дано предложение “Съешьте еще этих мягких французских булок, да выпейте чаю.”, в котором нам нужно определить часть речи для каждого слова:

[('съешьте', 'глаг.'), ('еще', 'нареч.'), ('этих', 'местоим. прил.'), ('мягких', 'прил.'), ('французских', 'прил.'), ('булок', 'сущ.'), ('да', 'союз'), ('выпейте', 'глаг.'), ('чаю', 'сущ.')]

Зачем это нужно? Например, для автоматического определения тегов для блог-поста (для отбора существительных). Морфологическая разметка является одним из первых этапов компьютерного анализа текста.

Узнать, как это реализовать на Python 3

+80

Irokez Jul 20 2012 at 02:12

Парсим русский язык

8 min

70K

Algorithms*Natural Language Processing*

В прошлый раз (почти год назад) мы определяли части речи в русском тексте, производили морфологический анализ слов. В этой статье мы пойдем на уровень выше, к синтаксическому анализу целых предложений.

Наша цель заключается в создании парсера русского языка, т.е. программы, которая на вход бы принимала произвольный текст, а на выходе выдавала бы его синтаксическую структуру. Например, так:

"Мама мыла раму":

(предложение
    (именная гр. (сущ мама))
    (глаг. гр. (глаг мыла)
        (именная гр. (сущ раму)))
    (. .)))

Это называется синтаксическим деревом предложения. В графическом виде его можно представить следующим образом (в упрощенном виде):

Читать дальше →

+120

1 2 ...

17 18

GDPR: как работать с персональными данными ваших работников, фрилансеров и европейских сотрудников контрагентов

Автоматическая генерация осмысленных уникальных текстов

Мечтают ли андроиды об электропанке? Как я учил нейросеть писать музыку

Документирование #микросервисов

Новогодний датасет 2018: открытая семантика русского языка

Определение части речи слов в русском тексте (POS-tagging) на Python 3

Парсим русский язык

Information

Specialization