Comments / Profile of Donskoy / Habr

How to become an author

Дмитрий Донцов @Donskoy

Пользователь

Profile Publications Comments 60Bookmarks 187

Как студенту-фрилансеру стать руководителем

Donskoy Aug 31 2011 at 15:11

Я поступал в ВУЗ в 17 лет. В голове был футбол, CS и Памела Андерсон.
Я не знал, чего хочу; просто понимал, что эта область мне нравится. Прошел год после окончания ВУЗа, и только сейчас я начал понимать, чего хочу.

К чему это всё… В 17-18 лет понимать, чего хочешь — это не про всех. Я бы не считал этот возраст сознательным.

+7

Определение части речи слов в русском тексте (POS-tagging) на Python 3

Donskoy Aug 10 2011 at 01:20

Можно еще обратить внимание на пока еще небольшой, но активно растущий открытый русскоязычный корпус opencorpora.org.

+6

Кластеризация. Алгоритм а-квазиэквивалентности

Donskoy Aug 9 2011 at 20:38

> Построим матрицу оценок расстояний между элементами

правильно ли я понимаю, что раз этот алгоритм строит матрицу расстояний между каждыми двумя элементами множества, то сложность такого алгоритма — квадратичная? Даже если сделать оптимизацию (матрица симметрична относительно диагонали), то получим (n^2)/2. Плюс вычислеие расстояния между объектами.
Такой алгоритм годится для относительно небольших данных (ну, скажем, до 50 000 объектов)

+2

Foxconn поставит на конвейер 1 млн роботов

Donskoy Jul 31 2011 at 23:37

И чтоб Робонука стала государственным праздником в Китае!

+3

Новый видеосервис Yota Play

Donskoy Jul 22 2011 at 01:20

Меня одного радует рекомендация (80%) посмотреть «12 обезьян» после «12 друзей Оушена» на первом скриншоте?

0

Как технологии распознавания текста помогают бороться с утечками данных

Donskoy Jun 22 2011 at 00:20

А мне понравилась маленькая элегантная ссылочка на вакансии в комментарии к коду.

+2

Точка, точка, запятая: машинное обучение

Donskoy Jan 20 2011 at 10:37

Вообще, деревья решений – один из самых быстрых алгоритмов. Должен справляться )
А если не хочется писать свою реализацию этого алгоритма, в opennlp, например, есть компонент Sentence Detector, использующий Maximum Entropy Model. Его можно обучить для русского языка.

sourceforge.net/apps/mediawiki/opennlp/index.php?title=Sentence_Detector

0

Гадание на информационном шуме

Donskoy Oct 2 2010 at 14:59

> Научив пакет автоматически распознавать настроение каждого твита о фильме (позитивное, нейтральное, негативное) с точностью 98%…

Достичь точности 98% в sentiment analysis, пускай и для очень ограниченной задачи — это уже огромное достижение.

0

Элементы стиля: UNIX как литература

Donskoy Sep 19 2010 at 16:15

> предположениями о том, как визализировать
визУализировать
Спасибо за хороший перевод

0

Никто ни хрена не знает, что он делает или Три типа знания

Donskoy Apr 1 2010 at 11:07

Не-не, его Сергей зовут =)

0

Никто ни хрена не знает, что он делает или Три типа знания

Donskoy Mar 4 2010 at 01:28

К слову добавлю высказывание отца одной моей знакомой (астрофизик, доктор наук):
«Знание некоторых принципов легко возмещает незнание некоторых фактов.»

В принципе очень даже соответствует посылу статьи.

+3

Научный поисковик от Вольфрама — запуск сегодня ночью!

Donskoy May 15 2009 at 20:49

Да-да, наконец-то закончу свою атомную бомбу

+4

На YouTube появится платный просмотр

Donskoy Apr 17 2009 at 18:11

Главное чтобы Ютуб.деньги не ввели )

+7

О выходе Small Basic 0.2

Donskoy Dec 22 2008 at 18:04

забавный инкубатор постпаскального поколения школьников =)
А как же синие окошки, зациклившиеся проги и прочие радости? )

+2

Lunar Baby Thermometer

Donskoy Nov 18 2008 at 00:33

Да, проще такой термометр встроить в гирю. И дитё никуда из-под нее не денется, и руку держать долго не надо

-1

У Google сейчас худшая экономическая ситуация

Donskoy Nov 13 2008 at 15:30

Я тоже давно хочу себе свой поисковичок, ага.
Вот, теперь к Гуглу присматриваюсь

+3

На Марсе нашли не только воду.

Donskoy Sep 5 2008 at 01:16

не, доставка подорожает

0

Распознавание паттернов в любом наборе данных

Donskoy Sep 4 2008 at 14:42

Почитал то, что они пишут у себя на сайте. Может, я плохо читал, но пока о самом Data Mining там ничего особо не пишут. Их система, как я понял, умеет приглядываться к неструктурированным текстам и определять структуру удобного представления/хранения данных из этих текстов. Про семантический анализ массачусетские прохвессоры пока молчат =)

0

Распознавание паттернов в любом наборе данных

Donskoy Sep 4 2008 at 14:35

Я так понял, что это целый комплекс, куда как отдельная подсистема входит система data mining?
Если так, то data mining, опирающийся на использование онтологий, автоматическое онтологическое моделирование и т.д. не будут развиваться так быстро, как хотелось бы. Пока нет инструментария для автоматического пополнения этих самых онтологий. Составить приемлемую таксономию для 100 понятий вручную еще можно. А если их на порядок-другой больше? =)

Но всё равно, по мне, так для построения механизма анализа и принятия решений такая технология по потенциалу превосходит голые нейронные сети.

0

Почему программистов не учат?

Donskoy Aug 16 2008 at 02:41

Суть даже не в знании/не знании математики. Привить будущему программисту культуру математического мышления — значит поставить его на рельсы, по которым он сам потом и поедет. Возьмите для примера студента с философского или биолого-почвенного факультета — и сразу будет понятно, чего ему не хватает для того, чтобы стать программером.

0

2