Articles / Bookmarks / Profile of Alexey2005 / Habr

@Alexey2005

Пользователь

Profile Publications 5Comments 5KBookmarks 226

alizar Apr 10 2011 at 00:44

Принцип цикады и почему он важен для веб-дизайнеров

6 min

229K

CSS*

Translation

Пару лет назад я прочитал интересные факты о жизненном цикле периодических цикад. Обычно мы не видим вокруг себя много этих насекомых, потому что бóльшую часть своей жизни они проводят под землёй и тихо сосут корни растений.

Однако, в зависимости от вида, каждые 7, 11, 13 или 17 лет периодические цикады одновременно массово вылезают на свет и превращаются в шумных летающих тварей, спариваются и вскоре умирают.

Хотя наши странные цикады весело уходят в иной мир, возникает очевидный вопрос: это просто случайность, или числа 7, 11, 13 и 17 какие-то особенные?

Читать дальше →

+668

119

ssbb Aug 5 2012 at 23:44

Декодирование капчи на Python

12 min

79K

Python*Algorithms*

Translation

Это перевод и форма повествования от первого лица сохранена. Автор — Бен Бойтер, бакалавр информационных технологий в Университете Чарльза Стерта (CSU).

Большинство людей не в курсе, но моей диссертацией была программа для чтения текста с изображения. Я думал, что, если смогу получить высокий уровень распознавания, то это можно будет использовать для улучшения результатов поиска. Мой отличный советник доктор Гао Джунбин предложил мне написать диссертацию на эту тему. Наконец-то я нашел время написать эту статью и здесь я постараюсь рассказать о всем том, что узнал. Если бы только было что-то подобное, когда я только начинал…

Как я уже говорил, я пытался взять обычные изображения из интернета и извлекать из них текст для улучшения результатов поиска. Большинство моих идей было основано на методах взлома капчи. Как всем известно, капча — это те самые всех раздражающее штуки, вроде «Введите буквы, которые вы видите на изображении» на страницах регистрации или обратной связи.

Капча устроена так, что человек может прочитать текст без труда, в то время, как машина — нет (привет, reCaptcha!). На практике это никогда не работало, т. к. почти каждую капчу, которую размещали на сайте взламывали в течение нескольких месяцев.

У меня неплохо получалось — более 60% изображений было успешно разгадано из моей небольшой коллекции. Довольно неплохо, учитывая количество разнообразных изображений в интернете.

Читать дальше →

+54

Pastafarianist Jun 30 2012 at 02:02

Экспорт избранного Хабра в FB2

2 min

9.3K

Python*

Ненавижу длинные вступления

И поэтому не буду писать их даже под спойлером.

Зачем?
- Для оффлайнового просмотра на читалках.
Моя читалка не поддерживает FB2!
- Универсальный конвертор
Хочу!
1. Обзаводимся Python 2.7+. Тестировалось на Python 2.7.3.
2. Ставим библиотеку BeautifulSoup 4. Вкратце варианты:
  - apt-get install python-beautifulsoup4
  - easy_install beautifulsoup4
  - pip install beautifulsoup4
  - Исходники и python setup.py install
3. Качаем код из репозитория (прямая ссылка на последнюю версию).
4. Открываем файл habrafav.py и в строке username = ... прописываем свой логин.
5. python habrafav.py (или просто habrafav.py под Windows)
6. Ждём. У меня с кэшированными данными экспорт ~150 статей занимает около 6 минут и 600 Мб оперативной памяти.
7. Забираем habrahabr_favorites.fb2. Мой занимает примерно 62 Мб.

Читать дальше →

+74

vermilion1 Jun 30 2012 at 12:48

Yeoman.io

3 min

19K

Website development*JavaScript*HTML*

На конференции Google I/O 2012 во второй части своего выступления Paul Irish представил проект yeoman.io. Главной целью которого является собрать для разработчика лучшие библиотеки и фреймворки в одном месте и создать идеальную среду для разработки за кратчайшее время.

Читать дальше →

+30

1 2 ...

9 10