Pull to refresh
10
0
Илья Черепов @ICherepov

User

Send message

Всероссийская перепись населения: как тоссятся ваши данные

Reading time7 min
Views46K


Я работаю с распознаванием и обработкой данных переписей населения и сельскохозяйственных переписей с двухтысячного года. Это тот самый случай, когда ты больше года пишешь софт, который должен отработать один раз, но зато без ошибок.

Почему? Во всероссийской переписи населения в 2010 году участвовало 500 тысяч человек и ещё 10 тысяч IT-пользователей во всех субъектах РФ. Сканер забирает 150 листов в минуту. Распознавание в реальном времени с примерно такой же скоростью. Умножайте на количество сканеров по стране – и получите поток данных, где любой баг сразу рушит работу огромного количества людей.

И второй момент – вместе с НИИ Статистики мы ведём научно-исследовательскую работу по алгоритмам восстановления данных.
Читать дальше →
Total votes 77: ↑70 and ↓7+63
Comments109

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Registered
Activity