Pull to refresh

Comments 21

Извините, но как так получилось — публиковать статью почти в полночь в корпоративном блоге? :) Заставили?)
UFO just landed and posted this here

Какое чудило проектировало эту анкету? Половина на английском, половина на местном. У второго блока вопросы переведены на английский, ответы на местном. Зачем? Чтобы заполнять эту анкету, надо понимать её на двух языках.
Пункт "религия" вообще классный. На самом первом скане буквы в кружочках вообще не видны. Я так понимаю, они бледно-бледно серые? В тёмных хижинах бедняков их вообще не разглядеть, сотрудник заполняет по памяти. Кто-то неправильно запомнил — и получается радикальная ошибка в данных по участку.
Банальные вещи написаны на английском, в то время как сложные — на местном. Там английский знают лучше местного что-ли?

Форма была сделана так, чтобы её понимали участники переписи, сами переписчики, и софт который распознаёт только английский текст.

Для нашего софта при обработке фиксированной формы достаточно «ключевых» слов на английском, чтобы правильно определить секцию с ответами, а варианты подписанные под чекмарками, нужны только во время заполнения анкеты.

В Бангладеш, как в бывшей британской колонии, многие официальные документы дублируются на английском. Также английский используется в гос. учреждениях: https://en.wikipedia.org/wiki/English_in_Bangladesh и преподаётся в школах. Так что простые фразы понятны всем местным. Более сложные конструкции написаны на бангла – чтобы точно никто не запутался.

Буквы-подсказки в чекмарках бледно-розового цвета и исчезают после сканирования с color drop-out. Кроме пункта религии таким же образом сделаны поля дат (DD/MM/YY). Шифровка для религии простая (M- muslim, H – hindu, B- buddist, C- Christian, O- other) https://en.wikipedia.org/wiki/Religion_in_Bangladesh,
а переписчики обязательно проходят инструктаж/обучение по заполнению анкет.

Я о том и написал, может быть непонятно. Я не увидел "дублирования". Часть анкеты на одном языке, а другая часть — на другом. Это не дублирование, это каша. Для заполнения надо не "один из двух" языков, а оба. Обучение переписчиков — это, в принципе, необходимый костыль. Без него не обойтись, потому что слишком много вариантов. Но не стоит на него рассчитывать. Люди регулярно ошибаются даже в инструкциях типа "увидел лампочку — нажал кнопку", а уж какие там поля куда… Вот почему буквы, обозначающие религию, было не написать чёрными рядом с кружочком? Там дофига места. То же самое про тип сортира — почему его было не перевести на английский? Там тоже есть место под мелкий шрифт.
Софту вообще должно быть по диоду, на каком языке написаны статичные надписи в анкете. Софт реагирует по геометрическому расположению полей.

Ну или вот ещё. В статье пример заполнения имени "Мухаммед Абдур Рахман Иван". Мне сразу очевидно то, что когда переписчик будет это заполнять, ему надо заранее писать имя на отдельную бумажку и считать буквы. Иначе он поймёт, что "Иван" не влезает только тогда, когда начнёт писать "Рахман". А тогда уже поздно, и сократит переписчик именно "Рахман Иван", что, как я понял, типа фамилии и не должно сокращаться.
Если же вместо этого разбить поле ФИО на 2 — "Имя" и "что там у них", то количество букв, которое надо продумать, уменьшится. И переписчик сразу поймёт, надо ли сокращать имя или влезет всё.
Если думаете, что это просто, то вот прмер из жизни. У меня в паспорте написано: "выдан отд. в г. Бобруйске ОУФМС России по г. Козельску Мусохранской обл." Ни в одну анкету это не влезает, и я до сих пор не знаю, как это правильно сократить. Что в этой строке важное, а что можно догадаться.

UFO just landed and posted this here

Никакого отношения чтение свитков из Геркуланума ускорителем частиц к распознаванию не имеет.

UFO just landed and posted this here

Так реперы создаются для машиночитаемой зоны изначально. В случае со свитками распознавания нет в принципе не говоря уже о размеченной заранее зоне..

UFO just landed and posted this here
Мы автоматизировали с помощью ABBYY FlexiCapture 10 (с помощью него проходила перепись) поток внешних направление на лабораторные анализы (областное мед учреждение). С помощью автоматизации удалось увеличить поток в 2-3 раза. Причем, сделали это без особой поддержки ABBYY ибо очень дорого.
Вещь хорошая, но мед регистраторы в начале приняли идею в штыки, но теперь довольны.
Неужели не дешевле и надежнее было сделать опрос на google forms, чтобы анкетеры заполняли их прямо на смартфоне? В Бангладеш 99% 2g-покрытие и 10 млн смартфонов, не вижу никаких проблем с этим. Не понимаю, зачем в 2016-м году делать масштабные опросы на бумаге, а потом распознавать их.
Перепись проходила в 2011 году — в статье это упомянуто.
Ещё в некоторых странах по законодательству нужно хранить материалы переписей и любые другие документы с государственных проектов в бумажном виде (у любого электронного документа должен быть бумажный оригинал). Мы не знаем точно, но, возможно, в Бангладеш так же.
Тогда непонятно, зачем вы тут рассказываете про результаты пятилетней давности.
Судя по рейтингу поста, статья многим интересна. Если вам она показалась бесполезной — что ж, видимо, вы не наш читатель просто.
На последней фотографии увидел (и то не уверен) только одну девушку. В Бангладеш какие-то особенности для работы девушек в ИТ, в частности в монотонной обработке анкет? В соседней Индии девушки в ИТ секторе представлены очень даже широко на всех позициях.
Вот что мне рассказали в команде, которая делала проект:

«Гендерный вопрос что в Индии, что в Бангладеш, стоит очень остро (начиная с доступности образования, заканчивая личной безопасностью) — общества более патриархальные и традиционные, чем у нас. Религия тоже накладывает свои особенности.

>>В соседней Индии девушки в ИТ секторе представлены очень даже широко на всех позициях.

Далеко не на всех позициях и не во всех компаниях. В основном, в международных «гигантах» типа TCS, Wipro и филиалах иностранных компаний — там есть квоты на % девушек в коллективе. По своему опыту могу сказать, что в Индии на бизнес-встречах крайне редко присутствовали девушки, обычно они заняты в секторе BPO эникейщицами, секретарями или в административном персонале. И это в международных компаниях, а в SMB сегменте в ИТ практически нет девушек».

В общем, думаем, что на фото нет девушек именно из-за этих особенностей.

Если не секрет, то интересно, сколько платили верификаторам?

Боюсь, эту информацию партнёр нам не раскроет, сорри…
Sign up to leave a comment.