Точность в каждой детали
Закажите по телефону:
Закажите по телефону +7 (4872) 35-47-18
Компрессорая станция в поселке Приводино (Тверская область)

Новости




В пенсионном фонде реализован проект по массовой

обработке сведений о населении.

Пенсионным фондом россии (пфр) совместно с крупнейшим

проектным интегратором - компанией cognitive technologies

разработана и введена в промышленную эксплуатацию

автоматизированная система массовой обработки анкет

застрахованного лица.

Ни для кого не секрет, что для решения множества

проблем, связанных с защитой трудовых и пенсионных прав

каждого гражданина, а как следствие, с размером и

своевременностью выплаты пенсий, необходим целый ряд

кардинальных действий. Для обеспечения соблюдения

действующего законодательства, создания мотивации к полной

уплате страховых, пенсионных взносов, а также налаживанию

контроля за правильным назначением пенсий и учетом трудового

вклада граждан существует механизм персонифицированного

(индивидуального) учета. (Федеральный закон "об

индивидуальном (персонифицированном) учете в системе

государственного пенсионного страхования" вступил в силу с

1.01.97 г. На всей территории рф.) С целью реализации этого

механизма пфр была разработана система индивидуального, или

персонифицированного, учета (спу) данных о населении.

Наличие подобной системы позволило бы государству сэкономить

значительные суммы, так сегодня необходимые для решения

социальных проблем пенсионеров. С другой стороны, введение

спу предоставляет уникальные возможности как предприятиям,

так и всем гражданам по получению и передаче необходимой

информации. К примеру, каждый гражданин может проверить

размер суммы на личном счете, а предприятия получают

возможность автоматически отправлять данные о зарплате

сотрудников.

Для создания и функционирования спу была создана база

данных (бд), в которую работодатели представляют анкетные

данные. Анкеты заполняются каждым человеком от руки (этот

процесс, наверное, знаком каждому читателю) либо на печатной

машинке или магнитных носителях и включают: ф.И.О., Пол,

дату и место рождения, а также прочие реквизиты. После

проверки в консультационном пункте анкеты поступают в

управление информационных технологий, в отдел обработки

информации, для ввода в бд спу.

Таким образом, можно представить, какой объем бумажных

документов должен обрабатываться в спу! только по г. Москве

число анкет исчисляется миллионами. Кроме того, информация

представляемая предприятиями, периодически должна

обновляться.

Например, введение автоматизированной системы

обработки документов позволяет снизить затраты в 4-5 раз. По

этой причине пфр принял решение по созданию подобного

комплекса. Система позволяет автоматически вводить большие

объемы анкет, распознавать их, контролировать равномерность

процесса распределения документов между операторами,

осуществлять контроль ошибок и т.Д.

Первая стадия проекта была реализована отделением пфр

по г. Москве. Были изучены системы различных фирм,

рассмотрены представленные коммерческие предложения и для

начала работ выбрана фирма cognitive technologies как

имеющая наиболее серьезные разработки в этой области и опыт

практического внедрения больших систем.

В результате была создана система потоковой обработки

стандартизированных форм на базе использования элементов

скоростного сканирования и технологий по автоматическому

распознаванию (рукопечатное, стилизованное и отметок), вводу

и редактированию распознанных данных из форм. Система

позволяет вводить до 50 тыс. Анкет в день.

В зависимости от объема вводимой информации можно

использовать любое количество компьютеров в сети, варьируя

число рабочих мест сканирования, распознавания,

редактирования и экспорта в спу для достижения максимальной

производительности ввода.

Функциональное взаимодействие модулей системы

происходит в следующем режиме.

На первом этапе оператор подготавливает пачки анкет к

потоковому сканированию - проводит разброшюровку,

выравнивание и укладку пачек документов в автоподатчик

сканера. Задание идентификационных номеров пачек при этом

производится автоматически. Затем осуществляется запуск

режима потокового сканирования пачек при последующем

проведении визуального контроля процесса сканирования на

экране монитора. При этом изображения документов сохраняются

в выделенной директории на сервере.

Модуль распознавания автоматически проверяет наличие

изображений описи пачки и анкет во входной директории,

распознает их (параметры распознавания задаются в модуле

установки параметров системы), проводит контекстный контроль

правильности распознавания и сохраняет распознанные страницы

в выходной директории.

Распознанные страницы сохраняются в формате модуля

редактирования для контроля оператором. Признаки

сомнительности устанавливаются для каждого поля внутри

анкеты для модуля редактирования.

При обнаружении ошибочно распознанных анкет пачка

помечается как "ошибочная" и помещается в специальную

директорию для дальнейшей обработки.

Большим достоинством системы является то, что она

распознает сразу весь бланк целиком, а не отдельные его

элементы (поля). Это позволяет избежать ошибок при

сканировании.

После распознавания каждый документ проходит стадию

словарной обработки. Подключение словарно-справочного модуля

позволяет значительно снизить вероятность ошибки.

В модуле редактирования отсканированные образы описи и

распознанные анкеты представлены в виде последовательного

списка всех введенных документов. Для каждой анкеты

показывается признак сомнительности по 2-балльной шкале

(отлично/сомнительно). Оператор имеет возможность

постраничного просмотра всех полей и редактирования анкет

(всех или только сомнительных).

Во время редактирования распознанный текст в полях

редактируемой формы находится в соответствии с графическим

изображением оригинального документа. Неправильно

распознанные или сомнительные с точки зрения системы поля

анкеты подсвечиваются для оператора после контекстного

контроля качества распознавания. Оператор перемещает курсор

по подсвеченным полям и проводит сравнение с изображением

страницы для исправления ошибок. Это избавляет от

необходимости обращаться к бумажному оригиналу и повышает

производительность труда при одновременном снижении

утомляемости оператора. Разработчики потратили достаточно

усилий, чтобы система была эргономичной. Достаточно сказать,

что вся работа оператора сведена к нажатию клавиш "да" или

"нет".

Отредактировав анкету, оператор переходит к следующей

анкете до тех пор, пока не будут отредактированы все

поступившие из модуля распознавания анкеты.

Ошибочные анкеты помещаются в специальный буфер для

дальнейшей обработки. В модуле редактирования после

окончания редактирования очередной пачки анкет запускается

режим работы конвертора - сеанс подготовки файла в нужную

структуру для экспорта в бд спу.

В случае возникновения ошибок после диагностики

содержание сообщений для оператора однозначно указывает на

причину ошибок и подсказывает оператору способы их

преодоления.

Модуль диспетчирования предназначен для обеспечения

равномерного распределения потока обрабатываемых документов

между станциями распознавания и редактирования.

Модуль статистики предназначен для осуществления

запроса по статистическим файлам с целью сбора информации об

обработанных (отредактированных) материалах (анкетах).

Статистические файлы формируются в ходе работы программ

распознавания и редактирования. Каждая запись в

статистическом файле содержит информацию об определенной

пачке анкет, процессе обработки, времени начала и конца

процесса и его результатах, операторе редактора. Для каждого

рабочего места заводится свой локальный (собственный) файл.

Для осуществления запроса необходимо создать отдельную папку

для статистических файлов, куда следует скопировать все

локальные файлы. Перед началом обработки папки

статистических файлов следует удалить из нее все файлы,

кроме статистических.

Заметим, что присутствие персонала требуется лишь на

двух этапах работы системы. Остальные операции выполняются

автоматически.

По результатам приемо-сдаточных испытаний системы

необходимо отметить следующие показатели:

производительность сканирования (скорость ска-

нирования одной анкеты) - 0,45 с (производительность

сканера - 4000 - 7500 анкет в час);

скорость записи одной анкеты на диск по сети - 0,1 с;

при этом поток пачек анкет, поступающих на обработку,

обладает некоторой неоднородностью, в том числе:

бланки анкет изготовлены в нескольких типографиях и

различаются между собой как геометрическими размерами, так и

насыщенностью серого цвета фона разграфки. Часть бланков

представляет собой ксерокопии;

насыщенность серого фона анкеты в пределах одной пачки

колеблется от 10 до 30% (в то время как для сканирования и

распознавания наиболее оптимальным является плотность серого

цвета от 5 до 10% для получения лучших характеристик

распознавания);

ряд анкет заполнен серыми чернилами.

Проведенные исследования позволяют сделать следующие

выводы:

производительность операторов по вводу анкет возросла,

как минимум, в 4 раза (при двухсменной работе цепочки

сканирования и распознавания);

себестоимость работ по вводу анкет уменьшилась в 4,7

раза;

система сканирования и распознавания может быть также

использована для ввода и обработки других документов системы

персонифицированного учета, в том числе индивидуальных

сведений о стаже и заработке.

Следует отметить, что данная система является одной из

немногих, которая доведена до стадии промышленной

эксплуатации. Установленная в пфр технология является

универсальной и масштабируемой с точки зрения ее дальнейшего

использования в региональных отделениях пфр. Более того,

система может быть преобразована для использования в других

структурах, связанных с массовой обработкой стандартных форм

документов, таких, как налоговая инспекция, таможенный

комитет, страховые компании и т. Д.

Схема движения информационных потоков

в системе массового ввода анкет спу

в. Калинин,

начальник отдела управления информационных

технологий по г. Москве