Я хочу предложить Вам свои услуги в одном деле… Назовем его "Обработка и связывание персонифицированных данных". Под такими данными будем понимать некоторую информацию, позволяющую как-то идентифицировать человека: фамилия, имя, отчество, дата рождения, адрес, телефон и т.д. За рубежом процесс автоматизированной обработки и сопоставления информации такого рода уже достаточно распространен, и для него существует специальный термин - Record Linkage. У нас - дело это сравнительно новое, и общепринятого названия для него еще не придумали. Возможные варианты таких ситуаций:
Суть такова: предположим, у вас есть компьютерная база данных, содержащая некоторую информацию о людях: клиентах, абонентах, заказчиках, подрядчиках, жильцах, пассажирах, больных, умерших, и т.п. - смотря чем Вы там занимаетесь. И в один прекрасный день Вы вдруг понимаете, что какую-то существенную для Вашей работы информацию об этих людях можно получить в какой-то другой базе данных, которая имеется у Вас же или в какой-то другой организации для решения собственных задач. Но тем не менее, там может содержаться и кто-то из Ваших клиентов, абонентов и пр., и можно почерпнуть оттуда какую-то существенную для Вас информацию. Даже само наличие (отсутствие) каких-то лиц одновременно в обеих этих базах данных может быть существенной информацией!
Предположим далее, Вы решите все "организационные проблемы" - то есть, договоритесь с коллегами об использовании их данных, или каком-то взаимообмене информацией. Дело за малым: как это реализовать технически. Некоторые скажут: "Это невозможно!" - и будут не правы. Возможно все, а с применением современных средств вычислительной техники это может оказаться намного проще, чем ручной поиск в картотеках. Другие скажут: "Это элементарно!". И тоже будут не правы. Ведь каждая из баз данных создана для решения собственных локальных задач. Задача связывания, поиска соответствий или расхождений может возникнуть спустя значительное время после окончания проектирования систем, по накоплении некоторого "начального капитала". Если исходные системы и содержат какие-то средства индивидуального поиска - то для "оптовых" операций они скорей всего не предусмотрены. А ведь есть еще множество ньюансов: различия в форматах и способах представления данных, в кодировках символов; русские\украинские\английские написания имен и адресов; возможные ошибки и опечатки операторов, в конце концов…
В общем, данные есть, а как их связать - не ясно… Вот в этом-то я и могу Вам помочь. За годы работы в Национальном канцер-регистре Украины мне пришлось заниматься решением множества проблем именнно такого рода. Когда-то для оценки эффективности проведеннного лечения приходилось писать письма-запросы и отправлять их в региональные картотеки, где информацию о каждом из пациентов искали на стеллажах. Уточнение информации по группе из нескольких десятков человек требовало кучи бумаг, усилий, месяцев переписки. Сегодня эта же работа выполняется у нас одним оператором, за пару часов, и для групп из десятков тысяч пациентов. Того же самого можете добиться и Вы. Если пройдете тот же путь, который я уже прошел: затратите то же время и усилия, наступите на те же грабли, изучите чужой опыт и накопите свой… Или же воспользуетесь моей помощью.
Я уже накопил преизрядный опыт в данном вопросе, имею собственные наработки, десятки успешно выполненных работ по связыванию данных - как разовый поиск, так и внедрение постоянно действующих технологий, работающих без моего дальнейшего присутствия. Я знаком с реально имеющимися в нашей стране данными, их качеством и связанными с этим проблемами: Я уверен, что многие проблемы могут быть решены с моей помощью, при чем намного проще, быстрее, эффективнее и в конце концов дешевле, чем без нее. Потому и пишу все это.
Я готов выполнить разовые работы (поиск и сопоставление двух массивов информации, поиск дублирующихся записей об одном и том же лице и т.п.), либо оказать помощь в наладке постоянно действующей технологии - в том числе и путем адаптации или доработки собственных программных средств, которые разрабатывал самостоятельно и правами на которые владею. Если у Вас есть необходимость в подобной работе - пишите по адресу: goroh@ucr.kiev.ua. Если Ваша задача укладывается в имеющиеся у меня наработки, то она может быть выполнена очень быстро. Если есть специфика - будем думать. В любом случае, обсуждение Ваших задач, оценка возможности их решения доступными мне методами, прикидка времени и затрат на выполнение работы - естественно, это бесплатно.
С уважением,
Горох Евгений Леонидович,
к.т.н., старший научный сотрудник
Национального канцер-регистра Украины.