То есть речь идет а базе, где данные по клиентам увязаны с их адресами и идет массовая отправка почты на регулярной основе.
В той конторе, где я работаю, на "чистку" базы уходит много ручного руда, вот и подумалось, что наверняка уже есть какие-то наработки в этой сфере.
Интересно какой обычно выбор технологий для таких приложений, учитывая, что в день обрабатываются десятки тысяч записей... Ну или на худой конец насколько комбинация VB + MS SQL - оптимальна для такой задачи.
В базах такого плана неизбежны несоответствия адресов, потому что фирмы и люди каждый день перезжают, бизнесы раззоряются, происходят mergers и так далее. Плюс объективные ошибки за human factor (люди делают ошибки) + ошибка сканирования.
На данный момент программа автоматически сопоставляет вновь поступившие данные с уже существующими и где есть 100%-ый match адреса, сразу делается увязка по parent key с уже существующей в базе данных записью.
Оставшиеся данные обрабатываются операторами, при этом если не найдено аналогов в базе, в качестве parent key этой записи присваивается ее же собственное child key.
Работа оператора тоже немного автоматизирована, ибо он на сам просматривает всю базу, а программа ему уже подбирает подходящие записи, при этом проводя match по любым параметрам (имя, стрит адрес, город, штата, зип).
Учитывая качество работы программы
![Sad :(](./images/smilies/icon_sad.gif)
Как с этим борются в других местах? Не думаю, что все чиститься вручную.
Еще один вопрос: насколько трудно добавить в VB кнопку, которая могла бы прервать загрузку всего списка записей с аналогичным именем из базы данных для match с current record? Есть списки, которые грузятся минуты, а бывает с первого взгляда на запись можно понять куда ее приписать, то есть вообще нет необходимости просмотра этого списка . А приходится ждать пока весь список загрузится во вспомогательном окне и потом уже можно что-то сделать. Теряется львиная доля рабочего времени..
Спасибо,
Сабина