Алгоритм работы AGDataLoader

From TK
Jump to: navigation, search

DataLoader может загружать данные с AutoGRAPH Server всех версий. Для ускорения загрузки данных DataLoader может выполнять разбивать большой список приборов на блоки и отправлять запросы по ним параллельно.

Обратите внимание: если у DataLoader в каталоге данных отсутствуют данные по приборам - то они закачиваются (с даты указанной в .config-файле) до тех пор, пока не буду закачаны все. При большом количестве приборов это может привести к значительной загрузке канала связи и нагрузке на диск.

Задержка между запросами может быть задана как индивидуально для каждого сервера, так и как значение по умолчанию для всех серверов.

AutoGRAPH Server 3.x

DataLoader_AGServer3.png

Аутентификация на AGServer 3.x выполняется с помощью списка приборов (которые хранятся в .ATG-файлах) с их паролями в .ATG-файлах.
Алгоритм работы приведет на диаграмме слева. Задержка между запросами может быть задана индивидуально для каждого сервера.

AutoGRAPH Server 4.x/5.x

DataLoader_AGServer4.png

Аутентификация на AGServer 4.x/5.x выполняется с помощью логина и пароля пользователя. Для обеспечения безопасности пароль хранится не в открытом виде, а в виде хэша. Для корректной загрузки данных с AGServer 4.x/5.x необходимо скопировать файл UserSettings.ini из каталога пользователя (которым будет выполняется загрузка данных с сервера) в каталога DataLoader согласно правилу размещения файлов и переименовать UserSettings.ini в логин пользователя. Например, если UserSettings.ini взят у пользователя demo, то его необходимо переименовать в demo.ini - логин пользователя будет взят из имени файла, а хэш пароля для аутентификации - из файла (параметр PassHash).

Алгоритм работы приведет на диаграмме. Первый запрос при запуске сервиса выполняется для получения списка приборов (в отличие от AGServer 3.x не требуется держать актуальным список .ATG-файлов на хосте с DataLoader) и полученный список файлов используется для загрузки данных.

Многопоточная загрузка

Для ускорения загрузки данных может быть применена многопоточная загрузка данных.
Определяющим в данном случае являются два параметра -  batch-size  и  thread-count .
Первый параметр определяет количество приборов в одном запросе, второй - количество одновременных запросов.

DataLoader_MultiThreading.png

Диаграмма с примером работы приведена слева.

На данной диаграмме приведён пример, когда параметр batch-size=100 и thread-count=3. Все требуемые 563 прибора разбиваются на блоки по 100 приборов и каждые три таких блока запросов отправляются на требуемый AGServer одновременно (сначала будет отправлено три запроса по 100 приборов - приборы с 1-го по 300-й). Однако приборов больше, чем thread-count * batch-size, поэтому после завершения всех трёх запросов будет выполнен второй цикл, в котором будут отправлены также три одновременных запроса с тремя блоками, однако приборы там будут с 301-го по 563-й. После завершения и этих трёх запросов - цикл будет повторяться полностью до тех пор, пока все данные не будут закачаны.

Данный алгоритм применяется для серверов всех версий.

Внимание: большое количество thread-count (больше 10) не имеет смысла, т.к. будет создаваться повышенная нагрузка на удаленный AutoGRAPH Server, что приведёт к замедлению чтения данных с диска и вместо ускорения загрузки будет прямо противоположный эффект.

Внимание: большое количество batch-size (больше 500) не имеет смысла, т.к. специфика протокола обмена приведёт к тому, что сервер будет считывать все данные для всех запрошенных приборов в запросе, прежде чем начать отправку данных обратно на DataLoader.