Создание нового хранилища данных

Вид-подключения — мастер подключений

После этого выбрать тип источника(Deductor Warehouse)

Выбрать наименование БД, логин. Установить параметры базы разрешённых

После выбрать версию хранилища данных.

Надавить на кнопку

На последних шагах выбрать визуализатор для подключения, задать имя (латинскими буквами), описание и метку для нового хзранилища.

По окончании создания хранилища нужно спроектировать его структуру, т.к. в безлюдном хранилище нет объектов. Для этого существует редактор метаданных, которых вызывается кнопкой на вкладке «Подключения».

Для перехода в режим трансформаций – кнопка «Дать редактировать»

При помощи кнопки «Добавить» в редакторе в метаданные добавить метаданные. К примеру – Код группы с параметрами:

Итог – структрура метаданных:

К каждому измерению – добавить текстовые атрибуты

По окончании того, как все ссылки и измерения на измерения созданы, приступают к формированию процесса(кнопка +) и добавлению фактов:

Наполнение хранилища данных:

По окончании создания структуры ХД оно пусто, но имеет настроенный семантический слой. Оно готово к загрузке в него данных из внешних структурированных источников. Для этого нужно написать соответствующий сценарий, что обязан делать следующие функции:

1.Импорт данных в Deductor из БД, учетной совокупности либо предопределенных файлов.

2.Опциональная предобработка данных, к примеру, очистка либо преобразование формата.

3.Загрузка данных в процессы и измерения хранилища.

При создании сценария нужно строго придерживаться следующих правил:

1. Первыми загружаются все измерения, имеющие атрибуты. Лишь по окончании загрузки всех

измерений загружаются данные в процесс(ы).

2. Среди измерений кроме этого имеется правило на порядок загрузки: загружать измерения необходимо, начиная с самого верхнего уровня иерархии и спускаться по иерархии ниже. Это очень принципиально важно,в другом случае иерархия не будет создана.

3. Допускается не загружать раздельно измерения, не имеющие атрибутов и не пребывающие в иерархии измерений. Значения таких измерений возможно при применении особой опции создавать на протяжении загрузки в процесс.

Поясним второе правило (рисунок 2). Измерение Несколько находится выше измерения Товар, исходя из этого последовательность загрузки измерений будет следующая: Несколько, Товар.

Последовательно импортируем все 4 текстовых файла в Deductor в следующей последовательности: groups.txt, produces.txt, stores.txt, sales.txt. Пристально установите типы данных у полей Несколько.Код,Товар.Код, Отдел.Код, Час.Код – они должны быть целыми. В следствии возьмём сценарий, складывающийся из 4 узлов импорта (рисунок 3).

По окончании импорта возможно приступим к загрузке данных в ХД. Первыми следуют таблицы измерений, и лишь в конце – таблица процесса sales.txt. Поменять порядок веток сценария возможно при помощи кнопок CTRL+^ и CTRL+v.

Продемонстрируем последовательность загрузки данных в измерение опять на примере первого измерения Несколько.Код. Поднявшись для этого на первом узле, позовём Мастер экспорта. Из перечня типа приемников выберем Deductor Warehouse (рисунок 4).

На следующей вкладке из перечня дешёвых хранилищ укажем необходимое нам ХД называющиеся Фармация. Потом требуется указать, в какое как раз измерение будет загружаться информация. Это Несколько.Код (рис. 5)

Последнее, что осталось, это установить соответствие элементов объекта в хранилище данных с полями входного источника данных (т.е. таблицы groups.txt). При в то время, когда имена полей и метки в семантическом слое хранилища данных совпадают, делать ничего не требуется (рисунок 6)

Нажатие кнопки Пуск на следующем шаге загрузит в измерение эти. Наряду с этим «ветхие» эти, если они были, будут обновлены.

Проделав подобные действия еще для двух измерений – Отдел.Код, Товар.Код, возьмём следующий сценарий (рисунок 7).

Загрузка измерений на этом заканчивается, не обращая внимания на то что еще остались два измерения Час и Дата. Но они без атрибутов и не участвуют в иерархии, исходя из этого их значения возможно загрузить на этапе экспорта в процесс.

Сейчас, в то время, когда все измерения загружены (т.е. выяснены все координаты в многомерном пространстве), возможно загружать данные в процесс Продажи.

Сохраните файл сценария под именем load.ded в той же папке, где находятся текстовые файлы таблиц.

В следствии всех вышеописанных действий будет:

создано и наполнено хранилище данных;
создан сценарий загрузки информации из источников в ХД;
продуман контроль непротиворечивости данных при пополнении ХД.

Обратим внимание на то, что сценарий загрузки не привязан конкретно к данным. Он привязан к их структуре, т.е. в нем смоделирована последовательность действий, каковые необходимо выполнить для

загрузки информации в ХД: имена файлов-источников, соответствие полей и т.д. Один раз созданный сценарий потом употребляется повторно для пополнения хранилища данных. Для этого необходимо выгрузить новую данные о измерениях и продажах в текстовые файлы.

Кубы данных

Куб – заблаговременно подготовленный срез из ХД для обеспечения стремительного доступа к ним. Применение кубов оправдано при, в то время, когда необходимо добиться высокой скорости получения ответа на непростой вопрос из хранилища.

Любой куб по сути представляет собой дополнительную таблицу в хранилище данных. Эта таблица формируется в момент загрузки новых данных в ХД(к примеру, с таблицами измерений).

Куб создается в редакторе метаданных подобно созданию нового процесса в хранилище. К примеру, создадим куб «Продажи за последние 3 дня» в хранилище Фармация. В редакторе метаданных поднимемся на объект «Кубы» и надавим кнопку«Добавить».

Покажется окно выбора объектов ХД.

Выберем процесс «Продажи» и надавим «Потом». На следующей вкладке поставим знамёна наоборот измерений Дата, Отдел.Код, Товар.Код, Несколько.Код, Час и фактов Количество, Сумма. На третьей вкладке для измерения Дата зададим срез «последний ..3 от имеющихся данных»

Движение работы:

1.Создать структуру ХД в соответствии с варианту(вариантом есть тематика дипломного проекта)

2.Создать новое хранилище

3.Создать семантический слой

4.Наполнить хранилище данными

5.Создать пара кубов данных

6.Проанализировать результаты работы

Создание нового хранилища данных

Удивительные статьи:

Похожие статьи, которые вам понравятся: