CREATE MATERIALIZED VIEW
Содержание раздела
Запрос позволяет создать материализованное представление в логической базе данных. Материализованное представление может содержать результаты запроса к данным одной или нескольких логических таблиц.
Данные представлений можно размещать в ADG и (или) ADQM. Источником данных для представлений служит ADB.
В ответе возвращается:
- пустой объект ResultSet при успешном выполнении запроса;
- исключение при неуспешном выполнении запроса.
При успешном выполнении запроса система создает материализованное представление, а также подготавливает хранилище к размещению данных представления — создает физические таблицы, связанные с материализованным представлением и предназначенные для хранения его данных. Физические таблицы создаются в тех СУБД хранилища, которые указаны в запросе.
В отличие от запроса на создание логической таблицы, запрос CREATE MATERIALIZED VIEW
должен содержать ключевое слово DATASOURCE_TYPE со списком СУБД для размещения данных представления. Требование связано с тем, что данные представлений (в отличие от данных логических таблиц) могут размещаться только в ADG и ADQM, а не во всех СУБД хранилища.
Созданное представление начинает синхронизироваться в первом цикле синхронизации, доступном после создания представления, в порядке очереди. Статус синхронизации можно узнать с помощью запроса CHECK_MATERIALIZED_VIEW. Подробнее о синхронизации см. в разделе Синхронизация материализованных представлений.
Изменение материализованного представления недоступно. Для замены материализованного представления необходимо удалить его и создать новое.
Если при обработке запроса произошла ошибка, изменение сущностей логической базы данных становится недоступно. В этом случае нужно выполнить запрос ERASE_CHANGE_OPERATION.
Каждое создание представления записывается в журнал. Журнал можно посмотреть с помощью запроса GET_CHANGES.
Синтаксис
CREATE MATERIALIZED VIEW [db_name.]materialized_view_name (
column_name_1 datatype_1 [ NULL | NOT NULL ],
column_name_2 datatype_2 [ NULL | NOT NULL ],
column_name_3 datatype_3 [ NULL | NOT NULL ],
PRIMARY KEY (column_list_1)
) DISTRIBUTED BY (column_list_2)
DATASOURCE_TYPE (datasource_aliases)
AS SELECT query
DATASOURCE_TYPE = origin_datasource_alias
[LOGICAL_ONLY]
Параметры:
db_name
-
Имя логической базы данных, в которой создается материализованное представление. Опционально, если выбрана логическая БД, используемая по умолчанию.
materialized_view_name
-
Имя создаваемого материализованного представления, уникальное среди логических сущностей логической БД.
column_name_N
-
Имя столбца представления.
datatype_N
-
Тип данных столбца
column_name_N
. Возможные значения см. в разделе Логические типы данных. column_list_1
-
Список столбцов, входящих в первичный ключ представления.
column_list_2
-
Список столбцов, входящих в ключ шардирования представления. Столбцы должны быть из числа столбцов
column_list_1
. datasource_aliases
-
Список псевдонимов СУБД хранилища, в которых нужно разместить данные представления. Элементы списка перечисляются через запятую. Возможные значения:
adqm
,adg
. Значения можно указывать без кавычек (например,adg
) или двойных кавычках (например,"adg"
). query
-
SELECT-подзапрос, на основе которого строится представление.
origin_datasource_alias
-
Псевдоним СУБД, которая служит источником данных. Возможные значения:
'adb'
. Значение указывается в одинарных кавычках.
Ключевое слово DATASOURCE_TYPE
Ключевое слово DATASOURCE_TYPE
позволяет указать СУБД хранилища, в которых необходимо размещать данные материализованного представления. В текущей версии данные представления могут размещаться в ADG и (или) в ADQM.
Ключевое слово LOGICAL_ONLY
Ключевое слово LOGICAL_ONLY
позволяет создать материализованное представление только на логическом уровне (в логической схеме данных), без пересоздания связанных физических таблиц в хранилище данных.
Если ключевое слово не указано, создается как материализованное представление, так и связанные с ним физические таблицы.
Ограничения
- Выполнение запроса недоступно при наличии любого из факторов:
- горячей дельты,
- незавершенного запроса на создание, удаление или изменение таблицы или представления,
- запрета на изменение сущностей (см. раздел DENY_CHANGES).
- Выполнение запроса недоступно в сервисной базе данных
INFORMATION_SCHEMA
. - Имена представления и его столбцов не могут быть из числа зарезервированных слов и должны начинаться с латинской буквы. После первого символа могут следовать латинские буквы, цифры и символы подчеркивания в любом порядке.
- Столбцы также не могут иметь имена, зарезервированные системой для служебного использования:
sys_op
,sys_from
,sys_to
,sys_close_date
,bucket_id
,sign
. - Имена столбцов должны быть уникальны в рамках представления.
- Имена, порядок и типы данных столбцов должны совпадать в SELECT-подзапросе и представлении.
- Первичный ключ должен включать все столбцы ключа шардирования.
- Логические таблицы, указанные в SELECT-подзапросе, должны принадлежать той же логической базе данных, что и материализованное представление.
- Подзапрос не может содержать:
- ключевое слово FOR SYSTEM_TIME,
- ключевое слово
ORDER BY
, - ключевое слово
LIMIT
.
Примеры
Представление на основе одной таблицы с условием
Создание представления с размещением в ADG и ADQM:
CREATE MATERIALIZED VIEW marketing.sales_december_2020 (
id INT NOT NULL,
transaction_date TIMESTAMP NOT NULL,
product_code VARCHAR(256) NOT NULL,
product_units INT NOT NULL,
store_id INT NOT NULL,
description VARCHAR(256),
PRIMARY KEY (id)
)
DISTRIBUTED BY (id)
DATASOURCE_TYPE (adg, adqm)
AS SELECT * FROM marketing.sales
WHERE cast(transaction_date as date) BETWEEN '2020-12-01' AND '2020-12-31'
DATASOURCE_TYPE = 'adb'
Представление на основе одной таблицы с условием, агрегацией и группировкой
Создание представления с размещением в ADQM:
CREATE MATERIALIZED VIEW marketing.sales_by_stores (
store_id INT NOT NULL,
product_code VARCHAR(256) NOT NULL,
product_units INT NOT NULL,
PRIMARY KEY (store_id, product_code)
)
DISTRIBUTED BY (store_id)
DATASOURCE_TYPE (adqm)
AS SELECT store_id, product_code, SUM(product_units) as product_units FROM marketing.sales
WHERE product_code <> 'ABC0001'
GROUP BY store_id, product_code
DATASOURCE_TYPE = 'adb'
Представление на основе двух таблиц
CREATE MATERIALIZED VIEW marketing.sales_and_stores (
id INT NOT NULL,
transaction_date TIMESTAMP NOT NULL,
product_code VARCHAR(256) NOT NULL,
product_units INT NOT NULL,
description VARCHAR(256),
store_id INT NOT NULL,
store_category VARCHAR(256) NOT NULL,
region VARCHAR(256) NOT NULL,
PRIMARY KEY (id, region)
)
DISTRIBUTED BY (id)
DATASOURCE_TYPE (adg)
AS SELECT
s.id, s.transaction_date, s.product_code, s.product_units, s.description,
st.id AS store_id, st.category as store_category, st.region
FROM marketing.sales AS s
JOIN marketing.stores AS st
ON s.store_id = st.id
DATASOURCE_TYPE = 'adb'
Представление только на логическом уровне
CREATE MATERIALIZED VIEW marketing.stores_by_sold_products_matview (
store_id INT NOT NULL,
product_amount INT NOT NULL,
PRIMARY KEY (store_id)
)
DISTRIBUTED BY (store_id)
DATASOURCE_TYPE (adg)
AS SELECT store_id, SUM(product_units) AS product_amount
FROM marketing.sales
GROUP BY store_id
DATASOURCE_TYPE = 'adb'
LOGICAL_ONLY