CREATE MATERIALIZED VIEW
Содержание раздела
Запрос позволяет создать материализованное представление в логической базе данных.
Материализованные представления можно создавать на основе данных ADB. Данные представлений могут размещаться в ADG и (или) ADQM.
В ответе возвращается:
- пустой объект ResultSet при успешном выполнении запроса;
- исключение при неуспешном выполнении запроса.
При успешном выполнении запроса система создает материализованное представление, а также подготавливает хранилище к размещению данных представления — создает физические таблицы, связанные с материализованным представлением и предназначенные для хранения его данных. Физические таблицы создаются в тех СУБД хранилища, которые указаны в запросе.
В отличие от запроса на создание логической таблицы, запрос CREATE MATERIALIZED VIEW
должен содержать ключевое слово DATASOURCE_TYPE со списком СУБД для размещения данных представления. Требование связано с тем, что данные представлений (в отличие от данных логических таблиц) могут размещаться только в ADG и ADQM, а не во всех СУБД хранилища.
Синхронизация нового представления запускается в первом цикле синхронизации, доступном после создания представления, в порядке очереди (если такая есть). Статус синхронизации представления можно узнать с помощью запроса CHECK_MATERIALIZED_VIEW. Подробнее о синхронизации см. в разделе Синхронизация материализованных представлений.
Изменение материализованного представления недоступно. Для замены материализованного представления необходимо удалить его и создать новое.
Если при обработке запроса происходит ошибка, последующее изменение сущностей логической базы данных невозможно. В этом случае нужно повторить запрос. Действие перезапустит обработку запроса, и после ее завершения можно будет продолжить работу с логической БД.
Каждое создание представления записывается в журнал. Журнал можно посмотреть с помощью запроса GET_CHANGES.
Синтаксис
CREATE MATERIALIZED VIEW [db_name.]materialized_view_name (
column_name_1 datatype_1 NOT NULL,
column_name_2 datatype_2 DEFAULT default_value_2,
column_name_3 datatype_3,
PRIMARY KEY (column_list_1)
) DISTRIBUTED BY (column_list_2)
DATASOURCE_TYPE (datasource_aliases)
AS SELECT query
DATASOURCE_TYPE = origin_datasource_alias
[LOGICAL_ONLY]
Параметры:
db_name
— имя логической базы данных, в которой создается материализованное представление. Опционально, если выбрана логическая БД, используемая по умолчанию;materialized_view_name
— имя создаваемого материализованного представления, уникальное среди логических сущностей логической БД;column_name_N
— имя столбца представления;datatype_N
— тип данных столбцаcolumn_name_N
. Возможные значения см. в разделе Логические типы данных;default_value_N
— значение столбцаcolumn_name_N
по умолчанию;column_list_1
— список столбцов, входящих в первичный ключ представления;column_list_2
— список столбцов, входящих в ключ шардирования представления. Столбцы должны быть из числа столбцовcolumn_list_1
;datasource_aliases
— список псевдонимов СУБД хранилища, в которых нужно разместить данные представления. Элементы списка перечисляются через запятую. Возможные значения:adqm
,adg
. Значения можно указывать без кавычек (например,adg
) или двойных кавычках (например,"adg"
);query
— SELECT-подзапрос, на основе которого строится представление;origin_datasource_alias
— псевдоним СУБД, которая служит источником данных. Возможные значения:'adb'
. Значение указывается в одинарных кавычках.
Ключевое слово DATASOURCE_TYPE
Ключевое слово DATASOURCE_TYPE
позволяет указать СУБД хранилища, в которых необходимо размещать данные материализованного представления. В текущей версии данные представления могут размещаться в ADG и (или) в ADQM.
Ключевое слово LOGICAL_ONLY
Ключевое слово LOGICAL_ONLY
позволяет создать материализованное представление только на логическом уровне (в логической схеме данных), без пересоздания связанных физических таблиц в хранилище данных.
Если ключевое слово не указано, создается как материализованное представление, так и связанные с ним физические таблицы.
Ограничения
- Выполнение запроса недоступно при наличии любого из факторов:
- горячей дельты,
- незавершенного запроса на создание, удаление или изменение таблицы или представления,
- запрета на изменение сущностей (см. раздел DENY_CHANGES).
- Выполнение запроса недоступно в сервисной базе данных
INFORMATION_SCHEMA
. - Имена столбцов должны быть уникальны в рамках представления.
- Столбцы не могут иметь имена, зарезервированные для служебного использования:
sys_op
,sys_from
,sys_to
,sys_close_date
,bucket_id
,sign
. - Имена, порядок и типы данных столбцов должны совпадать в SELECT-подзапросе и представлении.
- Первичный ключ должен включать все столбцы ключа шардирования.
- Подзапрос может обращаться только к логическим таблицам и только той логической базы данных, в которой находится материализованное представление.
- Подзапрос не может содержать:
- ключевое слово FOR SYSTEM_TIME,
- ключевое слово
ORDER BY
.
Примеры
Создание представления на основе одной таблицы с условием
Создание представления с размещением в ADG и ADQM:
CREATE MATERIALIZED VIEW sales.sales_december_2020 (
id INT NOT NULL,
transaction_date TIMESTAMP NOT NULL,
product_code VARCHAR(256) NOT NULL,
product_units INT NOT NULL,
store_id INT NOT NULL,
description VARCHAR(256),
PRIMARY KEY (id)
)
DISTRIBUTED BY (id)
DATASOURCE_TYPE (adg, adqm)
AS SELECT * FROM sales.sales
WHERE cast(transaction_date as date) BETWEEN '2020-12-01' AND '2020-12-31'
DATASOURCE_TYPE = 'adb'
Создание представления на основе одной таблицы с условием, агрегацией и группировкой
Создание представления с размещением в ADQM:
CREATE MATERIALIZED VIEW sales.sales_by_stores (
store_id INT NOT NULL,
product_code VARCHAR(256) NOT NULL,
product_units INT NOT NULL,
PRIMARY KEY (store_id, product_code)
)
DISTRIBUTED BY (store_id)
DATASOURCE_TYPE (adqm)
AS SELECT store_id, product_code, SUM(product_units) as product_units FROM sales.sales
WHERE product_code <> 'ABC0001'
GROUP BY store_id, product_code
DATASOURCE_TYPE = 'adb'
Создание представления на основе двух таблиц
CREATE MATERIALIZED VIEW sales.sales_and_stores (
id INT NOT NULL,
transaction_date TIMESTAMP NOT NULL,
product_code VARCHAR(256) NOT NULL,
product_units INT NOT NULL,
description VARCHAR(256),
store_id INT NOT NULL,
store_category VARCHAR(256) NOT NULL,
region VARCHAR(256) NOT NULL,
PRIMARY KEY (id, region)
)
DISTRIBUTED BY (id)
DATASOURCE_TYPE (adg)
AS SELECT
s.id, s.transaction_date, s.product_code, s.product_units, s.description,
st.id AS store_id, st.category as store_category, st.region
FROM sales.sales AS s
JOIN sales.stores AS st
ON s.store_id = st.id
DATASOURCE_TYPE = 'adb'
Создание представления только на логическом уровне
CREATE MATERIALIZED VIEW sales.stores_by_sold_products_matview (
store_id INT NOT NULL,
product_amount INT NOT NULL,
PRIMARY KEY (store_id)
)
DISTRIBUTED BY (store_id)
DATASOURCE_TYPE (adg)
AS SELECT store_id, SUM(product_units) AS product_amount
FROM sales.sales
GROUP BY store_id
DATASOURCE_TYPE = 'adb'
LOGICAL_ONLY