Link Search Menu Expand Document

CREATE MATERIALIZED VIEW

Содержание раздела
  1. Синтаксис
    1. Ключевое слово DATASOURCE_TYPE
    2. Ключевое слово LOGICAL_ONLY
  2. Ограничения
  3. Примеры
    1. Создание представления на основе одной таблицы с условием
    2. Создание представления на основе одной таблицы с условием, агрегацией и группировкой
    3. Создание представления на основе двух таблиц
    4. Создание представления только на логическом уровне

Запрос позволяет создать материализованное представление в логической базе данных.

Материализованные представления можно создавать на основе данных ADB. Данные представлений могут размещаться в ADG и (или) ADQM.

В ответе возвращается:

  • пустой объект ResultSet при успешном выполнении запроса;
  • исключение при неуспешном выполнении запроса.

При успешном выполнении запроса система создает материализованное представление, а также подготавливает хранилище к размещению данных представления — создает физические таблицы, связанные с материализованным представлением и предназначенные для хранения его данных. Физические таблицы создаются в тех СУБД хранилища, которые указаны в запросе.

В отличие от запроса на создание логической таблицы, запрос CREATE MATERIALIZED VIEW должен содержать ключевое слово DATASOURCE_TYPE со списком СУБД для размещения данных представления. Требование связано с тем, что данные представлений (в отличие от данных логических таблиц) могут размещаться только в ADG и ADQM, а не во всех СУБД хранилища.

Синхронизация нового представления запускается в первом цикле синхронизации, доступном после создания представления, в порядке очереди (если такая есть). Статус синхронизации представления можно узнать с помощью запроса CHECK_MATERIALIZED_VIEW. Подробнее о синхронизации см. в разделе Синхронизация материализованных представлений.

Изменение материализованного представления недоступно. Для замены материализованного представления необходимо удалить его и создать новое.

Если при обработке запроса происходит ошибка, последующее изменение сущностей логической базы данных невозможно. В этом случае нужно повторить запрос. Действие перезапустит обработку запроса, и после ее завершения можно будет продолжить работу с логической БД.

Каждое создание представления записывается в журнал. Журнал можно посмотреть с помощью запроса GET_CHANGES.

Синтаксис

CREATE MATERIALIZED VIEW [db_name.]materialized_view_name (
  column_name_1 datatype_1 [ NULL | NOT NULL ],
  column_name_2 datatype_2 [ NULL | NOT NULL ],
  column_name_3 datatype_3 [ NULL | NOT NULL ],
  PRIMARY KEY (column_list_1)
) DISTRIBUTED BY (column_list_2)
DATASOURCE_TYPE (datasource_aliases)
AS SELECT query
DATASOURCE_TYPE = origin_datasource_alias
[LOGICAL_ONLY]

Параметры:

  • db_name — имя логической базы данных, в которой создается материализованное представление. Опционально, если выбрана логическая БД, используемая по умолчанию;
  • materialized_view_name — имя создаваемого материализованного представления, уникальное среди логических сущностей логической БД;
  • column_name_N — имя столбца представления;
  • datatype_N — тип данных столбца column_name_N. Возможные значения см. в разделе Логические типы данных;
  • column_list_1 — список столбцов, входящих в первичный ключ представления;
  • column_list_2 — список столбцов, входящих в ключ шардирования представления. Столбцы должны быть из числа столбцов column_list_1;
  • datasource_aliases — список псевдонимов СУБД хранилища, в которых нужно разместить данные представления. Элементы списка перечисляются через запятую. Возможные значения: adqm, adg. Значения можно указывать без кавычек (например, adg) или двойных кавычках (например, "adg");
  • querySELECT-подзапрос, на основе которого строится представление;
  • origin_datasource_alias — псевдоним СУБД, которая служит источником данных. Возможные значения: 'adb'. Значение указывается в одинарных кавычках.

Ключевое слово DATASOURCE_TYPE

Ключевое слово DATASOURCE_TYPE позволяет указать СУБД хранилища, в которых необходимо размещать данные материализованного представления. В текущей версии данные представления могут размещаться в ADG и (или) в ADQM.

Ключевое слово LOGICAL_ONLY

Ключевое слово LOGICAL_ONLY позволяет создать материализованное представление только на логическом уровне (в логической схеме данных), без пересоздания связанных физических таблиц в хранилище данных.

Если ключевое слово не указано, создается как материализованное представление, так и связанные с ним физические таблицы.

Ограничения

  • Выполнение запроса недоступно при наличии любого из факторов:
    • горячей дельты,
    • незавершенного запроса на создание, удаление или изменение таблицы или представления,
    • запрета на изменение сущностей (см. раздел DENY_CHANGES).
  • Выполнение запроса недоступно в сервисной базе данных INFORMATION_SCHEMA.
  • Имена представления и его столбцов должны начинаться с латинской буквы, после первого символа могут следовать латинские буквы, цифры и символы подчеркивания в любом порядке.
  • Представление и его столбцы не могут иметь имена, перечисленные в разделе Зарезервированные слова. Столбцы также не могут иметь имена, зарезервированные системой для служебного использования: sys_op, sys_from, sys_to, sys_close_date, bucket_id, sign.
  • Имена столбцов должны быть уникальны в рамках представления.
  • Имена, порядок и типы данных столбцов должны совпадать в SELECT-подзапросе и представлении.
  • Первичный ключ должен включать все столбцы ключа шардирования.
  • Подзапрос может обращаться только к логическим таблицам и только той логической базы данных, в которой находится материализованное представление.
  • Подзапрос не может содержать:
    • ключевое слово FOR SYSTEM_TIME,
    • ключевое слово ORDER BY,
    • ключевое слово LIMIT.

Примеры

Создание представления на основе одной таблицы с условием

Создание представления с размещением в ADG и ADQM:

CREATE MATERIALIZED VIEW marketing.sales_december_2020 (
id INT NOT NULL,
transaction_date TIMESTAMP NOT NULL,
product_code VARCHAR(256) NOT NULL,
product_units INT NOT NULL,
store_id INT NOT NULL,
description VARCHAR(256),
PRIMARY KEY (id)
)
DISTRIBUTED BY (id)
DATASOURCE_TYPE (adg, adqm)
AS SELECT * FROM marketing.sales
   WHERE cast(transaction_date as date) BETWEEN '2020-12-01' AND '2020-12-31'
DATASOURCE_TYPE = 'adb'

Создание представления на основе одной таблицы с условием, агрегацией и группировкой

Создание представления с размещением в ADQM:

CREATE MATERIALIZED VIEW marketing.sales_by_stores (
store_id INT NOT NULL,
product_code VARCHAR(256) NOT NULL,
product_units INT NOT NULL,
PRIMARY KEY (store_id, product_code)
)
DISTRIBUTED BY (store_id)
DATASOURCE_TYPE (adqm)
AS SELECT store_id, product_code, SUM(product_units) as product_units FROM marketing.sales
   WHERE product_code <> 'ABC0001'
   GROUP BY store_id, product_code
DATASOURCE_TYPE = 'adb'

Создание представления на основе двух таблиц

CREATE MATERIALIZED VIEW marketing.sales_and_stores (
  id INT NOT NULL,
  transaction_date TIMESTAMP NOT NULL,
  product_code VARCHAR(256) NOT NULL,
  product_units INT NOT NULL,
  description VARCHAR(256),
  store_id INT NOT NULL,
  store_category VARCHAR(256) NOT NULL,
  region VARCHAR(256) NOT NULL,
  PRIMARY KEY (id, region)
)
DISTRIBUTED BY (id)
DATASOURCE_TYPE (adg)
AS SELECT
 s.id, s.transaction_date, s.product_code, s.product_units, s.description,
 st.id AS store_id, st.category as store_category, st.region
 FROM marketing.sales AS s
 JOIN marketing.stores AS st
 ON s.store_id = st.id
DATASOURCE_TYPE = 'adb'

Создание представления только на логическом уровне

CREATE MATERIALIZED VIEW marketing.stores_by_sold_products_matview (
  store_id INT NOT NULL,
  product_amount INT NOT NULL,
  PRIMARY KEY (store_id)
)
DISTRIBUTED BY (store_id)
DATASOURCE_TYPE (adg)
AS SELECT store_id, SUM(product_units) AS product_amount
  FROM marketing.sales
  GROUP BY store_id
DATASOURCE_TYPE = 'adb'
LOGICAL_ONLY