Модель данных в DataLens

Набор данных датасета представлен в виде полей.

Источник данных

В качестве источника данных используются одна или несколько таблиц.

Примечание

Существует ограничение на показ в датасете первых 1000 таблиц из источника. Если нужные таблицы не попали в список, то на данный момент их можно добавить только вручную с помощью SQL-запроса.

Если в источнике доступно несколько таблиц, их можно объединить с помощью оператора JOIN.
Объединение происходит через создание связи. В связи вы указываете поля исходной таблицы и поля таблицы, с которой происходит объединение.

Связь таблиц происходит автоматически по первому совпадению имени полей и типа данных полей.

При этом вы можете:

  • изменять поля в связи;
  • добавлять новые связи или удалять существующие;
  • изменять в связи тип оператора JOIN (INNER, LEFT, RIGHT, FULL);
  • управлять оптимизацией связи.

Оператор JOIN применяется, если в запросе из чарта участвуют поля из двух и более таблиц датасета.

Оператор JOIN не применяется, если:

  • датасет содержит одну таблицу;
  • датасет содержит несколько таблиц, но в запросе участвуют поля только от одной из этих таблиц (при включенной оптимизации связи).

Для управления поведением связи при объединении данных из нескольких таблиц используйте опцию Оптимизировать связь в настройках связи. По умолчанию опция включена для всех связей в датасете — оператор JOIN применяется, когда в запросе участвуют поля из двух и более связанных таблиц. Вы можете отключить опцию для каждой конкретной связи, чтобы сделать связь обязательной. В этом случае операция объединения (оператор JOIN) будет выполняться, даже если выбираются поля только из одной таблицы.

Примечание

Отключение оптимизации может увеличить время выполнения запроса.

Поля данных

Поля определяют структуру и формат датасета. Существуют следующие типы полей:

  • Измерение. Содержит значения, которые определяют характеристику данных. Например, город, дата покупки, категория продукта. К полю с измерением не применяется функция агрегации, в противном случае поле становится показателем. В интерфейсе измерения отображаются зеленым цветом.
  • Показатель. Содержит числовые значения, к которым применяются функции агрегации (сведения). Например, сумма кликов, количество переходов. Если снять с такого поля функцию агрегации, оно станет измерением. В интерфейсе показатели отображаются синим цветом.

В интерфейсе создания датасета и в визарде вы можете дублировать существующие поля и создавать новые, а также использовать функции агрегации.

Важно

Максимальное количество полей в одном датасете — 1200.

DataLens позволяет создавать вычисляемые поля с помощью формул.
Для записи формул вы можете использовать существующие поля датасета, константы и функции.
Полный список функций приведен в разделе Справочник функций.

Подробнее о вычисляемых полях в разделе Вычисляемые поля.

Агрегация данных

Для полей с различными типами данных доступны следующие функции агрегации:

ФункцияОписаниеПоддерживаемые типы
НетБез агрегацииВсе типы
СреднееСреднее арифметическое значенийДробное число
Целое число
КоличествоКоличество записейСтрока
Дата
Дата и время
Дробное число
Целое число
Количество уникальныхКоличество уникальных записейСтрока
Дата
Дата и время
Дробное число
Целое число
МаксимумМаксимальное значениеДата
Дата и время
Дробное число
Целое число
МинимумМинимальное значениеДата
Дата и время
Дробное число
Целое число
СуммаСумма значенийДробное число
Целое число

Дополнительные функции агрегации доступны в вычисляемых полях.

Примечание

Для некоторых источников недоступны функции агрегации.
Источники, для которых доступна функция, перечислены в разделе Поддержка источников данных на странице функции агрегации в справочнике.

Подробнее о типах данных в разделе Типы данных DataLens.

См. также