02 kueri zui_shi_hua_notamenopuroziekushiyonshe_ji_

クエリ最適化のための
プロジェクション設計
HPE Vertica Advanced Performance Tuning
April 27, 2016

本章の概要
– インクリメンタルモードでのデータベースデザイナー
– JOIN の最適化
– GROUP BY の最適化
– COUNT DISTINCT
– 相関列
– カーディナリティが高い列
2

インクリメンタルモードでのデータベースデザイナー

インクリメンタルデザイン
– 追加のクエリチューニングのために、インクリメンタル（Incremental）デザインを実行
– 更に最適化を必要とするクエリを適用
– 適用された各クエリに対して、最適化された追加のプロジェクションが作成されうる

サンプルクエリ
– 様々なタイプのステートメントを含む：
– Select
– Delete
– クエリは構文エラーの解析がされる
– クエリの重み付け – 任意の述語のためにプロジェクションを作成する可能性を高めるべく同様のクエリの述語を繰
り返し記載
– クエリはグループ化され、類似性に基づいて重み付けされる

出力ディレクトリ
– DBD の出力ディレクトリ以下に生成されたファイルの内容を確認
– [デザイン名]_deploy.sql
– [デザイン名]_design.sql
– [デザイン名]_params.txt
– designer.log

デプロイメントスクリプトの手動実行
– 必要に応じて、デプロイメント DDL スクリプトを変更し、手動でスクリプトを実行する
– vsql 上で実行した場合
=> i /filepath/[design name]_deploy.sql
– Linux のコマンドライン上で実行した場合
$ vsql –f "/filepath/[design name]_deploy.sql"
マネージメントコンソールから DBD を
実行した場合は、スクリプトを保存し
てください。

サンプル DDL
– デプロイメントスクリプトを開き確認
– エンコーディング、ソーティング、セグメンテーションの確認
CREATE PROJECTION fact_p
/*+basename(fact_p),createtype(D
)*/
(
a ENCODING RLE,
b ENCODING RLE,
c,
id ENCODING RLE
) AS
SELECT a, b, c, id FROM Fact
ORDER BY a,id, b
SEGMENTED BY HASH(c) ALL NODES
K SAFE;
CREATE PROJECTION dim_p
/*+basename(dim_p),createtype
(D)*/
(
x ENCODING RLE,
y ENCODING RLE,
z,
id ENCODING RLE
) AS
SELECT x, y, z,id FROM Dim
ORDER BY id, x, y
UNSEGMENTED ALL NODES;

ロギングによる情報
– DBDのロギング機能は下記情報を提供
– DBD実行中にオプティマイザが提案したプロジェクション
– デザインがデプロイされた際にDBDが作成したプロジェクション
– 全プロジェクションを作成するために使われるDDL
– 列の最適化
– 下記でロギング開始
=> SELECT SET_CONFIG_PARAMETER('DBDLogInternalDesignProcess','1');
– 情報を参照するデータコレクター（DC）テーブル
– DC_DESIGN_PROJECTION_CANDIDATES
– DC_DESIGN_QUERY_PROJECTION_CANDIDATES

JOIN の最適化
– オプティマイザが理想的な JOIN 演算子を選択するようにプロジェクションを設計
– ハッシュ結合もしくはマージ結合するようにプロジェクションを作成
– ネットワークオペレーションの最小化
– 各 JOIN がローカルで実行できるように、結合キーでプロジェクションを分散
– JOIN の実行時間を完全に排除
– プリジョインプロジェクションの使用
– 外部で非正規化
11

ハッシュ結合演算子
– 最も一般的な JOIN 演算子 – 特別な最適化は不要
– ハッシュテーブルはディメンション（内部）テーブル上に構築される
– ファクト（外部）テーブルがスキャンされ、ディメンションテーブルの行と一致する行は結果セットとして出力される
purchases_fact_p
(date, item列でソート)
customer_dim_p
(last_nameでソート)
last_nam
e
cust_i
d
Adams 10202
Benn 10201
Cobb 10203
ハッシュテーブル
(メモリ上)
タプルを出力
不一致
date Item cust_i
d
10/4/14 Pencil 10201
10/5/14 Fork 10202
10/6/14 Eraser 10201
10/6/14 Soap 10206
10/7/14 Cup 10203
last_
name
cust_ id
Adams 10202
Benn 10201
Cobb 10203
Benn 10201 10/4/14 PencilAdams 10202 10/5/14 ForkBenn 10201 10/6/14 EraserCobb 10203 10/7/14 Cup

ハッシュ結合 – Join Spill
– ハッシュテーブルがメモリに収まらない場合、結合処理はディスクに書き込みを開始
– ファクトとディメンションの両方がディスクに書き込まれる
– 初めはクエリはメモリに収まるようにするが、収まらない場合、 Join Spill が有効化され、クエリを自動的に再実行
– クエリがスピルされることが想定される場合、ヒント文を追加し、メモリへのハッシングをスキップ
SELECT /*+add_vertica_options(EE,ENABLE_JOIN_SPILL)*/ …
– 再試行を検出するために、 PROFILE 文の実行もしくは vertica.log のチェック
– プリジョインプロジェクションへのデータロードにおいて、ハッシュ結合テーブルがメモリ量を超える場合、
ENABLE_JOIN_SPILLが必要
13

マージ結合演算子
– ディメンションテーブルがメモリに収まらない場合、マージ結合の使用を推奨
– 両テーブルがメモリを介してストリーミングされるため、大きいテーブル同士の JOIN はより高速
– ディスクに移動する必要なし
purchases_fact_
p (結合キーでソート)
customer_dim_p
(結合キーでソート)タプルを出力
不一致
cust_id item date
10201 Pencil 10/4/14
10201 Eraser 10/6/14
10202 Fork 10/5/14
10203 Cup 10/7/14
10206 Soap 10/6/14
cust_id last_name
10201 Benn
10202 Adams
10203 Cobb
10201 Pencil 10/4/14 Benn10201
Erase
r
10/6/14 Benn10202 Fork 10/5/14 Adams10203 Cup 10/7/14 Cobb

マージ結合の要件
– JOIN している両側のデータが結合キーとなる列でソートされている必要あり
– プロジェクションにおいて、結合キーで並び替え
– ORDER BY 句でサブクエリ内で並び替え
– 等価の述語は、マージ結合のサイズを減らすために、最初に実行される（JOIN を下に押し下げ）
– オプティマイザは、最初に、クエリの述語に使われている列にあわせて設計されたプロジェクションを探す
– クエリが列に対して単一の値の等価の述語を持つ場合にのみ、述語の列は、プロジェクションの ORDER BY で最初に配置
される
– ディスクへの書き込みを避けるために、大きいディメンションテーブルに対して推奨
15

マージ結合の最適化
– ファクトとディメンションの両プロジェクションを JOIN 句の列で並び替え
– サンプルクエリ
SELECT * FROM Fact F, Dim D WHERE F.id = D.id;
– サンプルプロジェクション
16
CREATE PROJECTION Fact_p
(
a ENCODING RLE,
b ENCODING RLE,
c,
id ENCODING RLE
) AS
ORDER BY id, b
SEGMENTED BY HASH(c) ALL NODES;
CREATE PROJECTION Dim_p
(
x ENCODING RLE,
y ENCODING RLE,
z,
id ENCODING RLE
) AS
ORDER BY id, x, y

Predicate Pushdown を伴うマージ結合
– 述語で列をフィルターすることにより、ファクトのプロジェクションを並び替え
– 続いて、ファクトとディメンションの両プロジェクションの JOIN 句の列で並び替え
SELECT * FROM Fact F, Dim D WHERE F.id = D.id AND f.a = 10;
17
CREATE PROJECTION Fact_p
(
a ENCODING RLE,
b ENCODING RLE,
c,
id ENCODING RLE
) AS
ORDER BY a,id, b
SEGMENTED BY HASH(c) ALL NODES;
CREATE PROJECTION Dim_p
(
x ENCODING RLE,
y ENCODING RLE,
z,
id ENCODING RLE
) AS
ORDER BY id, x, y

結合演算子の確認
– クエリの実行計画で、結合演算子を探す
– JOIN HASH
– JOIN MERGEJOIN
– vertica.log ファイルを確認する
– ハッシュテーブルがメモリに収まらない場合、 vertica.log で ENABLE_JOIN_SPILL 付きのクエリが再実行されていることを
確認する
18

クエリの最適化 – ネットワークオペレーション
– ローカル結合の要件
– ファクトとディメンションテーブルで一致する行が同じノード上にある
– 分散化されたファクトと複製されたディメンションの結合
– ファクト： SEGMENTED BY HASH (id) ALL NODES;
– ディメンション： UNSEGMENTED ALL NODES;
– Identically Segmented プロジェクション
– 両プロジェクションが結合キーで分散化されている
– イニシエーターノード上で、最終結果が集計される
19

ローカル結合の設計
– 小さなディメンションのプロジェクションを複製し、大きなファクトのプロジェクションを分散化
20
00034892 trial results
00034892 ABC's storm
01734984 rt Javier
01734984 This week
08092845 Go Broncos!
08092845 Pats-onside
分散化された
プロジェクション
01734984 rt Javier
01734984 This week
ファクトのデータ
Node1 Node2 Node3
ディメンションのデータ
00034892 Carol
01734984 Jim
08092845 Kim
00034892 Carol
01734984 Jimmy
08092845 Kim
00034892 Carol
01734984 Jimmy
08092845 Kim
00034892 Carol
01734984 Jimmy
08092845 Kim
複製された
／分散化されていない
プロジェクション

分散化されたプロジェクションと複製されたプロジェクション
– ファクトを分散化、ディメンションを複製
SELECT * FROM fact F
JOIN dim D ON F.id = D.id;
21
(
a ENCODING RLE,
b ENCODING RLE,
c ENCODING RLE,
id
) AS
SELECT a, b, c, id FROM fact
ORDER BY id, a, b, c
SEGMENTED BY HASH(id) ALL NODES;
(
x ENCODING RLE,
y ENCODING RLE,
z,
id
) AS
SELECT x, y, z,id FROM dim
ORDER BY id, x, y

Identically Segmented プロジェクション（ISP）
– ファクトとディメンションテーブルのどちらもサイズが大きい場合、両プロジェクションの結合キーで分散化すると、
主キー／外部キーで結合された行が同じノードに格納される
22
FK1
FK2
FK3
FKでハッシュ分散された
大きいファクト
FK1 FK2 FK3
PKでハッシュ分散された
大きいディメンション
大きいディメンション大きいファクト
Node1 Node2 Node3
PK1
PK2
PK3
PK2PK1 PK3

ISP の例
– ファクトとディメンションテーブルのどちらもサイズが大きい場合、両プロジェクションの結合キーで分散化すると、
主キー／外部キーで結合された行が同じノードに格納される
23
01734984 rt Javier
01734984 This week
FKでハッシュ分散された
大きいファクト
01734984 rt Javier
01734984 This week
PKでハッシュ分散された
大きいディメンション
大きいディメンション大きいファクト
Node1 Node2 Node3
00034892 Carol
01734984 Jim
08092845 Kim
01734984 Jim00034892 Carol 08092845 Kim

Identically Segmented プロジェクション
–ファクトとディメンションの JOIN 句の列で分散化
–サンプルクエリ
SELECT * FROM fact F
JOIN dim D ON F.id = D.id;
–サンプルプロジェクション
24
(
a ENCODING RLE,
b ENCODING RLE,
c ENCODING RLE,
id
) AS
SELECT a, b, c, id FROM fact
ORDER BY id, a, b, c
(
x ENCODING RLE,
y ENCODING RLE,
z,
id
) AS
SELECT x, y, z,id FROM dim
ORDER BY id, x, y

ネットワーク演算子
– 結合対象のデータがローカルで利用できない場合、データはネットワークオペレーションを必要とし、実行時に再
分散される
– 該当するネットワークオペレーションを実行計画から探す
– BROADCAST（各ノードにデータの完全な一時コピーを配布）
Access Path:
+-JOIN HASH [LeftOuter] [Cost: 40K, Rows: 10K (NO STATISTICS)] (PATH ID: 1) Inner
(BROADCAST)
| Join Filter: (T1.a > T2.y)
| Materialize at Output: T1.b
| Execute on: All Nodes
– RESEGMENT（各ノードに ISP の一時セグメントを配布）
Access Path:
+-JOIN HASH [Cost: 639, Rows: 10K (NO STATISTICS)] (PATH ID: 1) Inner (RESEGMENT)
| Join Cond: (T1.a = T2.y)
| Materialize at Output: T1.b | Execute on: All Nodes
25

GROUP BY の最適化
– 最適化された GROUP BY 演算子の設計
– GROUP BY PIPE もしくは GROUP BY HASH のプロジェクションの作成
– LOCAL GROUP BY の設計
– 各 GROUP が一つのみのノードで実行されるように分散化
27

GROUP BY HASH 演算子
– SELECT count(*) FROM cust GROUP BY cust.state;
– ハッシュテーブルは、結果セットがユーザーに返される前に、完全に構築される必要あり
28
CA
MA
AL
CA
DE
AL
MA
DE
値 Count
ハッシュマップ
（メモリ上に格納）
cust.state（未ソート）
CA 12
MA
AL
DE
1
1
1
2
2
2
ユーザーへ返す

GROUP BY PIPE 演算子
– SELECT count(*) FROM cust GROUP BY cust.state;
– 使用メモリが少なく、 GROUP BY HASH より高速
29
cust.state（ソート済）
C 12BCount( )
=
ユーザーへ返す
AL
AL
CA
CA
DE
DE
MA
MA

GROUP BY PIPE
– GROUP BY PIPE は、大量のデータもしくは多数のグループを集計するために必要不可欠
– タプルの数を無限にストリーミング可能
– グループの合計数は問題ではない
– 選択的な述語がある場合、代わりにその述語を最適化
– 等価の述語は GROUP BY PIPE の前に実行される
– GROUP BY PIPE の出力はソート済
– クエリの実行計画で、 GROUP BY 演算子を探す
– GROUP BY HASH もしくは GROUP BY PIPELINED
30

GROUP BY PIPE の最適化
– GROUP BY 句に指定される全ての列は、プロジェクションで最初に ORDER BY 句に指定される必要あり
SELECT count(*) FROM cust GROUP BY a, b, c;
CREATE PROJECTION cust_p
(
a ENCODING RLE,
b ENCODING RLE,
c ENCODING RLE,
d,
e
) AS
SELECT a, b, c, d, e FROM cust
ORDER BY a, b, c
SEGMENTED BY HASH(d) ALL NODES;
31

DISTRIBUTED GROUP BY
– データがノード間でランダムに分散されている場合、 GROUP BY 実行のためにデータを再分散する必要あり
– GROUP BY の列で際分散
– 各グループが一つのノードのみに存在する場合、どうなるか？
– GROUP BY の列で再分散することにより達成される
– クエリの実行計画が再分散を表示
– Distributed Group By の場合、 RESEGMENT GROUP を表示
32

LOCAL GROUP BY の最適化
– Group By の列で分散化
SELECT count(*) FROM cust GROUP BY a, b, c;
(
a ENCODING RLE,
b ENCODING RLE,
c ENCODING RLE,
d, e
) AS
SELECT a, b, c, d, e FROM cust
ORDER BY a, b, c
SEGMENTED BY HASH(a, b, c) ALL NODES;
33

GROUP BY の再分散
– SEGMENTED BY HASH(a,b) ALL NODES と指定されたプロジェクションで、下記 GROUP BY がクエリに指定
されている場合
– GROUP BY a
– Group By に指定されていないセグメンテーションの値があることにより、再分散が必要
– GROUP BY a,b
– 実行時に再分散は必要なし
– GROUP BY a,b,c
– 実行時に再分散は必要なし
– GROUP BY a+1,b
– 列 a の式により、再分散が必要
34

Count Distinct の最適化
– GROUP BY PIPE と同様
SELECT a, count(distinct b) FROM cust
GROUP BY a;
(
a ENCODING RLE,
b ENCODING RLE,
c ENCODING RLE
) AS
SELECT a, b, c FROM cust
ORDER BY a, b
SEGMENTED BY HASH(a, b) ALL NODES;
36

Approximate Count Distinct
– 誤差は +/-1% であり、97 %の時間短縮
– ユーザーが指定した精度を保持
– 結果はロールアップ可能。たとえば、時間毎のものを日毎に
– 個別の値は、各ノードに存在する必要なし
– より効率的にメモリを使用し、結果がより速く返される
SELECT a, APPROXIMATE_COUNT_DISTINCT (b)
FROM cust
GROUP BY a;
37

相関列
– 別の列のデータへの相対出現頻度が高い場合、列の相関関係は、2つの列の位置関係で決まる
– これらの列をプロジェクションのソート順で隣り合わせにすることにより、列の相関を実装する
39

相関列：最適化されていない場合
40
zipcode lastname firstname state
30004 James Eliza GA
33126 Baker Hubert FL
33126 Bhatnagar Gadin FL
55303 Olivier Alice MN
55343 Flint William MN
77050 Cunningham Theodore TX
77070 Dasgupta Ekanta TX
77070 Quian Cheng TX
94304 Venkatesan Nadish CA
97002 Huang Daoming OR
97006 Lin Liang OR

相関列：最適化されている場合
41
state zipcode lastname firstname
GA 30004 James Eliza
FL 33126 Baker Hubert
FL 33126 Bhatnagar Gadin
MN 55303 Olivier Alice
MN 55343 Flint William
TX 77050 Cunningham Theodore
TX 77070 Dasgupta Ekanta
TX 77070 Quian Cheng
CA 94304 Venkatesan Nadish
OR 97002 Huang Daoming
OR 97006 Lin Liang

カーディナリティが高い列

カーディナリティが高い列の参照
– SELECT Address
FROM cdr_table
WHERE Number='978-263-4563';
43
問題：
列 Number は、カーディナリティが高い
ため、RLEが有効でない

カーディナリティが高い列の分割（1/3）
– Area_Code と呼ばれる新しい列を作成し、並べる
– SELECT COUNT (distinct Number)=1,300万の場合、 SELECT COUNT (distinct Area_Code)=約3,600件となるような
新しい列を作成
44

– プロジェクションのソート順に新しい列を追加
– ORDER BY Area_Code, Number . . .
– SQL文の述語に追加した列を追加
– 元のクエリ
SELECT Address
FROM cdr_table
WHERE Number='978-263-4563';
– 新しいクエリ
SELECT Address
FROM cdr_table
WHERE Number='978-263-4563' and Area_Code='978';
45

– 良い点
– カーディナリティの低い列は、ソート順の最初の方で他のカーディナリティの低い述語に使われている列と混合可能
– 悪い点
– テーブル、プロジェクション、クエリを編集する必要あり
46

本章のまとめ
– インクリメンタルモードでのデータベースデザイナー
– JOIN の最適化
– GROUP BY の最適化
– COUNT DISTINCT
– 相関列
– カーディナリティが高い列
47

02 kueri zui_shi_hua_notamenopuroziekushiyonshe_ji_

Recommended

Recommended

More Related Content

What's hot

What's hot (12)

Similar to 02 kueri zui_shi_hua_notamenopuroziekushiyonshe_ji_

Similar to 02 kueri zui_shi_hua_notamenopuroziekushiyonshe_ji_ (20)

More from Kaito Tonooka

More from Kaito Tonooka (15)

02 kueri zui_shi_hua_notamenopuroziekushiyonshe_ji_

Editor's Notes