VictoriaMetrics@TSDB¶
はじめに¶
本サイトにつきまして、以下をご認識のほど宜しくお願いいたします。
01. VictoriaMetricsの仕組み¶
アーキテクチャ¶
▼ リモートストレージとして¶
ロードバランサー、vmselect、vmstorage、vminsert、といったコンポーネントから構成されている。
リモートストレージとして、Prometheusで収集したデータポイントを保管する。
エンドポイントとしてロードバランサーがあり、書き込みエンドポイントを指定すれば、vminsertを経由して、vmstorage (ブロックストレージ) にメトリクスを書き込める。
また読み出しエンドポイントを指定すれば、vmselectを経由して、vmstorageからメトリクスを読み込める。
補足として、PrometheusがリモートストレージとしてVictoriaMetricsを使用する時、Grafanaのようにリアルタイムにデータを取得し続けることはできない。
代わりに、PrometheusのダッシュボードでPromQLを実行し、読み出しエンドポイントからその都度データを取得することはできる。
▼ メトリクス監視バックエンドとして¶
vm-agent、vmstorage、vm-alert、といったコンポーネントから構成されている。
また、アラートの通知のためにalertmanager、可視化のためにGrafana、が必要である。
vm-agentがPull型でメトリクスのデータポイントを収集し、vmstorageに保管する。
vm-alertは、vmstorageに対してMetricsQLを定期的に実行し、条件に合致したエラーイベントからアラートを作成する。
VictoriaMetricsをメトリクス監視バックエンドとして使用する場合はPrometheusは不要になる。
各コンポーネントがメモリを使用するため、
01-02. Nodeモード¶
シングルNodeモード¶
▼ シングルNodeモードとは¶
シングルNodeモードでは、各コンポーネントは冗長化されない。
▼ インストール¶
もう一方のクラスターNodeモードとは、バイナリ (特に接尾辞はない) やセットアップ方法が異なる。
▼ アップグレード¶
シングルNodeモードの場合、ダウンタイムを避けられない。
▼ ログ¶
これは、journalctl
コマンドのログである。
# インデックスDBを読みこむ
2024-11-25T11:47:58.543Z info VictoriaMetrics/lib/mergeset/table.go:260 opening table "/var/lib/victoria-metrics/data/indexdb/180958B880A8F14D"...
2024-11-25T11:47:58.549Z info VictoriaMetrics/lib/mergeset/table.go:295 table "/var/lib/victoria-metrics/data/indexdb/180958B880A8F14D" has been opened in 0.006 seconds; partsCount: 0; blocksCount: 0, itemsCount: 0; sizeBytes: 0
# データベースを読み込む
2024-11-25T11:47:58.550Z info VictoriaMetrics/app/vmstorage/main.go:101 successfully opened storage "/var/lib/victoria-metrics/data" in 0.030 seconds; partsCount: 0; blocksCount: 0; rowsCount: 0; sizeBytes: 0
# ロールアップを実行する
2024-11-25T11:47:58.553Z info VictoriaMetrics/app/vmselect/promql/rollup_result_cache.go:99 loading rollupResult cache from "/var/lib/victoria-metrics/data/cache/rollupResult"...
2024-11-25T11:47:58.554Z info VictoriaMetrics/app/vmselect/promql/rollup_result_cache.go:125 loaded rollupResult cache from "/var/lib/victoria-metrics/data/cache/rollupResult" in 0.001 seconds; entriesCount: 0, sizeBytes: 0
# VictoriaMetricsを起動する
2024-11-25T11:47:58.554Z info VictoriaMetrics/app/victoria-metrics/main.go:61 started VictoriaMetrics in 0.034 seconds
2024-11-25T11:47:58.554Z info VictoriaMetrics/lib/httpserver/httpserver.go:82 starting http server at https://0.0.0.0:8248/
2024-11-25T11:47:58.554Z info VictoriaMetrics/lib/httpserver/httpserver.go:83 pprof handlers are exposed at https://0.0.0.0:8248/debug/pprof/
クラスターNodeモード¶
▼ クラスターNodeモードとは¶
クラスターNodeモードでは、各コンポーネントは冗長化される。
▼ インストール¶
もう一方のシングルNodeモードとは、バイナリ (-cluster
という接尾辞がつく) やセットアップ方法が異なる。
▼ アップグレード¶
クラスターNodeモードの場合、ダウンタイムを避けられる。
01-03. コンポーネント¶
ロードバランサー¶
▼ ロードバランサーとは¶
HTTPSプロトコルの8224
番ポートでインバウンド通信を待ち受け、vmselectやvminsertに通信をルーティングする。
このロードバランサー自体をヘルスチェックすれば、VictoriaMetricsのプロセスが稼働しているか否かを監視できる。
vmselect¶
▼ vmselectとは¶
クライアントから読み出しリクエストを受信し、vmstorageからデータを読み出す。
▼ vmselectの仕組み¶
VictoriaMetricsは、クエリの実行前に、ディスクに永続化したデータポイントを一度メモリに移動する。
そのため、ストレージのデータ量が多くなるのに伴って、メモリ上のデータポイントが常時/突発的に多くなり、OOMキラーになることがある。
▼ クエリ言語¶
クエリ言語はMetricsQLである。
これはPromQLではないが、文法はほぼほぼPromQLと同じである。
▼ カーディナリティ¶
とある期間で区切った時の固有な時系列データの断片数である。
この断片数が多くなる程、読み出しで負荷がかかる。
vmstorage¶
▼ vmstorageとは¶
データをファイルシステムに保管する。
保管時にデータを圧縮している。
公式での情報は見つからなかったが、圧縮率は約10%
らしい。
▼ ディレクトリ構成¶
VictoriaMetricsのプロセスをvictoria-metrics-prod
コマンドで起動する時に、storageDataPath
オプションでディレクトリ名を渡す。
これにより、マウント先のディレクトリを設定できる。ディレクトリ構造は以下のようになっている。
/var/lib/victoriametrics/
├── data/
│ ├── big/ # メトリクスが保管されている。
│ ├── flock.lock
│ └── small/ # キャッシュとして保管される。時々、bigディレクトリにマージされる。
│
├── cache/
├── flock.lock
├── indexdb/ # 全文検索処理の高速化のためのインデックス
├── metadata/
├── snapshots/
└── tmp/
du
コマンドを使用して、ストレージ使用量を確認できる。
$ du -hs /var/lib/victoriametrics/data
100G /var/lib/victoria-metrics/data
▼ バックグラウンドマージ¶
VictoriaMetricsは、容量節約のためにデータブロックを定期的にバックグラウンドでマージし、大きなブロックにする。
▼ ReadOnlyモード¶
vmstorageは、サイズいっぱいまでデータが保管されると、ランタイムエラーを起こしてしまう。これを回避するために、ReadOnlyモードがある。
ReadOnlyモードにより、vmstorageの空きサイズがminFreeDiskSpaceBytes
オプション値を超えると、書き込みできなくなるような仕様になっている。
これにより、vmstorageの最大サイズを超えてデータを書き込むことを防いでいる。
▼ 保管期間¶
vmstorageは、保管期間を過ぎたメトリクスファイル (主に、data
ディレクトリ、indexdb
ディレクトリ、の配下など) を削除する。
ただし実際には、期間を過ぎたメトリクスファイルを翌日にすぐ削除するわけではなく、月初のバックグラウンドマージ中にまとめて削除する。
VictoriaMetricsの起動時に、victoria-metrics-prod
コマンドの-retentionPeriod
オプションで指定できる。
例えば、-retentionPeriod
オプションを90日とすれば、91日を超えたメトリクスファイルを月初にまとめて削除する。
日時的な削除処理によって、CPUやディスクI/Oがスパイクになることがある。
▼ ストレージの必要サイズの見積もり¶
vmstorageの/var/lib/victoriametrics
ディレクトリ配下の増加量 (日) を調査し、これに非機能的な品質の保管日数をかけることにより、vmstorageの必要最低限のサイズを算出できる。
また、20
%の空きサイズを考慮するために、増加量を1.2
倍する必要がある。
*例*
ここでは、増加率を以下の数式で算出している。
(増加率) = ((当該時刻のサイズ) - (前時刻のサイズ)) ÷ (前時刻のサイズ) × 100
時刻 | storageDataPathのサイズ (MB) | 前時刻比 増加率 (%) | 前時刻比 増加量 (MB) |
---|---|---|---|
00:00:00 |
10535 |
- | - |
01:00:00 |
10708 |
0.0164 |
173 |
02:00:00 |
10838 |
0.0121 |
130 |
〜 中略 〜 | |||
22:00:00 |
12997 |
0.0226 |
159 |
23:00:00 |
13023 |
0.0020 |
26 |
24:00:00 |
12900 |
-0.0094 |
123 |
増加率の推移をグラフ化すると、データが一定の割合で増加していることがわかるはずである。
これは、Prometheusの仕様として、一定の割合でVictoriaMetricsに送信するようになっているためである。
もし、データの保管日数が10
日分という非機能的な品質であれば、vmstorageは常に過去10
日分のデータを保管している必要がある。
そのため、以下の数式で10
日分のサイズを算出できる。
(増加量の合計)
= 12900 - 10535
= 2365 (MB/日)
(10日分を保管するために必要なサイズ)
= 2365 × 1.2 × 10
= 28380 (MB/10日)
VictoriaMetricsを、もしAWS EC2上で稼働させる場合、AWS EBSボリュームサイズもvmstorageのサイズ以上にする必要がある。
vminsert¶
▼ vminsertとは¶
クライアントから書き込みリクエストを受信し、vmstorageにデータを書き込む。
02. セットアップ¶
systemctl
コマンド¶
systemctl
コマンドを使用して、VictoriaMetricsプロセスをデーモンとして起動する。
(1)
-
ユニットファイルを作成する。
# victoriametrics.serviceファイル
[Unit]
Description=High-performance, cost-effective and scalable time series database, long-term remote storage for Prometheus
After=network.target
[Service]
Type=simple
StartLimitBurst=5
StartLimitInterval=0
Restart=on-failure
RestartSec=1
# プロセスの起動時にオプションを渡す。
ExecStart=/usr/bin/victoria-metrics-prod \
`# マウント先のディレクトリ` \
-storageDataPath=/var/lib/victoriametrics \
`# 保管期間` \
-retentionPeriod 10d \
`# Grafanaからのリクエストを待ち受けるポート番号` \
-graphiteListenAddr :2003
ExecStop=/bin/kill -s SIGTERM $MAINPID
LimitNOFILE=65536
LimitNPROC=32000
[Install]
WantedBy=multi-user.target
(2)
-
victoriametricsのプロセスを
systemctl
で起動する。
# 作成したファイルを読み込み、VictoriaMetricsプロセスをデーモンとして起動する。
$ systemctl daemon-reload
$ systemctl start victoriametrics