メインコンテンツへスキップ
メインコンテンツへスキップ

Npy

入力出力エイリアス

説明

Npy 形式は、.npy ファイルから NumPy 配列を ClickHouse に読み込むために設計されています。 NumPy のファイル形式は、数値データの配列を効率的に保存するために使用されるバイナリ形式です。 インポート時、ClickHouse は最上位の次元を、単一列を持つ行の配列として扱います。

下表は、サポートされている Npy データ型と、それに対応する ClickHouse の型を示します。

データ型の対応

Npy データ型(INSERTClickHouse データ型Npy データ型(SELECT
i1Int8i1
i2Int16i2
i4Int32i4
i8Int64i8
u1, b1UInt8u1
u2UInt16u2
u4UInt32u4
u8UInt64u8
f2, f4Float32f4
f8Float64f8
S, UStringS
FixedStringS

使用例

Python を使って配列を .npy 形式で保存する

import numpy as np
arr = np.array([[[1],[2],[3]],[[4],[5],[6]]])
np.save('example_array.npy', arr)

ClickHouse で NumPy ファイルを読み込む

SELECT *
FROM file('example_array.npy', Npy)
┌─array─────────┐
│ [[1],[2],[3]] │
│ [[4],[5],[6]] │
└───────────────┘

データの選択

clickhouse-client で次のコマンドを実行すると、ClickHouse のテーブルからデータを抽出し、Npy 形式のファイルとして保存できます。

$ clickhouse-client --query="SELECT {column} FROM {some_table} FORMAT Npy" > {filename.npy}

書式設定