メインコンテンツへスキップ
メインコンテンツへスキップ

クラウドオブジェクトストレージから ClickHouse Cloud へのデータ移行

Migrating Self-managed ClickHouse

Cloud Object Storage をデータレイクとして利用していて、そのデータを ClickHouse Cloud にインポートしたい場合や、 現在利用しているデータベースシステムがデータを直接 Cloud Object Storage にオフロードできる場合には、 Cloud Object Storage に保存されたデータを ClickHouse Cloud のテーブルへ移行するために、以下のいずれかの テーブル関数を使用できます。

現在利用しているデータベースシステムがデータを直接 Cloud Object Storage にオフロードできない場合は、 サードパーティ製 ETL/ELT ツールclickhouse-local を使って、 まず現在のデータベースシステムから Cloud Object Storage へデータを転送し、その後第 2 段階として ClickHouse Cloud のテーブルへそのデータを移行することができます。

これは 2 段階のプロセス(データを Cloud Object Storage にオフロードし、その後 ClickHouse に読み込む)ではありますが、 ClickHouse Cloud による Cloud Object Storage からの高並列読み取りに対する 強力なサポートのおかげで、 ペタバイト規模までスケールできるという利点があります。 また、Parquet のような、高度な圧縮フォーマットを活用することもできます。

S3 を利用して ClickHouse Cloud にデータを取り込む具体的なコード例を紹介している ブログ記事 もあります。