DataLakeCatalog
DataLakeCatalog データベースエンジンを使用すると、ClickHouse を外部の
データカタログに接続し、データを複製することなくオープンテーブルフォーマットのデータをクエリできます。
これにより、ClickHouse は既存のデータレイクインフラストラクチャとシームレスに連携する
強力なクエリエンジンになります。
サポートされているカタログ
DataLakeCatalog エンジンは、次のデータカタログをサポートします。
- AWS Glue Catalog - AWS 環境での Iceberg テーブル向け
- Databricks Unity Catalog - Delta Lake および Iceberg テーブル向け
- Hive Metastore - 従来の Hadoop エコシステム向けカタログ
- REST Catalogs - Iceberg REST 仕様に準拠した任意のカタログ
データベースの作成
DataLakeCatalog エンジンを使用するには、以下の必要な設定を有効にする必要があります。
DataLakeCatalog エンジンを利用するデータベースは、次の構文で作成できます。
サポートされている設定は次のとおりです:
| Setting | Description |
|---|---|
catalog_type | カタログの種類: glue, unity (Delta), rest (Iceberg), hive, onelake (Iceberg) |
warehouse | カタログ内で使用する warehouse / データベース名 |
catalog_credential | カタログの認証情報(例: API キーまたはトークン) |
auth_header | カタログサービスとの認証に使用するカスタム HTTP ヘッダー |
auth_scope | 認証用の OAuth2 スコープ(OAuth を使用する場合) |
storage_endpoint | バックエンドストレージのエンドポイント URL |
oauth_server_uri | 認証に使用する OAuth2 認可サーバーの URI |
vended_credentials | vended credentials(AWS 固有)を使用するかどうかを示す真偽値 |
aws_access_key_id | S3/Glue へのアクセス用 AWS アクセスキー ID(vended credentials を使用しない場合) |
aws_secret_access_key | S3/Glue へのアクセス用 AWS シークレットアクセスキー(vended credentials を使用しない場合) |
region | サービスの AWS リージョン(例: us-east-1) |
例
DataLakeCatalog エンジンの使用例については、以下のセクションを参照してください。
- Unity Catalog
- Glue Catalog
- OneLake Catalog
allow_experimental_database_icebergまたはallow_database_icebergを有効化することで利用できます。