データインジェスト
ClickHouse は、データ統合および変換のために数多くのソリューションと連携しています。 詳しくは、以下のページを参照してください。
| Data Ingestion Tool | 説明 |
|---|---|
| Airbyte | オープンソースのデータ統合プラットフォームです。ELT データパイプラインを構築でき、140 を超える標準搭載コネクタが提供されています。 |
| Apache Spark | シングルノードマシンまたはクラスター上で、データエンジニアリング、データサイエンス、および機械学習を実行するための多言語対応エンジンです。 |
| Apache Flink | Flink の DataStream API を通じて、ClickHouse へのリアルタイムなデータインジェストおよび処理を行うためのソリューションで、バッチ書き込みにも対応しています。 |
| Amazon Glue | Amazon Web Services (AWS) が提供するフルマネージドのサーバーレス型データ統合サービスであり、分析、機械学習、アプリケーション開発向けに、データの検出、準備、変換プロセスを簡素化します。 |
| Azure Synapse | Microsoft Azure が提供するフルマネージドのクラウド型分析サービスであり、ビッグデータとデータウェアハウジングを統合し、SQL、Apache Spark、データパイプラインを用いて、大規模なデータ統合・変換・分析を簡素化します。 |
| Azure Data Factory | クラウドベースのデータ統合サービスであり、大規模なデータワークフローを作成、スケジュール、およびオーケストレーションすることができます。 |
| Apache Beam | バッチおよびストリーム(継続的)データ処理パイプラインの定義と実行を可能にする、オープンソースの統一プログラミングモデルです。 |
| BladePipe | サブセカンドレイテンシでリアルタイムなエンドツーエンドのデータ統合を実現し、プラットフォーム間のシームレスなデータフローを可能にするツールです。 |
| dbt | アナリティクスエンジニアが、単に SELECT 文を書くことで、データウェアハウス内のデータを変換できるようにします。 |
| dlt | Python スクリプトに追加して使用できるオープンソースライブラリであり、多様でしばしば扱いにくいデータソースから、適切に構造化された最新のデータセットへデータをロードできます。 |
| Fivetran | クラウドデータプラットフォームから外部へ、内部へ、またプラットフォーム間でのデータ移動を自動化するデータムーブメントプラットフォームです。 |
| NiFi | ソフトウェアシステム間のデータフローを自動化するために設計された、オープンソースのワークフロー管理ソフトウェアです。 |
| Vector | 組織が自らのオブザーバビリティデータを制御できるようにする、高性能なオブザーバビリティデータパイプラインです。 |