Amazon DocumentDB 数据源配置指南
支持的 DocumentDB 版本
ClickPipes 支持 DocumentDB 5.0 版本。
配置变更流日志保留期
默认情况下,Amazon DocumentDB 的变更流日志保留期为 3 小时,而初始加载过程可能会根据 DocumentDB 中现有数据量的不同耗时更长。我们建议将变更流日志保留期设置为 72 小时或更长,以确保在初始快照完成之前日志不会被截断。
通过 AWS 控制台更新变更流日志保留期
- 在左侧面板中点击
Parameter groups,找到您的 DocumentDB 集群所使用的参数组(如果您正在使用默认参数组,则需要先创建一个新的参数组才能进行修改)。

- 搜索
change_stream_log_retention_duration,选择并将其编辑为259200(72 小时)

- 点击
Apply Changes以立即将修改后的参数组应用到您的 DocumentDB 集群。您应该看到参数组的状态先变为applying,在更改生效后再变为in-sync。


通过 AWS CLI 更新变更流日志保留期
或者,您也可以通过 AWS CLI 进行配置。
要检查当前的变更流日志保留期:
要将变更流日志保留时间设置为 72 小时:
配置数据库用户
以管理员用户身份连接到 DocumentDB 集群,并执行以下命令,为 MongoDB CDC ClickPipes 创建一个数据库用户:
注意
请确保将 clickpipes_user 和 some_secure_password 替换为你要使用的用户名和密码。
接下来
现在可以创建 ClickPipe,并开始将 DocumentDB 实例中的数据摄取到 ClickHouse Cloud 中。 请务必记录下在设置 DocumentDB 集群时使用的连接信息,因为在创建 ClickPipe 的过程中将需要这些信息。