如何在设置DataPipeline以将DynamoDB数据导出到S3时计算'DynamoDB读取吞吐量比率'

如何在设置DataPipeline以将DynamoDB数据导出到S3时计算'DynamoDB读取吞吐量比率'

问题描述:

我有一个带有〜16M记录的DynamoDB,其中每个记录的大小为4k。该表配置为自动调节目标利用率:70%,读取的最小配置容量:250和写入的最大配置容量:3000.如何在设置DataPipeline以将DynamoDB数据导出到S3时计算'DynamoDB读取吞吐量比率'

我试图设置数据管道将DynamoDB备份到S3。管道配置要求为Read Throughput Ratio,默认情况下为0.25。

所以问题是如何计算Read Throughput Ratio备份大约1小时的表。我了解读取容量单位。 Read Throughput Ratio如何与Read Capacity UnitsAuto Scaling Configuration相关?

理论上RCU是4KB,所以如果您将数据量除以4KB,您将获得读取给定秒的完整数据所需的总RCU。因此,如果将此值除以60 * 60(分钟*秒)达1小时,您将获得所需的RCU配置,但需要考虑设置EMR群集所需的时间。 但我很困惑这将如何表现如果自动缩放配置到特定的表。