湖仓定价
新一代 Amazon SageMaker 基于开放式湖仓架构构建,该架构可整合您在 Amazon Simple Storage Service(Amazon S3)数据湖(包括 S3 表)和 Amazon Redshift 数据仓库中的所有数据,帮助您基于单一数据副本构建功能强大的分析和人工智能/机器学习应用程序。您只需为在湖仓中使用的资源付费。元数据存储和 API 请求遵循 AWS Glue Data Catalog 定价,包括 AWS Free Tier。数据存储和计算成本取决于您选择的 Amazon S3 或 Amazon Redshift 托管存储(RMS)。以下是相关基础资源的定价说明。
元数据:使用 AWS Glue Data Catalog 将数据定义按目录、数据库和表的逻辑层次结构进行组织。
- 目录:一种逻辑容器,用于保存数据存储的对象,例如架构、表、视图或 Amazon Redshift 中的实体化视图。您可以在目录下嵌套目录,以匹配您带到湖仓的数据来源中的层次结构级别。
- 数据库:数据库可用于组织湖仓中的表和视图等数据对象。
- 表和视图:表和视图是数据库中的数据对象,描述如何访问基础数据,例如架构、分区、存储位置、存储格式和用于访问数据的 SQL 查询。
可以通过 AWS Glue API 访问湖仓中的元数据。对于元数据存储和 API 请求,适用 AWS Glue Data Catalog 元数据定价,包括 AWS Free Tier。有关更多信息,请访问 AWS Glue 定价。
数据存储和访问:在访问湖仓中的数据时,您可以读取和写入数据到 Amazon S3 或 RMS。根据您选择在湖仓中存储数据的存储类型,访问底层存储将产生额外的存储和计算成本。访问 AWS Glue 定价,了解有关存储类型的存储和计算定价的更多信息。
统计数据和 Apache Iceberg 表维护:您可以自动收集 Amazon S3 中的数据湖表的统计数据,以加快查询执行速度,也可以自动维护 Apache Iceberg 表(例如压缩),以优化 Apache Iceberg 表的存储布局。启用这些功能后,将产生额外费用。有关更多信息,请访问 AWS Glue 定价。
权限:精细权限由 AWS Lake Formation 提供支持,且不额外收费。如需了解更多信息,请访问 Lake Formation 定价。
零 ETL 集成成本
SageMaker 与应用程序实现零 ETL 集成,无需构建和管理提取、转换、加载(ETL)管道。支持的应用程序包括 Salesforce、ServiceNow、Zendesk 等。
这些集成为您提供灵活性,让您可以选择应用程序中的特定数据表,以自动复制到 Amazon Redshift。这种灵活性使您能够跨多个应用程序和数据来源运行统一的分析。AWS 不对零 ETL 集成收取额外费用。您需要为用于创建和处理在零 ETL 集成过程中创建的变更数据的现有资源付费。这包括用于存储复制数据的额外 Amazon Redshift 存储、用于处理数据复制的计算资源(或 Amazon Redshift Serverless 上的 RPU)以及将数据从源移动到目标的跨可用区数据传输成本。通过零 ETL 集成对数据变更进行的持续处理无需另行付费。有关更多信息,请访问 Amazon Aurora 定价、Amazon Relational Database (Amazon RDS) for MySQL 定价、Amazon DynamoDB 定价和 AWS Glue 定价。