跳到主要内容

数据空间 (Data Spaces)

数据空间 (DuckLake) 是 Datadata 平台提供的数据托管服务,基于 DuckDB 引擎,让你可以在平台上直接创建和管理数据表。

什么是数据空间

数据空间是平台托管的数据存储,具有以下特点:

  • 基于 DuckDB 引擎
  • 直接通过 API 或 AI Skills 进行表的创建、写入和删除
  • 可以与外部数据源一起参与跨源关联查询

创建数据空间

  1. 在 Studio 侧边栏点击 数据源
  2. 点击 新建数据源新建数据空间
  3. 填写数据空间名称
  4. 创建完成

管理数据空间中的表

通过 API 可以执行以下操作:

操作API 权限说明
创建表data-spaces:write在数据空间中建表
批量插入数据data-spaces:write向表中写入数据
删除表data-spaces:write删除已有表
查询数据data-spaces:read读取数据空间中的数据

使用场景

  • 数据清洗 — 将 CSV 等文件上传后,通过 DQL 脚本进行清洗和转换
  • 中间结果存储 — 保存数据处理的中间结果供后续分析
  • 数据集成 — 将来自不同数据源的数据整合到统一的数据空间