GET
/
api
/
knowledgebases
/
{knowledgebaseId}
/
datasets
获取数据集
curl --request GET \
  --url https://app.pathors.com/api/knowledgebases/{knowledgebaseId}/datasets \
  --header 'x-api-key: <x-api-key>'
{
  "id": "<string>",
  "filename": "<string>",
  "fileUrl": "<string>",
  "extensionType": "<string>",
  "size": 123,
  "isParsed": true,
  "createdAt": "<string>",
  "updatedAt": "<string>"
}

获取数据集

检索属于指定知识库的所有数据集。

端点

GET /api/knowledgebases/{knowledgebaseId}/datasets

路径参数

knowledgebaseId
string
required
要从中检索数据集的知识库的唯一标识符

请求头

x-api-key
string
required
您的项目API密钥用于身份验证
请求示例:
curl -X GET \
  -H "x-api-key: your_api_key" \
  https://your-domain.com/api/knowledgebases/kb_abc123/datasets

响应

返回属于指定知识库的数据集数组。
id
string
数据集的唯一标识符
filename
string
上传数据集的原始文件名
fileUrl
string
下载原始文件的URL
extensionType
string
数据集的文件扩展名
size
number
文件大小(字节)
isParsed
boolean
数据集是否已处理并嵌入
createdAt
string
数据集创建时的ISO时间戳
updatedAt
string
数据集最后更新时的ISO时间戳
响应示例:
[
  {
    "id": "dataset_abc123",
    "filename": "company-handbook.pdf",
    "fileUrl": "https://your-domain.com/api/datasets/dataset_abc123.pdf",
    "extensionType": "pdf",
    "size": 2048000,
    "isParsed": true,
    "createdAt": "2024-01-15T10:30:00Z",
    "updatedAt": "2024-01-15T10:35:00Z"
  }
]

错误响应

状态码描述
400缺少知识库ID
401无效的API密钥
404知识库未找到或访问被拒绝
500内部服务器错误

响应详情

处理状态

  • isParsed: true - 数据集已完全处理并可用于搜索
  • isParsed: false - 数据集仍在后台处理中

文件访问

  • 使用 fileUrl 下载原始上传的文件
  • URL包含数据集ID和文件扩展名
  • 文件以适当的内容类型提供

使用说明

  • 仅返回属于指定知识库的数据集
  • 知识库必须属于您的项目(通过API密钥验证)
  • 结果按创建日期排序(最新的在前)
  • 处理状态帮助跟踪哪些数据集已准备就绪可供使用

从旧端点迁移

如果您正在从已弃用的 /api/datasets 端点迁移:
  1. 首先,使用获取知识库获取您的知识库ID
  2. 更新您的API调用以在URL路径中包含知识库ID
  3. 响应格式保持不变

相关端点