POST
/
api
/
datasets
创建数据集
curl --request POST \
  --url https://app.pathors.com/api/datasets \
  --header 'Content-Type: application/json' \
  --header 'x-api-key: <x-api-key>' \
  --data '{}'

创建数据集

创建并将新数据集嵌入到您指定的知识库中。

上传数据集

路径参数

knowledgebaseId
string
required
要添加数据集的知识库 ID

请求头

x-api-key
string
required
用于认证的项目 API 密钥

请求体

请求应以 multipart/form-data 格式发送,包含以下字段:
dataset
file
required
要上传和嵌入的数据集文件
请求示例:
curl -X POST \
  -H "x-api-key: your-api-key" \
  -F "dataset=@/path/to/your/file.pdf" \
  https://api.pathors.com/api/datasets

响应

成功的请求将返回 201 状态码,表示数据集已成功创建。

处理流程

当数据集上传后:
  1. 文件被安全存储
  2. 内容被分割成可管理的片段
  3. 使用知识库配置的嵌入模型对每个片段进行嵌入
  4. 嵌入向量被存储以供后续查询

支持的文件类型

支持以下文件扩展名:
  • PDF (.pdf)
  • 文本文件 (.txt)

错误响应

状态码描述
400无效请求或不支持的文件类型
401无效的 API 密钥
404未找到知识库
413文件过大
500内部服务器错误

使用说明

  • 大文件可能需要更长的处理时间,这是由于嵌入过程所致
  • 文件大小上限为 10MB
  • 文件处理是异步的 - 使用 获取数据集 端点检查处理状态
  • 每个数据集会自动被分割成适合检索的片段