POST
/
api
/
knowledgebases
/
{knowledgebaseId}
/
datasets
建立資料集
curl --request POST \
  --url https://app.pathors.com/api/knowledgebases/{knowledgebaseId}/datasets \
  --header 'Content-Type: <content-type>' \
  --header 'x-api-key: <x-api-key>' \
  --data '{}'
{
  "message": "<string>",
  "success": true
}

建立資料集

在指定的知識庫中上傳和建立新的資料集。資料集將被處理並嵌入以供語義搜尋使用。

端點

POST /api/knowledgebases/{knowledgebaseId}/datasets

路徑參數

knowledgebaseId
string
required
將建立資料集的知識庫的唯一標識符

請求標頭

x-api-key
string
required
您的專案API金鑰用於身份驗證
Content-Type
string
required
必須是 multipart/form-data

請求體

dataset
file
required
要上傳的資料集檔案。支援的格式:PDF、TXT、DOCX和其他基於文字的格式
請求範例:
curl -X POST \
  -H "x-api-key: your_api_key" \
  -F "dataset=@/path/to/your/file.pdf" \
  https://your-domain.com/api/knowledgebases/kb_abc123/datasets

回應

返回成功訊息,表示資料集已上傳並正在處理中。
message
string
描述上傳狀態的成功訊息
success
boolean
指示上傳是否成功
回應範例:
{
  "message": "Dataset Uploaded successfully, currently embedding in the background",
  "success": true
}

錯誤回應

狀態碼描述
400無效請求(缺少檔案、無效格式或知識庫ID)
401無效的API金鑰
404知識庫未找到或存取被拒絕
500內部伺服器錯誤

處理流程

  1. 上傳驗證: 驗證檔案格式和大小
  2. 知識庫驗證: 確保知識庫存在並屬於您的專案
  3. 檔案儲存: 資料集儲存在系統中
  4. 背景處理: 資料集非同步處理和嵌入
  5. 分塊: 內容被分割成可搜尋的塊
  6. 嵌入: 塊轉換為向量嵌入用於語義搜尋

支援的檔案格式

  • PDF文檔
  • 純文字檔案 (.txt)
  • Microsoft Word文檔 (.docx)
  • 其他基於文字的格式

使用說明

  • 處理在上傳後非同步進行
  • 大檔案可能需要幾分鐘來處理
  • 您可以透過資料集列表端點檢查處理狀態
  • 知識庫必須存在並屬於您的專案
  • 適用檔案大小限制(檢查您的計劃限制)

從舊端點遷移

如果您正在從已棄用的 /api/datasets 端點遷移:
  1. 首先,使用取得知識庫取得您的知識庫ID
  2. 更新您的API呼叫以在URL路徑中包含知識庫ID
  3. 請求體格式保持不變

相關端點