建立資料集
在指定的知識庫中上傳和建立新的資料集。資料集將被處理並嵌入以供語義搜尋使用。端點
路徑參數
將建立資料集的知識庫的唯一標識符
請求標頭
您的專案API金鑰用於身份驗證
必須是
multipart/form-data
請求體
要上傳的資料集檔案。支援的格式:PDF、TXT、DOCX和其他基於文字的格式
回應
返回成功訊息,表示資料集已上傳並正在處理中。描述上傳狀態的成功訊息
指示上傳是否成功
錯誤回應
狀態碼 | 描述 |
---|---|
400 | 無效請求(缺少檔案、無效格式或知識庫ID) |
401 | 無效的API金鑰 |
404 | 知識庫未找到或存取被拒絕 |
500 | 內部伺服器錯誤 |
處理流程
- 上傳驗證: 驗證檔案格式和大小
- 知識庫驗證: 確保知識庫存在並屬於您的專案
- 檔案儲存: 資料集儲存在系統中
- 背景處理: 資料集非同步處理和嵌入
- 分塊: 內容被分割成可搜尋的塊
- 嵌入: 塊轉換為向量嵌入用於語義搜尋
支援的檔案格式
- PDF文檔
- 純文字檔案 (.txt)
- Microsoft Word文檔 (.docx)
- 其他基於文字的格式
使用說明
- 處理在上傳後非同步進行
- 大檔案可能需要幾分鐘來處理
- 您可以透過資料集列表端點檢查處理狀態
- 知識庫必須存在並屬於您的專案
- 適用檔案大小限制(檢查您的計劃限制)
從舊端點遷移
如果您正在從已棄用的/api/datasets
端點遷移:
- 首先,使用取得知識庫取得您的知識庫ID
- 更新您的API呼叫以在URL路徑中包含知識庫ID
- 請求體格式保持不變