向量 - 千帆AI应用开发者中心-API参考qianfan-api

向量

更新时间：2025-06-03

POST

https://qianfan.baidubce.com/v2/embeddings

调试

根据输入内容生成对应的向量表示。

支持模型列表

支持模型列表请查看千帆ModelBuilder-模型列表-向量。

注意事项

（1）本文API，支持预置服务对应API和平台训练模型调用API。
（2）针对平台训练调用API，调用本文API前，需先经过SFT模型训练后发布服务，相关内容请参考新手指南-平台使用快速开始。

权限说明

调用本文API，需使用API Key鉴权方式。使用API Key鉴权调用API流程，具体调用流程，请查看认证鉴权。

请求参数

Headers 参数

除公共头域外，无其它特殊头域

Body 参数

model string

模型ID，
（1）预置服务，可选值请参考千帆ModelBuilder-模型列表-向量页，表格中model入参列
（2）平台训练模型或预置模型，可以通过查看服务详情获取该字段值，详情请查看千帆控制台-在线推理：model值为服务详情中对应的API名称，如下图所示：

必选

input anyOf {2}

多选一，只需要符合下列任意一组子节点

输入内容

必选

显示子属性隐藏子属性

input array

输入文本以获取embeddings，说明：
（1）不能为空List，List的每个成员不能为空字符串
（2）针对预置服务，不同模型文本数量等限制如下：
· Embedding-V1：文本数量不超过16，每个文本token数不超过384且长度不超过1000个字符
· bge-large-zh或bge-large-en：文本数量不超过16，每个文本token数不超过512且长度不超过2000个字符
· tao-8k：文本数量只能为1，文本token数不超过8192且长度不超过28000个字符

显示子属性隐藏子属性

items string

input array

针对多模态向量模型，说明：
（1）支持输入单个文本、单个图片或一对文本+图片
（2）适用模型：gme-Qwen2-VL-2B-Instruct

显示子属性隐藏子属性

items object {2}

显示子属性隐藏子属性

text string

文本

可选

image string

图片url或base64

可选

user string

表示最终用户的唯一标识符

可选

encoding_format string

当前只支持float

可选

请求结构

POST /v2/embeddings HTTP/1.1
Host: qianfan.baidubce.com
Authorization: authorization string
{
   "model": "embedding-v1" 
   "input":["White T-shirt"]
   
}

示例代码

文本向量请求示例多模态向量请求示例

Shell

Python

curl --location 'https://qianfan.baidubce.com/v2/embeddings' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer bce-v3/ALTAK-*********/614fb**********' \
--data '{
    "model": "embedding-v1",
    "input":["White T-shirt"]
}'

import requests
import json

def main():
    url = "https://qianfan.baidubce.com/v2/embeddings"
    
    payload = json.dumps({
        "model": "embedding-v1",
        "input":["White T-shirt"]
    })
    headers = {
        'Content-Type': 'application/json',
        'Authorization': 'Bearer bce-v3/ALTAK-*********/614fb**********'
    }
    
    response = requests.request("POST", url, headers=headers, data=payload)
    
    print(response.text)
    

if __name__ == '__main__':
    main()

Shell

Python

curl --location 'https://qianfan.baidubce.com/v2/embeddings' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer bce-v3/ALTAK-*********/614fb**********' \
--data '{
    "model": "gme-qwen2-vl-2b-instruct",
    "input": [
        {
            "text": "这个职业在国内的前景怎样？⽬前国内好像没有这个职业？Quant 这个职业在国内的前景怎样？⽬前国内好像没有这个职业？",
            "image": "https://i-blo******fa8a3.png"
        }
    ]
}'

import requests
import json

def main():
    url = "https://qianfan.baidubce.com/v2/embeddings"
    
    payload = json.dumps({
        "model": "gme-qwen2-vl-2b-instruct",
        "input": [
        {
            "text": "这个职业在国内的前景怎样？⽬前国内好像没有这个职业？Quant 这个职业在国内的前景怎样？⽬前国内好像没有这个职业？",
            "image": "https://i-blo******fa8a3.png"
        }
        ]
    })
    headers = {
        'Content-Type': 'application/json',
        'Authorization': 'Bearer bce-v3/ALTAK-*********/614fb**********'
    }
    
    response = requests.request("POST", url, headers=headers, data=payload)
    
    print(response.text)
    

if __name__ == '__main__':
    main()

返回响应

Headers 参数

除公共头域外，无其它特殊头域

返回参数

model string

模型ID

可选

id string

本轮对话的id

可选

object string

回包类型“list”

可选

created integer

时间戳

可选

data array

embedding信息，data成员数和文本数量保持一致

可选

显示子属性隐藏子属性

items object {3}

embedding信息

显示子属性隐藏子属性

object string

固定值embedding

可选

embedding array

embedding 内容

可选

显示子属性隐藏子属性

items number

index integer

序号

可选

usage object {4}

token统计信息

可选

显示子属性隐藏子属性

prompt_tokens integer

问题tokens数（包含历史QA）

可选

prompt_tokens_details integer

问题token详情，说明：当调用对话Chat API返回此参数

可选

completion_tokens integer

回答tokens数，说明：当调用对话Chat API返回此参数

可选

total_tokens integer

总tokens数

可选

响应示例

{
    "id": "as-xz2r36ena8",
    "object": "list",
    "created": 1737030777,
    "data": [
        {
            "object": "embedding",
            "embedding": [
                0.018346669152379036,
                0.009424751624464989,
                -0.009573426097631454,
                ...,
                -0.3628600239753723
            ],
            "index": 0
        }
    ],
    "model": "embedding-v1",
    "usage": {
        "prompt_tokens": 3,
        "total_tokens": 3
    }
}

错误码

如果请求错误，服务器返回的JSON文本包含以下参数。

名称	描述
code	错误码
message	错误描述信息，帮助理解和解决发生的错误
type	错误类型

更多相关错误码，请查看模型错误码说明。

百度智能云

千帆AI应用开发者中心-API参考 qianfan-api

千帆AI应用开发者中心-API参考 qianfan-api

向量

支持模型列表

注意事项

权限说明

请求参数

示例代码

返回响应

错误码