向量
根据输入内容生成对应的向量表示。
支持模型列表
支持模型列表请查看千帆ModelBuilder-模型列表-向量。
注意事项
(1)本文API,支持预置服务对应API和平台训练模型调用API。
(2)针对平台训练调用API,调用本文API前,需先经过SFT模型训练后发布服务,相关内容请参考新手指南-平台使用快速开始。
权限说明
调用本文API,需使用API Key鉴权方式。使用API Key鉴权调用API流程,具体调用流程,请查看认证鉴权。
请求参数
模型ID,
(1)预置服务,可选值请参考千帆ModelBuilder-模型列表-向量页,表格中model入参列
(2)平台训练模型或预置模型,可以通过查看服务详情获取该字段值,详情请查看千帆控制台-在线推理:model值为服务详情中对应的API名称,如下图所示:
多选一,只需要符合下列任意一组子节点
输入内容
显示子属性
隐藏子属性
输入文本以获取embeddings,说明:
(1)不能为空List,List的每个成员不能为空字符串
(2)针对预置服务,不同模型文本数量等限制如下:
· Embedding-V1:文本数量不超过16,每个文本token数不超过384且长度不超过1000个字符
· bge-large-zh或bge-large-en:文本数量不超过16,每个文本token数不超过512且长度不超过2000个字符
· tao-8k:文本数量只能为1,文本token数不超过8192且长度不超过28000个字符
显示子属性
隐藏子属性
针对多模态向量模型,说明:
(1)支持输入单个文本、单个图片或一对文本+图片
(2)适用模型:gme-Qwen2-VL-2B-Instruct
显示子属性
隐藏子属性
显示子属性
隐藏子属性
文本
图片url或base64
表示最终用户的唯一标识符
当前只支持float
POST /v2/embeddings HTTP/1.1
Host: qianfan.baidubce.com
Authorization: authorization string
{
"model": "embedding-v1"
"input":["White T-shirt"]
}
示例代码
curl --location 'https://qianfan.baidubce.com/v2/embeddings' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer bce-v3/ALTAK-*********/614fb**********' \
--data '{
"model": "embedding-v1",
"input":["White T-shirt"]
}'
import requests
import json
def main():
url = "https://qianfan.baidubce.com/v2/embeddings"
payload = json.dumps({
"model": "embedding-v1",
"input":["White T-shirt"]
})
headers = {
'Content-Type': 'application/json',
'Authorization': 'Bearer bce-v3/ALTAK-*********/614fb**********'
}
response = requests.request("POST", url, headers=headers, data=payload)
print(response.text)
if __name__ == '__main__':
main()
curl --location 'https://qianfan.baidubce.com/v2/embeddings' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer bce-v3/ALTAK-*********/614fb**********' \
--data '{
"model": "gme-qwen2-vl-2b-instruct",
"input": [
{
"text": "这个职业在国内的前景怎样?⽬前国内好像没有这个职业?Quant 这个职业在国内的前景怎样?⽬前国内好像没有这个职业?",
"image": "https://i-blo******fa8a3.png"
}
]
}'
import requests
import json
def main():
url = "https://qianfan.baidubce.com/v2/embeddings"
payload = json.dumps({
"model": "gme-qwen2-vl-2b-instruct",
"input": [
{
"text": "这个职业在国内的前景怎样?⽬前国内好像没有这个职业?Quant 这个职业在国内的前景怎样?⽬前国内好像没有这个职业?",
"image": "https://i-blo******fa8a3.png"
}
]
})
headers = {
'Content-Type': 'application/json',
'Authorization': 'Bearer bce-v3/ALTAK-*********/614fb**********'
}
response = requests.request("POST", url, headers=headers, data=payload)
print(response.text)
if __name__ == '__main__':
main()
返回响应
模型ID
本轮对话的id
回包类型“list”
时间戳
embedding信息,data成员数和文本数量保持一致
显示子属性
隐藏子属性
embedding信息
显示子属性
隐藏子属性
固定值embedding
embedding 内容
显示子属性
隐藏子属性
序号
token统计信息
显示子属性
隐藏子属性
问题tokens数(包含历史QA)
问题token详情,说明:当调用对话Chat API返回此参数
回答tokens数,说明:当调用对话Chat API返回此参数
总tokens数
{
"id": "as-xz2r36ena8",
"object": "list",
"created": 1737030777,
"data": [
{
"object": "embedding",
"embedding": [
0.018346669152379036,
0.009424751624464989,
-0.009573426097631454,
...,
-0.3628600239753723
],
"index": 0
}
],
"model": "embedding-v1",
"usage": {
"prompt_tokens": 3,
"total_tokens": 3
}
}
错误码
如果请求错误,服务器返回的JSON文本包含以下参数。
名称 | 描述 |
---|---|
code | 错误码 |
message | 错误描述信息,帮助理解和解决发生的错误 |
type | 错误类型 |
更多相关错误码,请查看模型错误码说明。