向量模型

更新时间：2025-06-05

什么是embedding

embedding是文本、图像的数值表示，可用于衡量语义相似度。应用场景包括：

推荐：根据输入推荐相关信息条目
聚类：按相似性对输入字符串进行分组
搜索：按相关性对搜索结果排序
异常检测：识别出相关性较小的异常值
多样性检测：分析输入字符的相似性分布
分类：按照相似性对输入字符进行分类两个向量之间的距离决定了它们的相关性。距离小表示相关性高，距离大表示相关性低。

如何使用向量模型

调用向量模型，输入文本或者图片或文本加图片以获取embeddings。model入参您想调用的向量模型，例如embedding-v1。

文本向量请求

针对文本向量模型，不同模型的文本数量限制不同，具体请参考模型列表文档。

                Bash
                
            

                curl --location 'https://qianfan.baidubce.com/v2/embeddings' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer bce-v3/ALTAK-*********/614fb**********' \
--data '{
    "model": "embedding-v1",
    "input":["White T-shirt"]
}'
            

多模态向量请求

多模态向量模型的input只允许传入1段文本信息、1段图片信息或者1段图片信息+1段文本信息。传入图片+文本对时，传入的信息会作为一个整体进行向量化。

单个图片大小最大支持10MB。支持的图片格式jpg、jpeg、png、bmp

图像url输入

                Bash
                
            

                curl --location 'https://qianfan.baidubce.com/v2/embeddings' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer bce-v3/ALTAK-*********/614fb**********' \
--header 'appid: app-cPX7dJkp' \
--header 'Content-Type: application/json' \
--data '{
    "model": "gme-qwen2-vl-2b-instruct",
    "input": [
        {
            "text": "这个职业在国内的前景怎样？⽬前国内好像没有这个职业？Quant 这个职业在国内的前景怎样？⽬前国内好像没有这个职业？",
            "image": "https://i-blog.csdnimg.cn/direct/1333f81802ed4030a3e01368cb8fa8a3.png#pic_center"
        }
    ]
}'
            

base64编码输入

base64编码需要以data:image/<图片格式>;base64,<Base64编码>格式来输入

                Bash
                
            

                curl --location 'https://qianfan.baidubce.com/v2/embeddings' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer bce-v3/ALTAK-*********/614fb**********' \
--header 'appid: app-cPX7dJkp' \
--header 'Content-Type: application/json' \
--data '{
    "model": "gme-qwen2-vl-2b-instruct",
    "input": [
        {
            "image": "data:image/<图片格式>;base64,<Base64编码>"
        }
    ]
}'
            

返回结果示例

返回中包含了向量信息（浮点list）和一些其他元数据。您可以提取向量，保存在向量数据库中在其他场景中使用。

                JSON
                
            

                {
    "id": "as-xz2r36ena8",
    "object": "list",
    "created": 1737030777,
    "data": [
        {
            "object": "embedding",
            "embedding": [
                0.018346669152379036,
                0.009424751624464989,
                -0.009573426097631454,
                ...,
                -0.3628600239753723
            ],
            "index": 0
        }
    ],
    "model": "embedding-v1",
    "usage": {
        "prompt_tokens": 3,
        "total_tokens": 3
    }
}
            

OpenAI SDK兼容请求示例

文本向量

                Python
                
                from openai import OpenAI

client = OpenAI(
    api_key="bce-v3/ALTAK-xxxxx",
    base_url="https://qianfan.baidubce.com/v2" 
)

response = client.embeddings.create(
           model= "embedding-v1",
           input=["White T-shirt"])

print(response.data[0].embedding)

多模态向量

获取文本+图像（url）对的向量

                Python
                
            

                from openai import OpenAI
client = OpenAI(
    api_key="bce-v3/ALTAK-xxxxx",
    base_url="https://qianfan.baidubce.com/v2"
)

def get_embedding(text, model="gme-qwen2-vl-2b-instruct"):
    return client.embeddings.create(input = text, model=model).data[0].embedding

get_embedding(
    [
        {
            "text": "这个职业在国内的前景怎样？⽬前国内好像没有这个职业？Quant 这个职业在国内的前景怎样？⽬前国内好像没有这个职业？",
            "image": "https://i-blog.csdnimg.cn/direct/1333f81802ed4030a3e01368cb8fa8a3.png#pic_center" 
            #url格式传入
          
        }
    ]
)
            

获取单个图像（base64）向量

                Python
                
            

                from openai import OpenAI
client = OpenAI(
    api_key="bce-v3/ALTAK-xxxxx",
    base_url="https://qianfan.baidubce.com/v2"
)

def get_embedding(text, model="gme-qwen2-vl-2b-instruct"):
    return client.embeddings.create(input = text, model=model).data[0].embedding

get_embedding(
    [
        {         
            "image": f"data:image/jpeg;base64,{base64_image}
            #图片以base64格式传入。单次请求只能传1张图
        }
    ]
)
            

图片生成

重排序模型

百度智能云

千帆AI应用开发者中心-开始使用 qianfan-docs