从0到1上手星河社区大模型API服务-新增ERNIE-4.5多模态调用!

星河社区大模型 API 服务背靠百度智能云千帆平台,提供文心大模型能力,兼容 openai-python SDK。含文本、图像、词向量生成及函数调用等功能,支持 ERNIE 系列等文本模型、Stable Diffusion XL 图像模型及 embedding-v1 等向量模型。需访问令牌和 Tokens,提供多种调用示例,助力开发提效。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

从0到1上手星河社区大模型api服务-新增ernie-4.5多模态调用! - 创想鸟

什么是星河社区提供的大模型API服务?

星河社区提供的大模型API服务是为开发者提供的一套基础的大模型 API 服务,背靠百度智能云千帆平台,提供文心大模型能力。

该大模型 API 服务兼容openai-python SDK,开发者可以直接使用原生的 openai-python SDK来调用文心大模型服务。

从0到1上手星河社区大模型API服务-新增ERNIE-4.5多模态调用! - 创想鸟

本项目将带你了解大模型API服务基本用法,包含文本生成&图像生成&词向量生成&函数调用等功能,助力开发提效!

支持的模型

文本模型

模型名称 传入model参数名 特点 适用场景

ERNIE 4.5(8k)ernie-4.5-8k-preview- 最强大的文心多模态系列模型
– 支持8k上下文
– 多模态理解能力强- 通用任务
– 多模态理解deepseek-r1deepseek-r1- 强大的推理模型
– 支持8k上下文
– 推理能力强- 复杂任务
– 长文本理解ERNIE 4.0 Turbo (128k/8k)ernie-4.0-turbo-8k/ernie-4.0-turbo-128k- 最新旗舰模型
– 支持128k/8k上下文
– 推理能力强- 复杂任务
– 长文本理解
– 创意写作ERNIE 4.0 (8k)ernie-4.0-8k- 推理能力强
– 文本推理
– 文本理解- 日常对话
– 文本生成
– 通用任务ERNIE 3.5 (8k)ernie-3.5-8k- 性能稳定
– 响应速度快
– 成本适中- 日常对话
– 文本生成
– 通用任务ERNIE Speed (128k/8k)ernie-speed-8k/ernie-speed-128k- 极速响应
– 支持长文本
– 资源占用低- 实时交互
– 简单问答
– 批量处理ERNIE Lite/Tiny (8k)ernie-lite-8k- 轻量级模型
– 资源占用最少
– 速度最快- 移动端应用
– 简单任务
– 对话机器人

图像模型

模型名称 传入model参数名 特点 支持的风格

Stable Diffusion XLStable Diffusion XL- 高质量图像生成
– 多种艺术风格
– 精确控制- Base (基础风格)
– Anime (动漫风格)
– 3D Model (3D建模)
– Photographic (摄影风格)
– Digital Art (数字艺术)
– 更多风格…

向量模型

模型名称 传入model参数名 嵌入维度 size数量 单文本字符长度

embedding-v1embedding-v1384161000bge-large-zhbge-large-zh10245122000

准备

访问令牌

访问令牌用于 AI Studio 用户进行身份验证,可通过访问令牌向 AI Studio 执行授权范围(如大模型 API 的调用权限,仓库相关的读取访问权限等)指定的特定操作。可前往个人中心的 访问令牌页面 查看个人专属 access token。

Tokens

Tokens 为星河社区上调用大模型SDK或使用大模型应用的最终计量单位,星河社区为每个开发者提供了100万的免费 Tokens 额度。开发者使用不同的模型会扣除不同数量的Tokens,Token 收支明细可查看使用明细。若Tokens 已消耗完,可购买 Tokens 后再使用。

服务域名

用星河社区提供的大模型 API 服务的域名地址: https://aistudio.baidu.com/llm/lmapi/v3

在使用 openai-python 调用星河大模型 API 服务时,需要将

指定 api_key = “令牌(Access Token)”

指定 base_url = “https://aistudio.baidu.com/llm/lmapi/v3”

环境准备

In [ ]

!pip install openai pillow requests IPython

配置访问令牌

请先在AI Studio访问令牌页面获取access token,然后运行:

从0到1上手星河社区大模型API服务-新增ERNIE-4.5多模态调用! - 创想鸟

In [11]

from openai import OpenAI  # OpenAI SDK主要库from IPython.display import display, Image  # 用于在notebook中显示图片import requests  # 用于下载图片import json  # 用于处理JSON数据api_key = "在这里填写你的访问令牌" # https://aistudio.baidu.com/account/accessTokenclient = OpenAI(    api_key=api_key,    base_url="https://aistudio.baidu.com/llm/lmapi/v3" # 星河社区大模型API服务的BaseURL)

新增支持ERNIE-4.5多模态能力调用,快来试试吧!

In [4]

#多模态-文字输入import osfrom openai import OpenAIcompletion = client.chat.completions.create(        model="ernie-4.5-8k-preview",        messages=[            {                'role': 'user', 'content': [                    {                        "type": "text",                        "text": "介绍几个北京著名景点"                    }                ]               }        ]    )print(completion.choices[0].message.content or "")#流式输出:#for chunk in completion:#    if (len(chunk.choices) > 0):#        print(chunk.choices[0].delta.content, end="", flush=True)
北京作为中国的首都,历史悠久、文化底蕴深厚,拥有众多著名景点。以下是几个具有代表性的景点介绍:### 1. **故宫博物院**   - **简介**:位于北京市中心,是中国明清两代的皇家宫殿,也是世界上现存规模最大、保存最完整的木质结构古建筑群。   - **特色**:     - 占地面积约72万平方米,拥有9000多间房屋。     - 珍藏大量文物,如《清明上河图》、青铜器、陶瓷等。     - 建筑风格融合了中国传统建筑艺术的精华,如太和殿、乾清宫等。   - **建议**:游览时建议提前预约门票,并预留充足时间参观。### 2. **天安门广场**   - **简介**:位于北京市中心,是世界上最大的城市广场之一,也是中国重要的政治和文化象征。   - **特色**:     - 广场中央矗立着人民英雄纪念碑和毛主席纪念堂。     - 周边有中国国家博物馆、人民大会堂等重要建筑。     - 每日清晨的升旗仪式和傍晚的降旗仪式吸引大量游客。   - **建议**:参观时需遵守广场规定,注意安全。### 3. **长城(八达岭、慕田峪等)**   - **简介**:长城是中国古代伟大的防御工程,北京段以八达岭和慕田峪最为著名。   - **特色**:     - 八达岭长城地势险要,建筑雄伟,是明长城的精华部分。     - 慕田峪长城以秀美著称,游客较少,适合徒步和摄影。     - 长城四季景色各异,春秋两季尤为迷人。   - **建议**:穿着舒适的鞋子,注意天气变化,可选择缆车或徒步攀登。### 4. **颐和园**   - **简介**:中国现存最大的皇家园林,位于北京西郊,以昆明湖和万寿山为主要组成部分。   - **特色**:     - 园林设计融合了江南水乡的婉约与北方皇家的大气。     - 著名景点包括长廊、十七孔桥、佛香阁等。     - 春季的樱花和秋季的枫叶是摄影爱好者的天堂。   - **建议**:可乘船游览昆明湖,感受园林的宁静与美丽。### 5. **天坛公园**   - **简介**:明清两代皇帝祭天、祈谷的地方,是中国现存最大的古代祭祀建筑群。   - **特色**:     - 主要建筑包括祈年殿、回音壁、圜丘等。     - 祈年殿的圆形建筑象征“天圆地方”,是中国古代建筑艺术的杰作。     - 公园内古树参天,环境清幽,适合散步和休闲。   - **建议**:清晨或傍晚时分游览,可避开人流高峰。### 6. **圆明园**   - **简介**:曾被誉为“万园之园”,是清代皇家园林,1860年被英法联军焚毁。   - **特色**:     - 遗址公园内保留了大量残垣断壁,见证了历史的沧桑。     - 西洋楼景区是圆明园中唯一基本保持原貌的区域。     - 园内有大片水域和植被,四季景色各异。   - **建议**:参观时可结合历史背景,感受其文化价值。### 7. **南锣鼓巷**   - **简介**:北京最古老的街区之一,保存了元大都时期的胡同格局。   - **特色**:     - 胡同内有许多传统四合院和特色小店。     - 融合了老北京文化与现代商业,是体验北京胡同文化的绝佳地点。     - 美食众多,如老北京炸酱面、豆汁儿、糖葫芦等。   - **建议**:傍晚时分游览,可感受胡同的烟火气。### 8. **奥林匹克公园**   - **简介**:2008年北京奥运会的主会场所在地,包括鸟巢(国家体育场)、水立方(国家游泳中心)等标志性建筑。   - **特色**:     - 鸟巢和水立方的现代建筑设计令人震撼。     - 公园内有广阔的绿地和景观,适合休闲和运动。     - 夜晚灯光璀璨,是拍照打卡的好地方。   - **建议**:可参观奥运博物馆,了解奥运历史。### 9. **798艺术区**   - **简介**:原为工厂区,现改造为当代艺术聚集地,充满艺术气息。   - **特色**:     - 聚集了大量画廊、艺术工作室和创意店铺。     - 经常举办艺术展览和文化活动。     - 建筑风格独特,融合了工业与现代艺术元素。   - **建议**:适合喜欢艺术和摄影的游客。### 10. **北海公园**   - **简介**:中国现存最悠久、保存最完整的皇家园林之一,位于北京市中心。   - **特色**:     - 以琼华岛和白塔为中心,湖光塔影,景色宜人。     - 曾是清代皇家的避暑胜地。     - 园内有许多古建筑和碑刻,文化底蕴深厚。   - **建议**:可乘船游览,感受皇家园林的宁静与美丽。### 总结北京的著名景点涵盖了历史、文化、自然和现代艺术等多个方面,无论是喜欢古迹的游客,还是偏爱现代建筑的旅行者,都能在这里找到心仪的去处。建议根据兴趣和时间安排,选择几个重点景点深入游览,同时体验北京的传统美食和胡同文化,感受这座城市的独特魅力。

In [6]

#多模态-图片输入(URL)import osfrom openai import OpenAIcompletion = client.chat.completions.create(        model="ernie-4.5-8k-preview",        messages=[            {                'role': 'user', 'content': [                    {                        "type": "image_url",                        "image_url": {                            "url": "https://testimage.bj.bcebos.com/image1.jpg"                        }                    }                ]               }        ],        stream=True,    )for chunk in completion:    if (len(chunk.choices) > 0):        print(chunk.choices[0].delta.content, end="", flush=True)
这是一幅自然风景图,画面展现了一条蜿蜒的木质栈道穿过一片广阔的绿色草地。栈道两侧是茂盛的草丛和一些低矮的灌木,远处可以看到一片树木,天空湛蓝,点缀着几朵白云,整体氛围宁静而美丽。可以从以下几个方面用英语描述这幅图:1. **栈道 (Boardwalk)**:   - A wooden boardwalk winds through the lush green field, inviting visitors to explore the natural landscape.2. **草地 (Grassland)**:   - The grassland is vibrant and green, stretching out on both sides of the boardwalk, creating a serene and picturesque scene.3. **植被 (Vegetation)**:   - Various types of grasses and low shrubs dominate the area, with a line of trees visible in the distance, adding depth to the landscape.4. **天空 (Sky)**:   - The sky is a brilliant blue, dotted with a few fluffy white clouds, enhancing the overall tranquility of the scene.5. **整体氛围 (Overall Atmosphere)**:   - The image exudes a sense of peace and natural beauty, making it an ideal spot for a leisurely walk or simply enjoying the outdoors.综合起来,可以用以下段落描述这幅图:This image captures a serene natural landscape featuring a wooden boardwalk that winds through a vibrant green grassland. The lush vegetation, including various grasses and low shrubs, stretches out on both sides of the path, leading to a line of trees in the distance. The sky above is a brilliant blue, dotted with a few fluffy white clouds, adding to the overall tranquility of the scene. This picturesque setting invites visitors to take a leisurely walk and enjoy the beauty of nature.

In [ ]

#多模态-图片输入(base64)-流式import osfrom openai import OpenAIdef encode_image(image_path):    with open(image_path, "rb") as image_file:        return base64.b64encode(image_file.read()).decode("utf-8")        # Path to your imageimage_path = "/image_1.png" #这里要上传自己的图片并添加路径,不然会报错# Getting the Base64 stringbase64_image = encode_image(image_path)completion = client.chat.completions.create(        model="ernie-4.5-8k-preview",        messages=[            {                'role': 'user', 'content': [                    {                        "type": "image_url",                        "image_url": {                            "url": "https://testimage.bj.bcebos.com/image1.jpg"                        }                    }                ]               }        ],        stream=True,    )for chunk in completion:    if (len(chunk.choices) > 0):        print(chunk.choices[0].delta.content, end="", flush=True)

In [8]

#多模态-图片+文本输入-流式import osfrom openai import OpenAIcompletion = client.chat.completions.create(        model="ernie-4.5-8k-preview",        messages=[            {                "role": "user",                "content": [                    {                        "type": "text",                        "text": "图片里有什么?这两张图片有什么不同?请用中文回答"                    },                    {                        "type": "image_url",                        "image_url": {                            "url": "https://testimage.bj.bcebos.com/image1.jpg"                        }                    },                    {                        "type": "image_url",                        "image_url": {                            "url": "https://testimage.bj.bcebos.com/image2.png"                        }                    }                ]            }        ],        stream=True,    )for chunk in completion:    if (len(chunk.choices) > 0):        print(chunk.choices[0].delta.content, end="", flush=True)
图片1展示的是一片自然景观,有一条木板路穿过茂密的绿色草地,背景是蓝天和一些树木。图片2展示的是一个人正在用手指触碰一个手工制作的物品,这个物品似乎是由绿色和蓝色的材料制成,有类似植物和动物的形状。这两张图片的不同之处在于:1. 图片1是自然景观,而图片2是人工制作的物品。2. 图片1展示的是户外的广阔场景,而图片2是一个特写镜头,聚焦于手工物品的细节。3. 图片1没有人出现,而图片2有一只手在触碰物品。4. 图片1的颜色主要是自然的绿色和蓝色,而图片2的颜色虽然也有绿色和蓝色,但更多的是材料的色彩和质感。

注意:

大模型每一次调用都是无状态的,您需要自行管理传入给模型的信息。如果需要模型多次理解同一张图像,请在每次请求时都传入该图。

支持单图和多图,每一张图片大小不超过10MB,多张图片输入的总token不超过模型上下文长度。如ERNIE-4.5模型,不超过8K token的图片输入。

图片格式:

a. 图片base64:JPG、JPEG、PNG和BMP类型,传入的格式需为:data:image/;base64,

b. 图片公网url:支持JPG、JPEG、PNG、BMP和WEBP类型

使用方法详解

1. 文本生成

基础对话

让我们从最简单的对话开始:

In [3]

# 基础文本生成示例# 这是最简单的API调用方式,适合单轮对话场景response = client.chat.completions.create(    # messages是一个列表,包含对话历史    messages=[        {            'role': 'user',  # 角色可以是user(用户)、assistant(AI)或system(系统提示)            'content': '写一首关于春天的诗'  # 具体的对话内容        }    ],    model="ernie-3.5-8k",  # 选择使用的模型,这里使用的是ernie-3.5-8k)# 从响应中获取生成的内容print("AI创作的诗:n")print(response.choices[0].message.content)  # choices[0]表示第一个(也是唯一的)回复
AI创作的诗:春日春日融融万物苏,柳丝轻拂绿波湖。桃花含笑迎新客,燕子衔泥筑旧屋。风暖花红春意满,雨酥草嫩景色足。一年好景在此时,莫负春光莫负吾。

多轮对话示例

下面展示如何进行连续的对话:

In [4]

# 多轮对话示例# 通过维护messages列表来实现多轮对话# 初始化对话历史,设置AI角色messages = [    {        "role": "system",  # system角色用于设置AI的行为和角色        "content": "你是一位专业的诗歌创作者"  # 设定AI的角色和行为    }]# 第一轮对话:请求AI创作诗歌messages.append({"role": "user", "content": "写一首关于春天的诗"})response = client.chat.completions.create(    model="ernie-3.5-8k",    messages=messages  # 传入完整的对话历史)print("第一轮 - AI创作的诗:n")print(response.choices[0].message.content)# 将AI的回复添加到对话历史中,这很重要!messages.append({"role": "assistant", "content": response.choices[0].message.content})
第一轮 - AI创作的诗:春归春风吹过草丛稀,万物复苏生机迸。花开满园映日红,蜂蝶翩翩舞轻轻。绿叶蔓延穿过枝,柳絮飘落似霞细。江水潺潺流不息,山川秀美添新翠。田间耕耘人欢畅,笑语盈盈歌飘荡。夜来春雨润无声,晨曦微露露珠亮。愿得此景常相伴,年年岁岁春如归。心中欢喜无限意,共赏春光醉芳菲。

In [6]

# 第二轮对话:请求改写诗歌print("n让我们请AI改写这首诗:n")messages.append({"role": "user", "content": "把这首诗改写成现代诗的风格"})response = client.chat.completions.create(    model="ernie-4.0-8k",    messages=messages  # AI会根据完整的对话历史进行回复)print("第二轮 - AI改写的现代诗:n")print(response.choices[0].message.content)
让我们请AI改写这首诗:第二轮 - AI改写的现代诗:春归(现代诗版)春风轻拂过稀疏的草丛,万物悄然复苏,生机勃发。花园中,花儿热烈绽放,映照着红日,显得分外艳丽。蜂蝶舞动,轻盈而自由,绿叶在枝头欢快地伸展。柳絮如霞,轻盈飘落,为大地增添了一抹细腻的春意。田间,人们欢笑着耕耘,笑语和歌声交织在空气中。春雨在夜晚悄然降临,晨曦中,晶莹的露珠闪耀。愿这春日的景象永驻,年年岁岁,春天如期而至。心中满是欢喜与期待,在这春光中,我们沉醉于花的芬芳。

打印思维链(DeepSeek-R1)

In [1]

#流式import osfrom openai import OpenAIcompletion = client.chat.completions.create(    model="deepseek-r1",    messages=[        {'role': 'system', 'content': '你是 AI Studio 实训AI开发平台的开发者助理,你精通开发相关的知识,负责给开发者提供搜索帮助建议。'},        {'role': 'user', 'content': '你好,请介绍一下AI Studio'}    ],    stream=True,)for chunk in completion:    if (len(chunk.choices) > 0):        if hasattr(chunk.choices[0].delta, 'reasoning_content') and chunk.choices[0].delta.reasoning_content:            print(chunk.choices[0].delta.reasoning_content, end="", flush=True)        else:            print(chunk.choices[0].delta.content, end="", flush=True)
好的,我现在要帮用户介绍AI Studio。首先,用户可能刚接触这个平台,需要了解基本信息。我应该先查证AI Studio的所属公司,确保信息准确。记得之前百度的飞桨平台有一个AI Studio,可能就是这个。然后要确定它的主要功能和用户群体,比如是否面向学生、研究人员还是企业开发者。用户可能需要知道平台提供的资源,比如数据集、算力支持、教程等。另外,用户可能关心是否需要付费,或者有没有免费资源。需要确认是否有GPU/TPU加速,这对深度学习项目很重要。还有社区和支持,比如比赛、项目分享,这些能帮助用户学习和交流。还要考虑用户的使用场景,比如学术研究、项目开发或者学习AI。不同的场景可能需要强调不同的功能。比如,对于学习者,教程和实验环境很重要;对于开发者,模型部署和协作工具可能更关键。可能需要检查是否存在混淆,比如其他公司的类似产品,如Google的AI Platform,但用户明确提到AI Studio,应聚焦在正确的产品上。最后确保语言简洁明了,结构清晰,分点列出,方便用户快速获取信息。AI Studio 是百度推出的 **一站式AI开发平台**,主要服务于机器学习、深度学习开发者,提供从数据预处理、模型训练到部署的全流程支持。以下是核心功能的详细介绍:---### **1. 核心功能**- **在线编程环境**    - 支持 **Jupyter Notebook**,无需配置本地环境,直接在线编写、调试代码。  - 预装主流深度学习框架(如PaddlePaddle、PyTorch、TensorFlow),开箱即用。- **免费算力资源**    - 提供 **GPU(如V100、A100)和TPU** 算力卡,适合训练大规模模型。  - 每日登录可领取算力时长,学生和开发者可低成本实践复杂项目。- **丰富数据集与模型库**    - 内置 **AI竞赛数据集**(如图像分类、NLP)、公开数据集(如COCO、ImageNet)。  - 预训练模型库覆盖CV、NLP、语音等领域,支持快速迁移学习。- **项目协作与部署**    - 支持多人协作开发,代码、数据实时共享。  - 提供模型一键部署到云端或边缘设备的工具链(如Paddle Serving、Lite)。---### **2. 适用场景**- **教育与学习**    - 配套 **免费课程与实战项目**(如Python入门、CV入门),适合零基础学习者。  - 高校合作项目提供学分认证,例如《深度学习导论》实践课。- **竞赛与社区**    - 定期举办AI竞赛(如中国高校计算机大赛),提供奖金与实习机会。  - 活跃的开发者社区可分享项目、获取反馈,加速问题解决。- **企业级开发**    - 支持工业级模型开发,如OCR、智能推荐系统。  - 与百度云无缝集成,可直接部署至BML(Baidu Machine Learning)平台。---### **3. 使用成本**- **免费基础版**:提供基础GPU算力(如Tesla V100 4小时/天)及存储空间。- **付费升级**:专业版和企业版提供更高算力配额、私有数据集及专属技术支持。---### **4. 特色优势**- **国产化支持**:深度适配国产芯片(如昆仑芯),助力自主可控AI生态。- **中文友好**:文档、教程、社区支持全中文,降低语言门槛。- **实战导向**:提供端到端项目案例(如车牌识别、对话生成),即学即用。---如果需要进一步了解具体功能(如如何调用预训练模型)或实战案例,可以告诉我你的需求方向(如CV/NLP),我会提供更针对性的指导! 

以上就是从0到1上手星河社区大模型API服务-新增ERNIE-4.5多模态调用!的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/72443.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月13日 16:02:03
下一篇 2025年11月13日 16:41:45

相关推荐

发表回复

登录后才能评论
关注微信