- 接口流控
千帆 SDK 内设了多种参数供用户设置,目前支持如下三种配置方式,按优先级从低到高排序:
-
从 DotEnv 文件中读取。参考配置文件以及参数类型点此。SDK 默认读取工作目录下的
.env
文件进行配置,用户可以在程序运行前设置环境变量QIANFAN_DOT_ENV_CONFIG_FILE
来指定需要使用的配置文件。 -
通过环境变量读取。可配置的参数与方式 1 相同。举个例子,在代码中,用户可以这么设置:
# 通过环境变量传递
import os
os.environ["QIANFAN_ACCESS_KEY"]="..."
os.environ["QIANFAN_SECRET_KEY"]="..."
NOTE: 如果在代码中使用环境变量进行配置,请在设置时,将相关设置代码置于实际使用的代码前:
import os import qianfan # 这样设置的参数是生效的 os.environ["QIANFAN_QPS_LIMIT"] = "1" qianfan.ChatCompletion() # 这样设置的参数是不生效的 qianfan.ChatCompletion() os.environ["QIANFAN_QPS_LIMIT"] = "1"
- 在代码中通过
get_config()
获取全局配置单例,并直接修改字段值。这种方式的优先级最高,且设置即生效。
import qianfan
config = qianfan.get_config()
config.AccessKey = "..."
config.SecretKey = "..."
chat_comp = qianfan.ChatCompletion()
千帆 SDK 支持对用户接口的请求进行限流,以防止超额请求带来的潜在问题。
如果用户调用的是 ERNIE 系列的模型,千帆 SDK 会自动从平台获取限流配置。 此时用户也可以自己指定限流配置,千帆 SDK 会取两者中较小的那一个。
如果用户使用的是第三方模型,则需要自行配置限流。
现在的限流配置包括两类三种:
-
请求频率类:
query_per_second
: 设置一个 QPS 限制,为正浮点数request_per_minute
: 设置一个 RPM 限制,会限制每分钟请求的次数,为正浮点数
上述两种参数只能同时使用一个
-
文字总量类:
token_per_minute
: 设置一个 TPM 限制,代表每分钟内可以消耗的 Token 总数,为正整数
用户可以在创建相关请求对象时,传入上述参数来设置限流配置,如:
import qianfan
chat_comp = qianfan.ChatCompletion(
request_per_minute=300,
token_per_minute=300000,
)
也可以通过系统环境变量来设置
import os
os.environ["QIANFAN_RPM_LIMIT"] = "300"
os.environ["QIANFAN_QPS_LIMIT"] = "1"
os.environ["QIANFAN_TPM_LIMIT"] = "30000"
在千帆 SDK 中,所有限流器都是按照特定的 Key 进行分组的。所有具有相同 Key 的限流器会被归为一组,同一组的限流器会共享一个令牌桶。 默认情况下,所有请求对象在初始化时会根据鉴权信息和请求 URL 来自动确认使用的 Key 并按照该 Key 进行限流。
用户也可以在初始化时选择手动传入一个 Key,以实现自定义的限流分组:
from qianfan import ChatCompletion
chat_comp = ChatCompletion(key="your_key")
在千帆 SDK 中,我们还实现了多机流控的功能,以防止不同机器上的请求因超限而失败。
为了使用该功能,用户需要手动配置一台 Redis 服务器,并且在创建请求对象时将链接信息传入其中:
import qianfan
from qianfan.resources.rate_limiter import RedisConnectionInfo
chat_comp = qianfan.ChatCompletion(
request_per_minute=300,
token_per_minute=300000,
redis_rate_limiter=True,
# 链接参数不传时默认链接到 127.0.0.1:6379?db=0
redis_connection_info=RedisConnectionInfo(host="", port=6379, password="", db=0)
)
千帆SDK支持对用户对接口请求进行track,可以传入request_id
作为参数以标记一次resources api 调用, 并在返回值中的header X-Baidu-Request-id
得到相对应的request_id
不传入request的情况下,sdk将生成随机的request_id
示例如下:
import qianfan
chat_comp = qianfan.Completion()
resp = chat_comp.do(prompt="hi", request_id="sdk_req_01")
千帆SDK在运行时可能会默认使用home
目录作为缓存父目录,如果存在问题可以配置环境变量QIANFAN_CACHE_DIR
或者.env文件以进行适配:
#.env
QIANFAN_CACHE_DIR="./custom_cache_dir"
or
os.environ["QIANFAN_CACHE_DIR"] = "./custom_cache_dir"