一个兼容 OpenAI 的统一入口,连接最优的 AI 模型供给。按策略路由,撮合实时卖家容量,从第一条请求开始就看得见价格、可靠性和结算。
AI 模型端点
24+
DeepSeek、Qwen、GLM、Kimi、MiniMax 等主流供给。
买方路由模式
3x
成本优先、均衡、可靠性优先三种策略档位。
OpenAI 兼容 API
100%
同一个 base URL 覆盖 chat、embeddings、audio、image、video。
统一结算流
1 ledger
路由尝试、成交、费用、reserve 和 payout 都在同一条账本里。
from openai import OpenAI
client = OpenAI(
base_url="https://dragonfly-api.com/v1",
api_key="sk-df-your-key",
default_headers={
"x-routing-profile": "balanced",
}
)
response = client.chat.completions.create(
model="deepseek/deepseek-chat",
messages=[{"role": "user", "content": "把这个请求路由到当前最优卖盘。"}],
stream=True
)
# 价格、卖家资格与结算全程可见
print(response.choices[0].message.content)|命中最优卖盘
买方策略会对实时卖家容量执行价格、时延和信任过滤后再成交。
费用 + reserve 已记录
路由尝试、卖家 payout、reserve 与平台毛利都落到同一条账本里,而不是变成黑盒。
像开发者控制台一样使用 Dragonfly,但别失去市场视角:当前最优输入/输出卖价、卖家深度和看板新鲜度都应该一眼可见。
快照模式
上次刷新 等待首次拉取看板
看板状态
快照
可见模型
4
活跃卖家
—
Dragonfly 应该像开发者的执行终端:价格可见,策略明确,运维可追踪。
撮合
需求会和已挂出的供给撮合,按模型展示透明的最优卖价,而不是模糊的 provider 切换。
控制
一个 routing profile 可以绑定多把 key,把成本、时延、provider 和隐私约束落实到请求时。
恢复
当严格预算档位无法成交时,下一档价格可以有意识地接管,而不是静默失败或默认过付。
可见性
每个请求都会产生 route_attempt、route_result 和 settlement_result,让运维与财务看到同一事实。
市场
买方定义 guardrail,卖方发布上架、容量、健康度和 payout floor,全部在同一套市场系统里完成。
发布
产品承诺保持窄而可信:支持的客户端、reserve 规则、验证门槛和可观测执行都明确写清。
买方意图通过策略撮合匹配到卖方供给。
绑定在 key 上的 profile 定义预算、时延、provider 和隐私约束。
找到最优可成交上架,执行回退梯度,并发出路由事件。
请求在挂出的容量上执行,冷却期后再完成结算。
透明竞争,加上显式策略控制。
卖家用真实 ask 竞争,买方进入的是一个真正有价差的市场,而不是抽象 provider 池。
每次路由和结算都会被记录下来,你可以在同一条流里同时排查可靠性和经济性。
买方支付、卖方 payout、平台费用和 reserve 都是显式、可审计的。
Profile 可以强制最大价格、provider allow/deny 集和时延/吞吐约束。