更新动态 · Carizon LLM Gateway

06-10

模型发布

Claude Fable 5 上线 NEW Anthropic

Anthropic 全新最高档旗舰（Opus 之上的新层级）—— 迄今最强的推理与长程任务能力。即刻可用，无需申请白名单。

100 万 token 上下文 / 128K 最大输出

自适应思考默认开启（adaptive thinking，模型自主决定思考深度）

视觉理解：图片 + 文本混合输入

工具调用 / 函数调用（tool use）

流式输出（SSE，OpenAI / Anthropic 双协议）

提示缓存：5 分钟 & 1 小时两档

输入 / 1M

$10

输出 / 1M

$50

缓存读取 / 1M

$1.00

定位

Opus 之上

直接用模型名 claude-fable-5 调用 /v1/messages 或 /v1/chat/completions 即可。

⚠️ 参数注意：Fable 5 不接受 temperature / top_p / top_k，也不接受显式 thinking: disabled（不需要思考时省略 thinking 参数即可）。需要控制思考深度请用 thinking: adaptive 搭配 output_config.effort。

去操练场试用 → 查看完整定价

05-29

模型发布

Claude Opus 4.8 上线 NEW Anthropic

Anthropic 最新一代旗舰 Opus —— 复杂推理、长上下文写作与代码能力再上一层。即刻可用，无需申请白名单。

100 万 token 上下文（标准价，不额外加价）

视觉理解：图片 + 文本混合输入

工具调用 / 函数调用（tool use）

流式输出（SSE，OpenAI / Anthropic 双协议）

提示缓存：5 分钟 & 1 小时两档

全新 tokenizer（4.7 起，性能更优）

输入 / 1M

$5

输出 / 1M

$25

缓存读取 / 1M

$0.50

对比上代 4.1

省 3×

直接用模型名 claude-opus-4-8 调用 /v1/messages 或 /v1/chat/completions 即可。

💡 小贴士：Opus 4.7 / 4.8 上游已弃用 temperature 与 top_p 采样参数。网关为原生透传——请从请求中移除这两个参数，否则上游会返回 400。

去操练场试用 → 查看完整定价

05-28

平台升级

网关引擎升级至 v7.1.28 Platform

路由引擎从 7.1.22 升级到 7.1.28，零停机平滑切换，对调用方完全无感。

usage 统计增强：服务等级（service tier）追踪

缓存 token 计入总量，账单更精准

Claude ↔ OpenAI 推理签名翻译修复

流式工具调用增量修复

05-29

稳定性

计费与兼容性加固 Fix

一轮深度计费 / 使用排查后的修复合集。

Embeddings embed-v-4-0 现支持字符串 input（此前仅数组 / OpenAI SDK 直接可用）

缓存监控页冷查询 3.6s → 16ms（7 天范围，约 230×）

操练场报错正确展示真实信息（不再显示 [object Object]）

落地页“在线模型”计数与模型广场对齐

05-24

模型扩充

模型矩阵持续扩充 Models

一个 OpenAI 兼容接口，一个 key，覆盖对话 / 代码 / 图像 / 视频 / 语音 / 向量。

对话：GPT-5.5 / 5.5 Pro、Gemini 3.1 Pro、Grok 4.3、DeepSeek V4

多模态：gpt-image-2（图像）、gpt-audio-1.5（语音对话）

语音：gpt-realtime 转写 / 翻译

向量：text-embedding-3、embed-v-4-0（Cohere 多语言）

看全部模型 →