更新动态

Carizon LLM Gateway 的模型发布与平台更新 — 最新能力,第一时间用上

06-10
模型发布

Claude Fable 5 上线 NEW Anthropic

Anthropic 全新最高档旗舰(Opus 之上的新层级)—— 迄今最强的推理与长程任务能力。即刻可用,无需申请白名单。
100 万 token 上下文 / 128K 最大输出
自适应思考默认开启(adaptive thinking,模型自主决定思考深度)
视觉理解:图片 + 文本混合输入
工具调用 / 函数调用(tool use)
流式输出(SSE,OpenAI / Anthropic 双协议)
提示缓存:5 分钟 & 1 小时两档
输入 / 1M
$10
输出 / 1M
$50
缓存读取 / 1M
$1.00
定位
Opus 之上
直接用模型名 claude-fable-5 调用 /v1/messages/v1/chat/completions 即可。
⚠️ 参数注意:Fable 5 不接受 temperature / top_p / top_k,也不接受显式 thinking: disabled(不需要思考时省略 thinking 参数即可)。需要控制思考深度请用 thinking: adaptive 搭配 output_config.effort
05-29
模型发布

Claude Opus 4.8 上线 NEW Anthropic

Anthropic 最新一代旗舰 Opus —— 复杂推理、长上下文写作与代码能力再上一层。即刻可用,无需申请白名单。
100 万 token 上下文(标准价,不额外加价)
视觉理解:图片 + 文本混合输入
工具调用 / 函数调用(tool use)
流式输出(SSE,OpenAI / Anthropic 双协议)
提示缓存:5 分钟 & 1 小时两档
全新 tokenizer(4.7 起,性能更优)
输入 / 1M
$5
输出 / 1M
$25
缓存读取 / 1M
$0.50
对比上代 4.1
省 3×
直接用模型名 claude-opus-4-8 调用 /v1/messages/v1/chat/completions 即可。
💡 小贴士:Opus 4.7 / 4.8 上游已弃用 temperaturetop_p 采样参数。网关为原生透传——请从请求中移除这两个参数,否则上游会返回 400。
05-28
平台升级

网关引擎升级至 v7.1.28 Platform

路由引擎从 7.1.22 升级到 7.1.28,零停机平滑切换,对调用方完全无感。
usage 统计增强:服务等级(service tier)追踪
缓存 token 计入总量,账单更精准
Claude ↔ OpenAI 推理签名翻译修复
流式工具调用增量修复
05-29
稳定性

计费与兼容性加固 Fix

一轮深度计费 / 使用排查后的修复合集。
Embeddings embed-v-4-0 现支持字符串 input(此前仅数组 / OpenAI SDK 直接可用)
缓存监控页冷查询 3.6s → 16ms(7 天范围,约 230×)
操练场报错正确展示真实信息(不再显示 [object Object])
落地页“在线模型”计数与模型广场对齐
05-24
模型扩充

模型矩阵持续扩充 Models

一个 OpenAI 兼容接口,一个 key,覆盖对话 / 代码 / 图像 / 视频 / 语音 / 向量。
对话:GPT-5.5 / 5.5 Pro、Gemini 3.1 Pro、Grok 4.3、DeepSeek V4
多模态:gpt-image-2(图像)、gpt-audio-1.5(语音对话)
语音:gpt-realtime 转写 / 翻译
向量:text-embedding-3、embed-v-4-0(Cohere 多语言)
想要某个还没上线的模型?联系 Carizon IT 提需求。