Carizon LLM Gateway 的模型发布与平台更新 — 最新能力,第一时间用上
claude-fable-5 调用 /v1/messages 或 /v1/chat/completions 即可。temperature / top_p / top_k,也不接受显式 thinking: disabled(不需要思考时省略 thinking 参数即可)。需要控制思考深度请用 thinking: adaptive 搭配 output_config.effort。claude-opus-4-8 调用 /v1/messages 或 /v1/chat/completions 即可。temperature 与 top_p 采样参数。网关为原生透传——请从请求中移除这两个参数,否则上游会返回 400。embed-v-4-0 现支持字符串 input(此前仅数组 / OpenAI SDK 直接可用)