为聊天消息创建补全结果。支持标准聊天、Partial Mode 和 Tool Use(函数调用)。
content 字段说明
content 字段支持以下两种形式:纯文本字符串type 字段区分类型:image_url 和 video_url 也支持直接传入字符串,效果等同于对象形式中的 url 字段:| 参数名称 | 是否必须 | 说明 | 类型 |
|---|---|---|---|
type | required | 内容类型 | "text" | "image_url" | "video_url" |
text | 当 type=text 时必填 | 文本内容 | string |
image_url | 当 type=image_url 时必填 | 用于传输图片,支持对象形式 {"url": "..."} 或直接传入 URL 字符串 | object | string |
video_url | 当 type=video_url 时必填 | 用于传输视频,支持对象形式 {"url": "..."} 或直接传入 URL 字符串 | object | string |
image_url 传入对象时,其字段说明如下:| 参数名称 | 是否必须 | 说明 | 类型 |
|---|---|---|---|
url | required | 使用 base64 编码或通过 file id 指定的图片内容 | string |
video_url 传入对象时,其字段说明如下:| 参数名称 | 是否必须 | 说明 | 类型 |
|---|---|---|---|
url | required | 使用 base64 编码或通过 file id 指定的视频内容,例如 data:video/mp4;base64,... | string |
url 字段)还是字符串简写,均支持以下两种格式:data:image/png;base64,... 或 data:video/mp4;base64,...ms://<file_id>包含迄今为止对话的消息列表。每个元素格式为 {"role": "user", "content": "你好"}。role 支持 system、user、assistant 其一,content 不得为空。content 字段可以是 string,也可以是 array[object](用于多模态输入)
模型 ID
kimi-k2.6 已弃用,请使用 max_completion_tokens
聊天补全生成的最大 Token 数量。如果不给的话,默认给一个不错的整数比如 1024。如果结果达到最大 Token 数而未结束,finish reason 将为 "length";否则为 "stop"。此值为期望返回的 Token 长度,而非输入加输出的总长度。如果输入加 max_completion_tokens 超出模型上下文窗口,将返回 invalid_request_error。
控制模型输出格式。默认值为 {"type": "text"},即纯文本输出。设置为 {"type": "json_object"} 可启用 JSON 模式,确保输出为合法 JSON 对象(需在 prompt 中引导模型输出 JSON 并指定格式)。设置为 {"type": "json_schema"} 可启用 Structured Output,按指定的 JSON Schema 约束输出结构(推荐,需配合 json_schema 字段使用)。如果您在使用 JSON Schema 时遇到校验问题,欢迎到 walle GitHub Issues (https://github.com/MoonshotAI/walle/issues) 提交反馈。
停用词,完全匹配时将停止输出。匹配到的词本身不会被输出。最多允许 5 个字符串,每个不超过 32 字节
是否以流式方式返回响应,默认 false
流式响应选项
模型可调用的工具列表
128用于缓存相似请求的响应以优化缓存命中率。对于 Coding Agent,通常是代表单个会话的 session id 或 task id;退出并恢复会话时应保持不变。对于 Kimi Code Plan,此字段为必填以提高缓存命中率。对于其他多轮对话 Agent,也建议使用此字段
用于检测可能违反使用政策的用户的稳定标识符。应为唯一标识每个用户的字符串。建议对用户名或邮箱进行哈希处理以避免发送可识别信息
控制 kimi-k2.6 模型是否启用思考能力,以及是否完整保留多轮对话中的 reasoning_content。可选参数,默认值为 {"type": "enabled"}。