> ## Documentation Index
> Fetch the complete documentation index at: https://platform.kimi.com/docs/llms.txt
> Use this file to discover all available pages before exploring further.

# 生成模型 Kimi K2 定价

export const DocTable = ({columns = [], rows = []}) => {
  return <div className="doc-table-wrap">
      <table className="doc-table">
        {columns.length > 0 ? <colgroup>
            {columns.map((column, index) => <col key={index} style={column.width ? {
    width: column.width
  } : undefined} />)}
          </colgroup> : null}
        <thead>
          <tr>
            {columns.map((column, index) => <th key={index}>{column.title}</th>)}
          </tr>
        </thead>
        <tbody>
          {rows.map((row, rowIndex) => <tr key={rowIndex}>
              {row.map((cell, cellIndex) => <td key={cellIndex}>{cell}</td>)}
            </tr>)}
        </tbody>
      </table>
    </div>;
};

## 产品定价

<DocTable
  columns={[
{ title: "模型", width: "24%" },
{ title: "计费单位", width: "12%" },
{ title: "输入价格（缓存命中）", width: "16%" },
{ title: "输入价格（缓存未命中）", width: "16%" },
{ title: "输出价格", width: "14%" },
{ title: "上下文窗口", width: "18%" },
]}
  rows={[
["kimi-k2-0905-preview", "1M tokens", "¥1.00", "¥4.00", "¥16.00", "262,144 tokens"],
["kimi-k2-0711-preview", "1M tokens", "¥1.00", "¥4.00", "¥16.00", "131,072 tokens"],
["kimi-k2-turbo-preview", "1M tokens", "¥1.00", "¥8.00", "¥58.00", "262,144 tokens"],
["kimi-k2-thinking", "1M tokens", "¥1.00", "¥4.00", "¥16.00", "262,144 tokens"],
["kimi-k2-thinking-turbo", "1M tokens", "¥1.00", "¥8.00", "¥58.00", "262,144 tokens"],
]}
/>

此处 1M = 1,000,000，表格中的价格代表每消耗 1M tokens 的价格。

> `kimi-k2` 系列模型将在 **2026 年 5 月 25 日下线**，将不再维护和支持。请直接使用 Kimi 最新模型 [kimi-k2.6](/guide/kimi-k2-6-quickstart)，以获得持续支持和更强推理能力。

## 模型说明

* Kimi K2 是一款具备超强代码和 Agent 能力的 MoE 架构基础模型，总参数 1T，激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类别的基准性能测试中，K2 模型的性能超过其他主流开源模型
* kimi-k2-0905-preview 模型上下文长度 256k，在 kimi-k2-0711-preview 能力的基础上，具备更强的 Agentic Coding 能力、更突出的前端代码的美观度和实用性、以及更好的上下文理解能力
* kimi-k2-turbo-preview 模型上下文长度 256k，是 Kimi K2 的高速版本模型，始终对标最新版本的 Kimi K2 模型（kimi-k2-0905-preview）。模型参数与 Kimi K2 一致，但输出速度已提至每秒 60 tokens，最高可达每秒 100 tokens
* kimi-k2-0711-preview 模型上下文长度为 128k
* kimi-k2-thinking 模型上下文长度 256k，是具有通用 Agentic 能力和推理能力的思考模型，它擅长深度推理[使用须知](/guide/use-kimi-k2-thinking-model)
* kimi-k2-thinking-turbo 模型上下文长度 256k，是 kimi-k2-thinking 模型的高速版，适用于需要深度推理和追求极致高速的场景
* 支持 ToolCalls、JSON Mode、Partial Mode、联网搜索功能等，不支持视觉功能
* 支持自动上下文缓存功能，缓存命中的 tokens 将按照输入价格（缓存命中）单价收费，您可以在[控制台](https://platform.kimi.com/console)中查看"context caching"类型的费用明细
