群聊周报 Vol.1｜我花两天用 AI 整理了一年账单，然后开始算 AI 的账

发表于 2026/05/30

作者 AI生产力训练营群友

30 分钟阅读

※ 本周报素材来自鸭哥创建的 AI 从业者微信群。群友均以匿名昵称出现。完整每日日报在 GitHub 上每日发布：https://louyu2015.github.io/AI-chatgroup-daily/
文章由作者和 Claude Opus 联合撰写。题图由 GPT-Images 2 生成。

我用 AI 整理了一年银行账单，爽完之后开始肉疼

前阵子我干了件特别”AI 原住民”的事——让 AI 帮我把一整年、好几个账户的银行流水全下载下来，清洗、归类，与我的记账软件记录的数据对比。

以前我是怎么做的呢？我需要一个文件一个文件地下载，一行一行地比对。现在我只要登录自己的银行账号，一句话扔过去，电脑就自己翻网页、吐出一段分析，就像有一个隐形人在操作电脑一样。爽是真的爽，可代价也来了：token 烧得太快，我大概一个多小时就用光了 Claude Code 的 5 小时限额。我只好轮流薅 Gemini CLI、Codex 和 Claude Code 的限额，硬是折腾了两天才跑完。我不是一个人，在 AI 群里，有大量重度用户在苦苦等着限额重置。@豁达的灰熊有一句精准吐槽：

每天跟做手游每日任务一样把额度用完。

后来我又算了另外一笔账。我自己有个机器人每天用 Claude API 总结群聊日报，一天差不多花费 1 美元，一个月就是 30 美元。作为一个心甘情愿掏钱的 AI 爱好者，我咬咬牙也就认了。可如果是一个普通人，会仅仅为了”帮我读读群聊”这么个小工具，每月心甘情愿地掏 30 美元吗？

这恰恰是这周群里吵得最热的那条暗线：我们现在享受的 AI 价格，根本不是真实的。

微软嫌贵砍了 Claude Code

最近，一个新闻在群里被热议。微软取消了内部的 Claude Code 订阅，原因是成本不可控。要知道，这可是一家 3 万亿美元市值、净利润上千亿的公司。

@勇敢的鸵鸟当即扔了个问题：

Cancel Claude Code 怎么能减少 token usage？Copilot 不是一样用 tokens。

一句话把真正的痛点拎了出来。贵的不是”用 Claude”还是”用 Copilot”，贵的是”按 token 计费”这个模式第一次把被订阅制隐藏的成本明晃晃亮给了所有人看。

坏消息接踵而至。Uber CTO 发内部备忘录说公司四个月就烧光了全年 AI 预算，一个工程师每月 Claude Code 花掉 500 到 2000 美元；GitHub Copilot 从固定费率切成按量计费，小红书上立刻有人晒出爆掉的账单。@稳重的海豚说额度”转眼就没了”，已经在把工作流从 Claude 迁往 Codex。@低调的北极熊体感更猛：

用量真的是指数增长的……基建完备的情况下可以 24h 不停。

200 美元的月卡，真实成本 8000 美元

@沉稳的仓鼠发了一张用 AI 做的信息图：根据 SemiAnalysis 测算，200 美元一个月的 coding 套餐，按 API 实际消耗折算下来大概值 5000 到 8000 美元！当然 API 零售价不等于真实成本。Anthropic 推理毛利率约 70%，实际算力成本约为其三分之一，但依然是亏损的。这不叫良心定价，这叫补贴。

更直接的证据是 OpenAI 自己承认的。早在 2025 年初，Sam Altman 就公开说，昂贵的 200 美元 ChatGPT Pro 套餐竟是赔本买卖——”人们用得比我们预期多太多”。

那么问题来了：谁在替我们这些用户买这个单？

“外卖大战”烧到了美国

答案是 VC 投资。这剧情我们刚看过一遍——中国的外卖大战。

2025 年，美团、阿里、京东为了抢即时零售，半年里直接烧掉了 800 到 1000 亿人民币的补贴。结果是什么？美团从 2024 年盈利 358 亿，直接转成 2025 年预亏最高 243 亿。三毛钱一杯的咖啡，是真金白银堆出来的，目的只有一个：烧死对手、锁住用户。

AI 这边，剧本一模一样，只是数字更夸张。OpenAI 2024 年亏约 50 亿美元，2026 年一年预计要亏 140 亿。a16z 干脆把 AI 订阅类比成 Uber 早期定价。你以为是市场价，其实是投资人在替你花钱。

群里 @直率的鹦鹉无意间还原了”外卖红包”的现场：他说这个月综合成本最低的居然是 ChatGPT Pro，因为”各种重置各种 2x 额度”。你品品：额度重置、加倍赠送，不就是打车红包和外卖满减换了个皮吗？

补贴要还了，但不是简单地”涨价”

外卖大战的结局我们都知道：补贴退潮、价格回归、监管出手。AI 的补贴，也快还了。

退潮就发生在现在。2025 年 8 月，Anthropic 头一回给 Claude 订阅加了每周限额，超出部分要按 API 原价另买。同年，Cursor 把固定额度悄悄换成积分池，很多用户超额爆了账单，逼得官方公开道歉退款。最狠的一刀发生在今年 4 月：Anthropic 禁止 OpenClaw 这类第三方工具借订阅的壳调用 Claude，同时逐渐收紧各种绕过方式，这种补贴它再也烧不起了。一年之内，几乎所有主流工具都在做同一件事：计量、限额、加钱。

催债的是 IPO。SpaceX、OpenAI、Anthropic 三家几乎同期递交上市文件，总估值超过 3.5 万亿美元。一旦上市，财报压力就来了。你不能一边喊着给股东谋福利，一边继续给用户发”满减券”。

不过不是”AI 公司”集体勒裤腰带——两家虽然都还在净亏，但亏损的性质完全不同。Anthropic 本季度预计将交出首份转正的季度经营利润（注意只是经营利润，不包括训练和股权激励等成本），推理毛利率约 70%，基本盘是 toB。它的亏损主要亏在前瞻性的训练投入上。而 OpenAI 今年即将净亏约 140 亿，上季度的经营利润率约为 -122%，预计 2029–2030 年才能转正，亏损大头在 toC 业务——9 亿用户里只有约 5.5% 在付费。@80-HD 看得透：

2C 就是比 2B 难赚钱。

所以补贴这事，对 OpenAI 是战略刚需，它需要消费端的规模叙事来撑住近万亿估值的 IPO；Anthropic 的企业端已经快盈利了，还在主动收紧消费端额度，反倒不必硬撑。

天花板在升，地板在塌

那以后 AI 到底是变贵还是变便宜？我的看法是：涨价和降价都在发生，只是它们说的不是同一个东西。

先说顶尖模型的天花板——它会一直往上升。想让模型变得更聪明会越来越难。据 Epoch AI 统计，前沿模型的训练成本这些年差不多每年涨 2.4 倍。最典型的是 Anthropic 还没正式发布的 Mythos——泄漏的内部文件显示该模型规模达到了 10 万亿参数，官方后续公布的描述也说”对我们服务成本极高，对客户使用成本也极高”，目前只放给少数企业和政府做预览。最强的那个模型，注定一直贵，因为”更聪明”本身就没有止境。

再说地板，它在飞快地塌。”够用”的模型正在以肉眼可见的速度变白菜价：

DeepSeek 把训练成本压到极致——V3 的训练只花了约 600 万美元、280 万 GPU 小时，而同级别的 Llama 3 405B 要 3080 万 GPU 小时，效率差一个数量级。DeepSeek 用的 FP8、MLA、MoE、MTP 这些招数，全是开源、人人可用的。
硬件也在降本。英伟达 Blackwell 比上一代每百万 token 成本降 15 倍；新一代 GB300 对推理任务做到每兆瓦吞吐 50 倍、单 token 成本 1/35。
算下来，经济档模型的价格”半衰期”只有 1.1 年，比摩尔定律的 2 年还快。token 价格两年降了近 280 倍。

这里要较个真：严格说这已经不是”摩尔定律”了。经典摩尔定律（靠制程缩小）其实正在失速。Blackwell 几乎没有真正的制程进步，性能翻倍靠的是架构和系统级协同设计。所以推动地板下塌的，不是晶体管，是整套系统的协同优化。

天花板上升、地板塌陷，中间的剪刀差越拉越大。所以”涨价派”和”降价派”其实都没错——他们只是一个在仰头看天花板，一个在低头看地板。

如果说过去两年用 AI 的关键词是”能不能实现自动化”，那接下来的关键词，是“这事到底配不配得上最贵的模型”。

补贴退潮 + 成本下降，合起来其实是个好消息。你不必为所有任务都付最高价。整理银行流水、跑个格式转换、总结群聊这些活，一个便宜十倍的”够用”模型完全扛得住，没必要动用 Opus 这种高级脑子。你可以把贵模型留给真正难、真正需要判断力的环节，然后用便宜的模型处理量大的工作。

值得注意的是，单价跌了不代表你账单会变少，因为成本下降以后，你就会让它干更多活。真正省钱的，不是少用 AI，而是给每个任务派一个配得上它的模型。

野蛮生长的时代培养了我们”不看价格用 AI”的习惯。这个习惯需要改一改了。

办公室变成了”高端呼叫中心”

硅谷创业公司的办公室最近有了个新外号：高端呼叫中心。@低调的仓鼠转发了 TechCrunch 的观察：一位 VC 说他走进办公室，没人打字，也没人开会，却有一屋子工程师压着嗓子对着电脑嘟嘟囔囔。原来他们正在用语音输入法指挥 AI 干活。

我也在干同样的事，只不过我的段位还很低。我只是拿 iPhone 自带语音输入法写提示词，避免手酸。但中英文一混、术语一多，iPhone 的识别就乱套了，一些错别字甚至会把 AI 误导到沟里去。而且说实话，我只会在家里这么做，真要在公司对着电脑念叨，感觉有点奇怪。识别不靠谱，加上不好意思开口。语音输入想从极客玩具变成主流工具，最要命的就是这两道坎。

语音输入赛道的势头倒是够猛的。OpenAI Codex 和 Claude Code 这周都加了原生语音模式；Wispr Flow 估值已经到 20 亿美元。说话本来就比打字快三到五倍，效率账是实打实的。可一旦当真用起来，坑一个接一个。

@细心的猫头鹰发现 Whisper 大模型遇到安静的片段就开始无限复读”感谢观看”，原因是训练数据里塞满了 YouTube 视频，片尾没有声音却有”感谢观看”的字幕。
Typeless 这类 app 体验本来不错，却被 iOS 的后台策略限制逼得只能一直挂在后台偷偷录音，非常费电。
你以为买个好麦就能提高输入准确率？群里实测 Insta360、DJI 这些热门麦克风，蓝牙连接时走的都是”打电话链路”最高 16kbps 的全损音质。它们是为录 vlog 设计的，没有一个是为”对着电脑编程”设计的。

语音输入卡住不是因为”听不懂”。随着 AI 的发展，语音识别这事正在变得又好又便宜。真正难搞的全在它周围——系统集成、麦克风适配、隐私顾虑，以及你那没有隔间的开放办公室。

如果你想试试语音编程，这些是群友的建议：

需要省事：选 Wispr Flow 或 Typeless，识别准但需要联网。
需要隐私：选 superwhisper 或 Aqua Voice，你的架构决策和密钥不用念给云端的服务器听。
国内：选豆包输入法（@豁达的灰熊力荐离线模式）或 CapsWriter-Offline，完全离线开源。
群里 @今天群内信息量极大自己 vibe code 的 VoiceFlow 也值得一试，@冷静的飞鼠的评价是”远远吊打市面其他所有 app”：https://github.com/grapeot/voiceflow

所以机会不在更聪明的耳朵：在手机上把集成做顺、在转写里塞进”懂你术语”的能力、在不上云的前提下做出云端级的体验——每一个都是大生意。但最硬、也最反直觉的那块，压根不是技术问题：怎么让你敢在同事面前开口。

一年前放弃的东西，我一天就写出来了

去年我想给自己用的记账软件 MoneyDance 写个插件，分析我的投资收益率。然而我翻了半天 Java API 文档以后放弃了。想理解一个全新的大型项目，真的太费精力了。

上个月，我拿 Claude Code 重新试了一下。出乎意料的是，这次我只是描述了一下我的需求，一天就搞定了。现在我的 Claude Code 可以通过插件查询整个 MoneyDance 数据库，整理消费分类、做现金流分析，预测定投一年后各类资产的比例。我马上成为了 Claude Code 的死忠粉。

AI 对我最大的改变不是”写得快”，是”敢动手”。以前我看到复杂 API 就绕道走，现在我可以让 AI 去啃文档。

但这一天里它也卡过：它要读一个 Java API 的字段，光看文档猜方法名，猜错了，读出来全是 0，于是在原地打转。有意思的是它怎么解套的。它最终自己提了个办法：写一个探测命令，把那个 Java 对象的真实结构打印出来看看。这一步是 AI 自己想到的，不是我。

但它给的是个半成品：我要自己把命令复制到 MoneyDance 的调试控制台里，再把结果复制回来喂给它，然后再进行下一个测试，一来一回好几轮。于是我提醒它，”你写一个新的临时插件，把各种方案一次性一起试一下，把需要的信息全取出来”。这一下就省掉了那串手动复制粘贴的来回，只要我在控制台里启动一次插件，它立刻解套，一次改对。

所以那一下值钱的，不是”我比它聪明”——探测的点子是它先想到的。值钱的是：我看出它那个半成品会把人拖进反复的手动操作，知道该把它逼成一个能自己闭环、不用伺候的模式。

粉笔记号往上挪了一层

说到这儿我想起一个老故事，虽然可能是杜撰的。工厂发电机坏了，一帮工程师搞不定，请来电气专家 Steinmetz。他听了两天，爬上去用粉笔画了道记号：拆这儿，换 16 圈线圈。修好了以后，他开出账单：一万美元。厂方嫌贵，要他给出账单明细。他写道：“画粉笔记号 1 美元。知道往哪儿画 9999 美元。”

以前这故事的寓意是：答案本身不值钱，知道答案才值钱。可到了 AI 时代要拧一下——现在 AI 也能找到答案了。那 9999 美元到底买的是什么？是知道怎么帮助它找到答案。粉笔记号没消失，只是往上挪了一层：从”知道答案”挪到了”知道怎么让机器吐出答案”。

AI 的毛病是真的：会幻觉、会过度设计、会生成一堆能跑但没人敢维护的垃圾代码，会像我那次一样对着文档原地打转。但人的价值，早就不在“把代码敲出来”了——在知道该把软件摆在哪个位置、什么时候该逼 AI 换条路。

壁垒不在”能用”，在”敢用”

不过”会驾驭”还只是个人手艺，真正的壁垒在更后面。

我自己用，跑通就行。可企业客户要的从来不是”能用”——是稳定、是安全、是出了事有人负责。demo 越来越多，真正敢托付的产品却依然很稀缺。把一个模型塞进真实业务、让它稳定可信地跑起来，这件事 AI 自己解决不了。

这句话有个活生生的注脚，是最近群里和业界都在热议的一个职业：FDE，前线部署工程师。这角色一点都不新。Palantir 和微软等公司多年前就有。工程师直接驻扎到客户现场，把 SharePoint 等产品部署到客户那里，并与客户沟通，把产品融入客户的工作流。只是最近这一职业的热度突然窜了起来，招聘岗位一年暴涨 800%，通常起薪 30 万美元，资深工程师可达 60 万+美元。OpenAI 和 Anthropic 也先后下场做这块业务。群里 @80-HD 就提到，他们公司有个 OpenAI 的 FDE 在推进 Codex 集成。

它存在的理由一句话就能概括：企业 AI 试点 95% 失败，不是因为模型能力不行，是因为部署方案没搞定。模型越强，”把它真正用起来”就越值钱。这就是”采用在升值”。

我们正在锯掉程序员的梯子

那程序员会消失吗？群友的判断是：不是消失，是价值整体往上挪了。只会”生成”那半（写代码）的人在被挤压，能往”判断 + 采用”那半走的人在升值。

数据是冷的：根据哈佛对 28 万家企业的追踪研究，一个企业采用生成式 AI 以后，初级开发就业会在六个季度内减少 9–10%，而高级岗位几乎不动；Handshake 2025 数据显示入门级软件工程岗位同比下降约 30%；Indeed Hiring Lab 的数据显示，Web、Android、iOS、后端等传统开发岗位的招聘发布数量从 2020 年 2 月到 2025 年年中跌了 60% 以上。当然，这不全怪 AI。CS 毕业生数量十年间翻了倍，疫情后的过度招聘也在回调。

但真正让人后背发凉的是另一层。@开朗的企鹅转述了 Martin Fowler 的观点：如果 vibe coding 切断了学习循环，就没人能成长为高级工程师。把两件事并起来看——今天被抢疯、被炒上天的高级工程师，正是通过那些被 AI 干掉的初级杂活培养出来的。现在我们锯掉了职业阶梯里最低那几级。短期来说，高级工程师会更稀缺、更贵。可是长期来看，新的高级工程师从哪儿来？

写完这三个话题回头一看，它们讲的其实是同一件事。

Token 越来越便宜；语音识别越来越便宜；写代码越来越便宜；凡是 AI 能直接“生成”的东西，都在加速贬值。而知道该在哪儿“划线”的判断力在升值；让模型被信任、被采用的部署能力在升值；把虚拟世界和真实世界缝合起来的集成能力在升值。

Weekly

本文由作者按照 CC BY 4.0 进行授权