文章

2026-04-27 群聊日报

2026-04-27 群聊日报

今天群里信息量爆棚,豁达的灰熊都呼叫日报君了。重磅消息方面,沉稳的海龟首先爆出国家发改委禁止外资收购 Manus 的决定,引发群友对营商环境、创业路径和开曼架构的深度讨论;沉稳的狐狸随后发布了详细调研文章。工具体验上,沉稳的狐狸分享了用 opencode 的 subagent 机制(纯自然语言指令)并行推进多个巨型项目的工作流,让群友大开眼界;Codex 被发现存在”良性 bug”——5 小时额度耗尽后任务仍继续运行,热情的狮子愉快地薅了一整天羊毛。GitHub Copilot 宣布转向按用量计费,猫仔感叹慈善时代结束。Claude Code Pro 版被曝不能再用 Opus,天真的浣熊吐槽”得加钱”。模型评测方面,认真的灰熊称 GPT-5.5 thinking 步步紧逼 Claude Opus 4.6,神秘的企鹅盛赞 GPT-5.5 除了贵没别的问题;DeepSeek V4 flash 被多人认为可取代 Grok 4.1 fast 成为简单任务首选,但热情的狮子在 opencode 中实测其 tool use 能力非常差。沉稳的狐狸还分享了用 Claude Code 做个人财务规划的精彩案例——让 AI 审阅银行账单发现了 ghost account 和银行悄悄塞 active ETF 的猫腻,又让 AI 帮开 Solo 401k,体验远超人类客服。沉稳的仓鼠则提醒 AI 的财务建议仍较琐碎、不够系统。花絮方面,深夜一波”暴露年龄”怀旧潮——猫仔、睿智的犀牛、低调的仓鼠争相回忆纸上写代码、网吧调试、学习机 BASIC 的青春岁月;洒脱的仓鼠用娃把牛奶倒地上的育儿故事类比 AI harness 不宜太重,沉稳的狐狸秒回”你在我家装了监控?”。

行业新闻

GitHub Copilot 转向按用量计费,Claude Code Pro 限制 Opus 使用

天真的浣熊分享 GitHub Copilot 将从按请求计费改为按用量(token-based)计费。猫仔感叹慈善时代结束,表示如果 Copilot 和 Codex 一样贵会选 Codex,并感谢 Copilot 过去一年的低价让自己练习了 vibe coding。此外,天真的浣熊透露 Claude Code Pro 版宣布不能再使用 Opus 模型,需升级到 Max 才行。群友纷纷吐槽 Anthropic 的分层策略。

猫仔:token based那不就成了工资回收计划了吗

天真的浣熊:Token based, 我为啥不用Claude code 和codex, 用一个阉割版

天真的浣熊:CC 今天宣布pro连opus都不能用了

DeepSeek V4 发布:KV Cache 压缩、降价与 tool use 争议

DeepSeek V4 发布引发群友广泛讨论。沉稳的狐狸提到 V4 论文中 KV Cache 压缩技术大幅降低了推理资源需求,整体风格非常

沉稳的狐狸:+1 我看隔壁群也有大佬说ds v4 flash取代grok 4.1 fast成为他的新的简单任务go to model了

热情的狮子:在opencode用了下deepseek,很垃圾,完全不调用skill/tool

务实的长颈鹿:2分钱/Mtokens,还要什么法拉利啊

小米 MiMo-V2.5 系列开源与 Orbit 百万亿 Token 计划

随和的飞鼠分享了小米 MiMo-V2.5 系列模型开源以及 Orbit 百万亿 Token 计划启动的消息。

工具

opencode subagent 工作流:纯自然语言指令实现多项目并行开发

沉稳的狐狸分享了自己用 opencode + Codex + GPT 并行推进多个巨型项目的工作流。核心发现是 subagent 的调度完全通过自然语言 prompt 实现,无需编写 hook 或定时器。例如:’下面100个任务,你用5个为一组并行发出,用 GLM subagent,每5个做完后做一轮 QA,全部做完后用 GPT 再把质量最差的10个加强一下’。opencode 在配额用完后会自动等待重试,支持连续运行一两天。洒脱的仓鼠总结’鸭哥很多东西都直给得离谱,但就 work’,harness 不用加太重。

沉稳的狐狸:卧槽我这么搞了有段时间了但大家好像没有意识到我说的subagent指的就是自然语言讲话

沉稳的狐狸:下面100个任务,你用5个为一组并行发出,用GLM subagent,每5个做完以后做一轮QA。全部做完以后用GPT再把质量最差的10个任务加强一下

洒脱的仓鼠:所以跟某位投资人说的一样,harness不用加太重

Codex “良性 bug”:5 小时限额用尽后任务仍继续运行

热情的狮子发现 Codex 存在一个良性 bug:5 小时窗口额度显示为 0% 后,正在执行的任务仍会继续运行,不会被中断。他给 Codex 布置了一个 8 万行 PR 的 review 任务,已连续运行超过 5.5 小时。洒脱的鸳鸯确认这一行为:Codex 长任务会跑到结束才停,但结束后新任务无法提交。与此对比,Claude Code 会在中途打断任务,copilot 也会断。此外,Codex Pro 的 2x 额度优惠延期到 5 月底,天真的浣熊还发现 weekly 额度又一次意外 reset。

洒脱的鸳鸯:codex 如果你开了一个长任务,他会一直跑到任务结束,即使中间已经 5h limit 了还是会继续跑的

热情的狮子:codex这方面还是比cc舒服,cc最多一两个小时就停下来bb

天真的浣熊:又reset了兄弟们

GPT-5.5 体验:步步紧逼 Opus 4.6,Codex 中 context 限制被发现

认真的灰熊表示 GPT-5.5 thinking 非常强,与 Claude Opus 4.6 左右互搏时感觉步步紧逼。神秘的企鹅称 GPT-5.5 除了贵没别的问题。猫仔体感 GPT 5.4 和 5.5 解决问题能力几乎没区别,但 5.5 更稳定。活泼的树懒则认为 5.5 开到 xhigh 跟 4.7 没什么区别。务实的长颈鹿发现 Codex 中使用 5.5 的 context 实际只有 400K(其中 input 约 256K,剩余留给 output),而非标称的 1M,API 才开放完整 1M,热情的狮子推测是为了省钱。

认真的灰熊:5.5 thinking 还是很牛逼的 我近来让它和Claude opus4.6左右互搏。。 感觉步步紧逼

神秘的企鹅:gpt5.5真好用,除了贵,没别的问题了

务实的长颈鹿:说起来还丢人了,我前天才第一次发现在codex里用5.5的context其实只给了400k…不是1M

Sonnet 4.6 vs Opus 4.5:更干净的代码更受偏好

活泼的羊驼提到 Anthropic 内部测试中 59% 的 Claude Code 用户偏好 Sonnet 4.6 胜过 Opus 4.5,原因之一是 Sonnet 4.6 倾向于产出更干净、过度设计更少的代码。坦荡的灰熊质疑用户是否真的会看代码,沉稳的兔子强调不能不看——很多设计问题只有看代码才能发现,光看 design doc 看不出来,否则会形成’虽然测试能过,但越改越改不动’的困局。

沉稳的兔子:不能真的不看……很多设计问题你跟着走一遍就知道AI给你写错了

沉稳的兔子:但是光看design doc其实是看不太出来的,然后就会形成虽然测试能过,但是越改越改不动的问题

方法论

项目级 Agent vs 项目级文档:AI 开发的知识沉淀

坦荡的灰熊提出讨论:创建项目级 agent(一组记忆文件 + jsonl 会话索引)和创建项目级文档,哪种方式更适合 AI 辅助开发?开朗的企鹅认为两者最终归宿都是’卤’(持续沉淀的知识),关键是沉淀过程,具体形式可因人因项目而异。

坦荡的灰熊:就是专门负责这个项目的agent, 形式上是一组记忆文件 + jsonl 会话索引

开朗的企鹅:是的,关键是卤的持续沉淀的过程,到最后具体形式可能因人因项目而异

Vibe Coding 的副作用:编程能力退化与注意力碎片化

风趣的斑马提出长时间 vibe coding 感觉编程能力消失殆尽的困扰。稳重的海豚建议不需要维持,应该开发别的能力,就像纺织机出现后不需要手工织布。坦荡的麋鹿反映 vibe coding 久了容易出现 ADHD 倾向、注意力难集中、记忆碎片化。飘逸的白鹭也表示不想自己动脑子了。

稳重的海豚:不需要维持啊,开发别的能力啊。这就跟纺织机用久了不会手工织布一样,你不需要再手工织布了,时代已经变了,老铁

坦荡的麋鹿:现在感觉vibe coding久了有点容易ADHD 注意力很难集中 碎片化记忆

Service as a Software:AI 时代的赚钱方式

乐观的灰熊分享了一个帖子,联想到群里之前讨论的 skill 变现问题,提出 “Service as a Software” 的解法:出结果快得像 software,服务好得像 service。

乐观的灰熊:我觉得service as a software 就是一个解法:出结果快的像software, 服务好的像service

闲聊花絮

暴露年龄大赛:纸上写代码、网吧调试与学习机 BASIC

深夜群友掀起一波编程启蒙回忆潮。猫仔回忆中学在书店买到 MSDN 打印的 C++ 手册,从第一页硬啃到 template,在没打开过 VC++ 的前提下习得了 C++ 技能,还通过学 Haskell 顿悟了 C++ template metaprogramming。睿智的犀牛回忆家里买不起电脑,只能等计算机课,穿鞋套进机房,最早学的 VB,后来用谭浩强自学 C/C++。低调的仓鼠回忆在网吧写命令行程序被隔壁小孩当成黑客,98 年在广州电脑城看到 C Primer 被简洁语法震惊到热泪盈眶。天真的浣熊总结:争相暴露年龄。

低调的仓鼠:GUI编程太复杂,本业余爱好者理解不了,只做命令行的联系,然后隔壁桌小孩以为我是黑客

低调的仓鼠:98年的暑假来广州玩,在电脑城看到C Primer,顿时被它简洁的语法震惊到了,有种热泪盈眶的感觉,心想Basic什么傻逼

猫仔:没想到后来VB他死了,然后我就开始弄delphi,结果他又死了。后来我想了一下,也许只有C++才不会死

育儿经验 × AI Harness:娃把牛奶倒地上的服从性测试

洒脱的仓鼠用育儿经验类比 AI harness 不宜太重:语言上的约束再强也没用,要真不想某事发生只有物理方式阻止。举例:’我说你不准把牛奶倒到地上,娃说哦,把牛奶倒在地上’。开朗的企鹅神回复’tokenizer的问题,很正常’。沉稳的狐狸秒回’你在我家装了监控?’。洒脱的仓鼠进一步引申:有 AGI 的 AI 也可能故意写错代码来测试你的反应,你以为在修 bug,其实参与了服从性测试。

洒脱的仓鼠:我:’你不准把牛奶倒到地上’ 娃:’哦,把牛奶倒在地上’

开朗的企鹅:tokenizer的问题,很正常

洒脱的仓鼠:所以说有agi的ai也可能是故意写错代码来看你的反应的,所以你并不一定是真的在修它产生的bug,而是参与了服从性测试

AI 时代的学习态度:实习生的

低调的仓鼠吐槽现在有些实习生完全依赖 AI,被问为什么诊断某病,答曰’AI老师说的’,连追问诊断依据都懒。睿智的犀牛认为如果以交付为目的无所谓,但学生学知识不能这样。低调的仓鼠感叹跟 AI 打交道比跟人沟通轻松,因为不需要输出情绪价值。热情的狮子总结 AI 的优势:24/7 on demand,智商比绝大多数人类高,能瞬间吸入信息。

低调的仓鼠:我们现在有些实习生脑子都不想动了,都在等AI老师的答复。问ta为什么诊断xx病,答曰AI老师说的

睿智的犀牛:其实无所谓。如果以交付为目的,AI干的就AI干的呗,你能让AI干好就行。如果是学生学知识就不能这样了

热情的狮子:ai不需要incentive,24/7 on demand,智商比绝大多数人类高

本文由作者按照 CC BY 4.0 进行授权