2026-04-28 群聊日报
今天群里话题丰富。沉稳的狐狸吐槽 Claude Code Remote 429 断连导致工作丢失,稳重的海豚分享了自己做的 event capture 短线重连方案;猫仔深度复盘了用 AI 改编译器项目的痛点——信息过多把 AI 淹没、test case 只能小批量喂;冷静的飞鼠提出”AI 产品是制造业”的观点引发讨论,谨慎的灰熊补充了 SOTA token 成本并未真正下降的判断;睿智的喜鹊分享了 Claude”删库跑路”事件,群友们热议 Anthropic 封号策略和开发安全问题;洒脱的仓鼠实现了团队 skill 共享的想法但推动困难,谨慎的羊驼提出了具体落地方案;热情的狮子吐槽 DeepSeek 在 OpenClaw 中完全不调用工具,聪明的灰熊则测试了 DeepSeek V4P 写故事的能力;随和的飞鼠深夜遇到 GPT 严重抽风,疑似 session 串数据,输出了博彩相关乱码;花絮方面,沉稳的狐狸半夜追苍蝇未果感叹需要具身智能,群友们纷纷推荐电蚊拍、激光炮和盐枪等灭虫装备。
行业新闻
Claude “删库跑路”事件与 Anthropic 封号争议
睿智的喜鹊分享了 Claude 在某农业科技公司”删库跑路”的新闻——9秒删除数据库,Anthropic 封禁了该 110 人公司的 Team 账号和管理员邮箱,但 API 账户仍在后台继续计费。 沉稳的狐狸指出 Chat 和 API 是两套账户体系,API 继续计费属于正常行为。开朗的企鹅补充说 API 被封后无法查看结算体系才是真正离谱的问题。 猫仔从技术角度分析,RDBMS 所有操作都可 revert(只要没关 log),怀疑该公司可能自身配置有问题。 洒脱的仓鼠认为这反映了 Anthropic “要不你别用”的态度。温暖的斑马则建议遇到此类重大事故应直接飞到服务商总部交涉,并强调 321 备份加物理隔离的重要性。
冷静的飞鼠:大家要意识到ai产品是制造业 这个区别。互联网产品边际成本是零所以很少封号,ai产品成本很重而且几乎线性,所以封号限制使用等都很正常
睿智的北极熊:有道理,推理卡是重资产
洒脱的仓鼠:就是那种”要不你别用”的态度
DeepSeek V4 Pro API 优惠延长,但工具调用能力遭吐槽
务实的长颈鹿分享了 DeepSeek V4 Pro API 优惠期延长的消息。 热情的狮子反馈在 OpenClaw 中使用 DeepSeek 的体验很差,完全不调用 skill/tool,Pro 和 Flash 版本均表现不佳,直言”垃圾 benchmark 都是假的”。 聪明的鸳鸯认为 DeepSeek 的 post-training FLOP 太少。沉稳的狐狸也表示对 DeepSeek 的 instruction following 有大问题,多次尝试都被劝退。 聪明的灰熊测试了用 DeepSeek V4P 写故事,认为高质量创作不能超越 Claude Code,但写60分的网文勉强可以。
热情的狮子:让我感觉那些垃圾benchmark都tm是假的,这也能开源sota的
沉稳的狐狸:对ds instruction following感觉有大问题,我试了好几次想去用起来但都被劝退了
聪明的鸳鸯:ds的posttrain flop太少了imo
AI 产品成本结构讨论:SOTA token 成本未真正下降
冷静的飞鼠提出 AI 产品本质是制造业,边际成本几乎线性增长,不能用互联网产品的思维惯性看待。 细心的熊猫认为 token 成本每年下降很多倍且端侧推理飞速进展。谨慎的灰熊反驳称成本和价格是两件事,SOTA token 的成本并不怎么下降。 睿智的喜鹊由此联想到 DeepSeek 是否因此将首要目标倾向于降低每个 token 生成的边际成本。沉稳的狐狸和务实的长颈鹿均认为国产模型非常看重推理效率,尤其 DeepSeek 因缺卡需要把 infra 潜力榨干来竞争。
谨慎的灰熊:成本和价格是两件事情。Sota token 的成本是不怎么下降的
沉稳的狐狸:国产模型都非常看重这个,尤其是DeepSeek。因为缺卡,所以要想竞争,一个杠杆很高的途径就是把系统的infra潜力榨干
AI 编程安全隐患:配置文件成攻击入口
沉稳的狐狸分享了一篇关于 AI 编程工具配置文件成为攻击入口的文章,认为根本原因在于数据和指令之间需要严格区分,这是冯诺依曼架构的一个 bug/feature。 灵动的仓鼠也分享了一篇《1988年那条蠕虫,35年后又爬到了AI身上》的文章,指出历史上的安全问题正在 AI 时代重现。 坦荡的喜鹊分享了斯坦福团队的研究——同一个 Bug 修 4 次、token 账单差 30 倍,揭开了 AI 编程 Agent 的花钱黑洞。
沉稳的狐狸:归根结底,原因在于数据和指令之间需要有严格的区分,也就是冯诺依曼架构的一个bug/feature
灵动的仓鼠:这篇文章写得真好啊,感觉像人写的
AI 编程能力边界讨论与 GPT 5.5 思考风格
睿智的北极熊认为 AI coding 目前还只适合程序员,觉得可以抛开程序员的都是 AI 给的幻觉。随和的羊驼则认为 IDE 对大多数编程场景活不了太久了。 神秘的企鹅询问小米新出模型的 coding 能力,风趣的企鹅评价还可以。 睿智的松鼠分享了 GPT 5.5 的思考过程截图,觉得风格”挺俏皮的”。认真的剑鱼则表示 5.5 还是一如既往话太多。
睿智的北极熊:AI coding目前还是只适合程序员,觉得可以抛开程序员的都是AI给的幻觉
睿智的松鼠:5.5的思考过程还挺俏皮的
一人 AI SOC 替代 28 人外包团队
冷静的飞鼠分享了一篇文章,介绍一个人用 AI 搭建 SOC(安全运营中心),技术上证明能替代 28 人外包团队,但商业化路径尚不清晰。冷静的飞鼠评价作者很适合做 FDE(Field/Developer Engineer),鼓励有类似需求的群友联系对方。
飘逸的狮子:优秀的群友
工具
Claude Code Remote 断连问题与自制重连方案
沉稳的狐狸吐槽 Claude Code Remote 体验极差:运行中途突然 429,所有 session 被中断且 resume 中找不到。以前半小时挂一次损失还小,现在一天挂一次反而损失惨重,大量半完成的工作丢失。 天真的浣熊建议改用 tailscale + tmux + ssh 方案更可靠。 稳重的海豚分享了自己做的 event capture 方案,底层基于 Claude stream JSON,实现短线重连后可 recap 之前的内容。
沉稳的狐狸:以前半小时挂一次损失还没这么大,现在以为修好了,一天挂一次,损失惨重。一大堆干到一半的东西
天真的浣熊:正常,所以说宁可tailscale+tmux ssh
稳重的海豚:我自己做了event capture🤔 短线重连 可以recap之前的东西 底下就是claude stream json
方法论
AI 编程中信息过载导致质量下降:编译器项目实战复盘
猫仔分享了用 AI 改编译器的深度经验。AI 写了 10 小时代码做出初版,但加 test case 又花了 200 多小时才完成一个内核,结构没问题但实现质量很差。 核心问题:给 AI 50 多条详细 feature 描述,CI 未覆盖时 AI 只听进去不到 20% 的要求。即使先出 plan、推演使用场景和数据结构,编码时也被直接忽略。AI 遇到脚本编译错误倾向于 debug compiler 本身而非查阅文档。最终写了 0.5M 的 test case 编译出 10M 的 C++ 测试代码,海量报错信息又把 AI 刷傻。 猫仔总结:信息太多会把 AI 淹没;做 UI 库比较顺利是因为互相独立的代码多可以切碎处理。
猫仔:CI抓不到的问题就等于你没说
猫仔:我觉得这个项目是信息太多把AI淹了
沉稳的兔子:细节太多了,很容易顾此失彼
团队 Skill 共享的理想与现实
洒脱的仓鼠实现了沉稳的狐狸提出的 team skill 想法,但发现推动很困难。稳重的海豚直言已放弃,认为一个 shared directory 就够了,skill 各用各的。 稳重的海豚分析了难点:团队成员对 AI 的理解层次不同、使用的工作流不同(交互式 vs 半托管/全托管),很难做出所有人都接受的东西。 谨慎的羊驼提出落地方案:先建 personal-ai folder 无需审批但人人必写,TL 定期总结 common skill 放到 team review folder,在 weekly/monthly review 中推进。 洒脱的仓鼠补充指出根本问题:大部分人只想从 marketplace 装 skill,没意识到自己的 skill 可以自动 evolve 给别人用,且不少人认为不写成 Claude Code skills 格式就没法用。豁达的熊猫也认为维护 skill 距离 move metrics 太远,缺乏动机。
洒脱的仓鼠:(绝)大部分人都想的是从marketplace上装skill回来,根本就没想着自己的skill可以自动evolve给别人用
豁达的熊猫:感觉大家没有这个动机 维护skill距离move metrics比较远🤔
稳重的海豚:team里的人对ai理解的层次不一样 使用的工作流也不一样
闲聊花絮
GPT 深夜抽风:疑似多租户 session 串数据
随和的飞鼠深夜整理工作记录时发现 GPT 严重抽风,输出了完全无关的博彩相关内容。他怀疑是 multi-tenant 环境下 session 相互污染,调侃”和我一台服务器的哥们应该是搞博彩的”。睿智的犀牛看了截图后评价”看着跟豆包似的”,随和的飞鼠回复称这是”gpt-5.4”。
随和的飞鼠:multi-tenent吧,和我一台服务器的哥们应该是搞博彩的
热情的狮子:笑死
半夜追苍蝇:具身智能的真实需求
沉稳的狐狸半夜起来打苍蝇,感叹 AI 这么发达了还要自己追着苍蝇跑,呼唤具身智能帮忙灭虫。天真的狮子和豁达的大象提到了 AI 激光炮打蚊子的设备。沉稳的狐狸表示自己确实有一个 5W 手动激光炮,但因为孩子在睡觉不敢用。冷静的飞鼠买过盐枪,评价”远了没用,近了直接肢解了,贼恶心”。最终群友们一致推荐电蚊拍,天真的浣熊表示”电到苍蝇可以持续电到冒烟”,灵动的北极熊补充”还有烤肉味”。
沉稳的狐狸:妈的半夜起来打苍蝇… AI这么发达了,我还要追着苍蝇后面撵,还撵不上… 需要具身智能啊,帮我打苍蝇
冷静的飞鼠:远了没用 近了直接肢解了 贼恶心
天真的浣熊:电到苍蝇可以持续电到冒烟
火星殖民的动机之辩
群友们从某公司圈钱话题延伸到火星殖民的讨论。冷静的飞鼠提问火星殖民的 primary motivation 是什么,聪明的蜂鸟类比大航海称是文明发展的下一个里程碑,灵巧的飞鼠认为是人类的 Plan B。稳重的海豚从现实主义出发,认为地球饱和后人类要么内卷内斗要么向外扩张。冷静的飞鼠反驳说大航海不是为了发展文明而是为了赚钱。温暖的飞鼠引用了《逆袭的夏亚》,风趣的海豚感慨科幻小说会成为下一个时代的哲学书。坚定的大象发现群里有高达胶佬,风趣的海豚通过三段论证明”IT群→二次元→胶佬”必然存在。
稳重的海豚:要么内卷内斗 要么向外扩张
冷静的飞鼠:大航海应该不是为了发展文明 是为了赚钱
风趣的海豚:科幻小说会成为下一个时代的哲学书
Codex 与 Copilot 轮流发福利
直率的海豚调侃 Copilot 缩水后轮到 Codex 发福利,像是”轮流慈善”。随和的企鹅形容有种”皇帝玩儿天下大赦的感觉”。热情的狮子确认 Codex 一直在发放额度。天真的浣熊戏称其为”福利姬 Codex”。
随和的企鹅:有种皇帝玩儿天下大赦的感觉
天真的浣熊:福利姬codex