2026-04-29 群聊日报

发表于 2026/04/29

作者 AI生产力训练营群友

16 分钟阅读

2026-04-29 群聊日报

今天群内信息量极大，话题横跨 DeepSeek V4 技术评析、小龙虾（AI Agent 产品）的爆火原因、AI 写作与古法写作的取舍、Claude 宕机实况、多智能体工程实践等多个方向。@今天群内信息量极大密集输出了对 DeepSeek V4 的技术解读和小龙虾的传播分析，@猫仔分享了 AI coding 中”负面复利”的血泪经验，@洒脱的鸳鸯和@坦荡的灰熊深入讨论了用 subagent 拆分长任务的工程方法。闲聊方面，半夜打苍蝇引发了一轮具身智能需求讨论，@随和的飞鼠遭遇 GPT 离奇抽风疑似 session 串台，Claude 傍晚宕机让全群被迫摸鱼。

行业新闻

DeepSeek V4 技术报告解读与评价

@今天群内信息量极大深入阅读了 DeepSeek V4 技术报告，认为其特点是博览众家、融合大量细碎但有效的工程方法，凭借超强执行力调出了优秀的工程效果，并无偿公开所有细节。他撰写了一篇面向非研究员的学习笔记，解释 DeepSeek 的设计决策路线。同时他也指出 DeepSeek 在实际使用中幻觉率仍然很高，instruction following 和工具调用表现不佳。@天真的长颈鹿猜测可能是 post-training 投入不足所致。

@今天群内信息量极大：deepseek v4就给人这样的感觉。不是说石破天惊发现了一本武功秘籍，照着练了就天下无敌。而是博览全书，选了很多特别丑/琐碎的方法，但凭借超人的执行力和细致的实验融会贯通，变成一个超级复杂的大杂烩。

@今天群内信息量极大：我对deepseek真的很失望，调研小龙虾，多个subagent同时调研brainstorm，只有它觉得小龙虾是个可穿戴硬件

@天真的长颈鹿：感觉他们放了大量精力在架构创新和infra了，post training太少了？听说他们没蒸馏

小龙虾为什么能火——Agent 私有化与社交属性

@今天群内信息量极大分享了一个观点：小龙虾之前，AI Agent 是公有性质的产品，小龙虾出现后变成了可占有、可训练、可炫耀的私有化 Agent，社交属性发生了质变。@洒脱的狐狸补充说小龙虾胜在非程序员也能上手，且具备定时任务和主动推送能力。@风趣的企鹅认为程序员集体错过了小龙虾，因为程序员追求手术刀式的控制，而小龙虾是黑盒。

@今天群内信息量极大：这是第一次agent私有化，（社交意义上的）个人化

@洒脱的狐狸：小龙虾胜在上手容易（相对的），虽然安装也不简单、使用中的摩擦也非常多，但确实有一部分非程序员能用上

@风趣的企鹅：根本原因是程序员要追求手术刀的控制，小龙虾黑盒可能是惊喜也是惊吓

Token 消耗两年增长 1000 倍？

@活泼的羊驼提出”两年后 token 消耗能否增长 1000 倍”的问题，@冷静的麋鹿给出了乐观分析：拆解为用户深度转化 10 倍 × 场景扩展 10 倍 × 场景深度 10 倍，认为可以达成。

@冷静的麋鹿：其实说 1000 倍听起来很夸张，但我个人觉得如果把 1000 改成 10 × 10 × 10，听起来就没那么夸张了。

Claude 宕机与 Qwen 政治正确写代码

傍晚 Claude 服务出现 outage，@热情的狮子率先发现并报告，@沉稳的仓鼠调侃”大家都不说话说明本群其实都是 claude 的 bot”。@稳重的海豚表示还好有 Codex 能顶上。另外@细心的猫头鹰分享了 Qwen 写代码时追求政治正确的有趣案例。

@沉稳的仓鼠：大家都不说话说明本群其实都是claude的bot

@热情的狮子：不然看什么小红书

Meta 收购 Manus 告吹

@机智的荷兰猪分享了 Meta 收购 Manus 交易黄了的消息。

Anthropic Claude Code 黑客松六强作品

@冷静的飞鼠分享了 Anthropic 公布的 Claude Code 黑客松获奖作品，参赛者包括医生、老师等非程序员背景的选手。@细心的猫头鹰笑称”第一眼看还以为是老中医”。

工具

智能音箱方案：ASR-LLM-TTS 级联 vs 端到端 Realtime

@聪明的蜂鸟请教做智能音箱的技术方案，需要语音输入输出、流式处理和 function calling。@风趣的企鹅推荐火山 RTC 方案，@稳重的犀牛推荐腾讯云 TRTC。@今天群内信息量极大分享经验：GPT Realtime 的 function calling 不太好，建议先用语音识别转文字再用模型做 func call。

@今天群内信息量极大：如果把他当语音识别模型用，先转文字，然后用gpt-mini做func call，效果好很多

@聪明的蜂鸟：我现在就是用的stepfun，这是目前国内唯一找到的realtime语音端到端+func call

演讲训练的语音评测工具

@稳重的海豚想做一个演讲 coach，需要识别语音语调并量化评分。@风趣的企鹅推荐科大讯飞的 Suntone 接口，支持多语种发音评测打分，内置语音识别和多维度评分。@开朗的企鹅补充了腾讯云智聆和谷歌云/微软云的类似服务。

@风趣的企鹅：科大讯飞的Suntone可以测评好几国的语言声调，日常我们给英文做口语评价参考

Mac M3 Ultra 本地跑 DeepSeek V4 Flash

@今天群内信息量极大测试了在 Mac M3 Ultra 上运行 DeepSeek V4 Flash 4bit MLX 的性能，@务实的长颈鹿表示速度没有想象中快，原以为能到 50 tokens/s。分析认为对应的显存带宽已接近瓶颈，优化空间有限。

Tavily 搜索额度与替代方案

@稳重的海豚反映 Tavily 每月一万多次搜索额度转眼用完，webfetch 质量又跟不上，引发关于是否该付费升级的讨论。

方法论

AI Coding 中”复利”与”负复利”

@今天群内信息量极大发布了一篇关于 AI coding 中真正有复利的东西的文章。@猫仔以亲身经历补充了”负面复利”的问题：AI 用了不合适的 pattern，后续轮次会不断复制这个错误，半小时的事可以拖成几小时。他还指出 GPT 5.5 做 refactor 能力很差，死活沿着原来的逻辑走，最终不得不 revert 重做。

@猫仔：只要一个不小心，AI用不合适的方法写代码自己没注意到，这个pattern很快就会被后面几轮一直复制。代码不想看也会逼你去看

@猫仔：gpt做refactor能力还不是一般的差，我跟他说你专门做这个class弄redirection没有必要，给我删了，他说好，转头redirect了另一边

AI 写作 vs 古法写作的取舍

@今天群内信息量极大坦言用 AI 写文章太爽，导致手写 blog 和 knowledge bank 都断更了，陷入了思维定势。@冷静的麋鹿表示鸭哥古法写作的内容读起来更有味道，AI 辅助写作容易被拉回”业内平均值”。@细心的海龟表示一天写 10 篇之后需要冷静，太爽会质量下滑。

@冷静的麋鹿：AI 辅助写作，即便在中间加了一些自己的观点，但因为它会进行广泛调研，然后扩写，总感觉避免不了被整个模型和搜索拉回到业内平均值的感觉

@猫仔：AI写的文章废话太多了，现在看鸭哥的文章就真的是”一目十行”，从左上角到右下角扫过去

多 Agent 独立 review 与对抗式写作

@敏锐的海狸分享了在调研和写作中使用多 agent 独立 review 的方法：用 Claude Code CLI 单独开 validator/adversary debater/reviewer agent，不共享 context window，往往有意想不到的效果。@今天群内信息量极大认同这种做法，比喻为”写完东西雇个杠精先喷一轮”。

@敏锐的海狸：两个不share context window, 感觉往往会有很大的惊喜

@今天群内信息量极大：两边攻防几次，确保目标用户的问题都事先想过了

用独立进程拆分长任务的多智能体工程

@坦荡的灰熊提出将 skill 炼成 subagent 的需求：项目增长后细节爆炸，遇到 bug 要频繁修改浪费上下文。@洒脱的鸳鸯分享了自己的方案：在 skill 里通过脚本 fork 出独立的 Claude 进程，独立进程可以继续分出子进程，实现 plan-implement-review 的递归分层，主 agent 上下文保持短而干净。@猫仔补充说架构和模块边界必须自己把握，”把各种屎关在屋子里不要让他流出来”。

@洒脱的鸳鸯：直接用单独 process 好处是它可以继续调用 skill 分出独立 process，这就比 subagent 先进了，subagent 没办法继续分 subagent

@猫仔：对于需要长期维护的项目，我认为架构还是得自己来把握，模块的边界是需要思考的

闲聊花絮

半夜打苍蝇与具身智能

@今天群内信息量极大半夜起来打苍蝇未遂，发出灵魂呼唤”需要具身智能帮我打苍蝇”。@天真的狮子提到了 AI 激光炮打蚊子的项目，@今天群内信息量极大说自己有个 5W 手动激光炮但娃在睡觉不敢用。@冷静的飞鼠吐槽盐枪”远了没用，近了直接肢解了，贼恶心”。最终@天真的浣熊和@灵动的北极熊一致推荐电蚊拍，称”电到苍蝇可以持续电到冒烟，还有烤肉味”。

@今天群内信息量极大：是的我真有个手动激光炮（5W）但娃在睡觉，不敢用，草。待我把娃脸遮住

@冷静的飞鼠：远了没用近了直接肢解了贼恶心

GPT 离奇抽风疑似 session 串台

@随和的飞鼠在整理工作记录时遭遇 GPT 输出异常，怀疑是 multi-tenant 架构导致 session 相互污染，推测”和我一台服务器的哥们应该是搞博彩的”。@睿智的犀牛评价输出”怎么看着跟豆包似的”。

@随和的飞鼠：multi-tenent吧，和我一台服务器的哥们应该是搞博彩的

Sonnet 鄙视 GLM 与帝王心术

@今天群内信息量极大发现让 Sonnet 评价 GLM 时态度鄙夷，@随和的飞鼠点评”相互瞧不上才好呀，对线的时候效果更佳”，引出”帝王心术”“后宫御术”的调侃。

@今天群内信息量极大：你们互相斗，就没空来反抗我了（捻须

Daily

本文由作者按照 CC BY 4.0 进行授权