文章

2026-04-29 群聊日报

2026-04-29 群聊日报

今天群内信息量极大,话题横跨 DeepSeek V4 技术评析、小龙虾(AI Agent 产品)的爆火原因、AI 写作与古法写作的取舍、Claude 宕机实况、多智能体工程实践等多个方向。@今天群内信息量极大 密集输出了对 DeepSeek V4 的技术解读和小龙虾的传播分析,@猫仔 分享了 AI coding 中”负面复利”的血泪经验,@洒脱的鸳鸯@坦荡的灰熊 深入讨论了用 subagent 拆分长任务的工程方法。闲聊方面,半夜打苍蝇引发了一轮具身智能需求讨论,@随和的飞鼠 遭遇 GPT 离奇抽风疑似 session 串台,Claude 傍晚宕机让全群被迫摸鱼。

行业新闻

DeepSeek V4 技术报告解读与评价

@今天群内信息量极大 深入阅读了 DeepSeek V4 技术报告,认为其特点是博览众家、融合大量细碎但有效的工程方法,凭借超强执行力调出了优秀的工程效果,并无偿公开所有细节。他撰写了一篇面向非研究员的学习笔记,解释 DeepSeek 的设计决策路线。同时他也指出 DeepSeek 在实际使用中幻觉率仍然很高,instruction following 和工具调用表现不佳。@天真的长颈鹿 猜测可能是 post-training 投入不足所致。

@今天群内信息量极大:deepseek v4就给人这样的感觉。不是说石破天惊发现了一本武功秘籍,照着练了就天下无敌。而是博览全书,选了很多特别丑/琐碎的方法,但凭借超人的执行力和细致的实验融会贯通,变成一个超级复杂的大杂烩。

@今天群内信息量极大:我对deepseek真的很失望,调研小龙虾,多个subagent同时调研brainstorm,只有它觉得小龙虾是个可穿戴硬件

@天真的长颈鹿:感觉他们放了大量精力在架构创新和infra了,post training太少了?听说他们没蒸馏

小龙虾为什么能火——Agent 私有化与社交属性

@今天群内信息量极大 分享了一个观点:小龙虾之前,AI Agent 是公有性质的产品,小龙虾出现后变成了可占有、可训练、可炫耀的私有化 Agent,社交属性发生了质变。@洒脱的狐狸 补充说小龙虾胜在非程序员也能上手,且具备定时任务和主动推送能力。@风趣的企鹅 认为程序员集体错过了小龙虾,因为程序员追求手术刀式的控制,而小龙虾是黑盒。

@今天群内信息量极大:这是第一次agent私有化,(社交意义上的)个人化

@洒脱的狐狸:小龙虾胜在上手容易(相对的),虽然安装也不简单、使用中的摩擦也非常多,但确实有一部分非程序员能用上

@风趣的企鹅:根本原因是程序员要追求手术刀的控制,小龙虾黑盒可能是惊喜也是惊吓

Token 消耗两年增长 1000 倍?

@活泼的羊驼 提出”两年后 token 消耗能否增长 1000 倍”的问题,@冷静的麋鹿 给出了乐观分析:拆解为用户深度转化 10 倍 × 场景扩展 10 倍 × 场景深度 10 倍,认为可以达成。

@冷静的麋鹿:其实说 1000 倍听起来很夸张,但我个人觉得如果把 1000 改成 10 × 10 × 10,听起来就没那么夸张了。

Claude 宕机与 Qwen 政治正确写代码

傍晚 Claude 服务出现 outage,@热情的狮子 率先发现并报告,@沉稳的仓鼠 调侃”大家都不说话说明本群其实都是 claude 的 bot”。@稳重的海豚 表示还好有 Codex 能顶上。另外@细心的猫头鹰 分享了 Qwen 写代码时追求政治正确的有趣案例。

@沉稳的仓鼠:大家都不说话说明本群其实都是claude的bot

@热情的狮子:不然看什么小红书

Meta 收购 Manus 告吹

@机智的荷兰猪 分享了 Meta 收购 Manus 交易黄了的消息。

Anthropic Claude Code 黑客松六强作品

@冷静的飞鼠 分享了 Anthropic 公布的 Claude Code 黑客松获奖作品,参赛者包括医生、老师等非程序员背景的选手。@细心的猫头鹰 笑称”第一眼看还以为是老中医”。

工具

智能音箱方案:ASR-LLM-TTS 级联 vs 端到端 Realtime

@聪明的蜂鸟 请教做智能音箱的技术方案,需要语音输入输出、流式处理和 function calling。@风趣的企鹅 推荐火山 RTC 方案,@稳重的犀牛 推荐腾讯云 TRTC。@今天群内信息量极大 分享经验:GPT Realtime 的 function calling 不太好,建议先用语音识别转文字再用模型做 func call。

@今天群内信息量极大:如果把他当语音识别模型用,先转文字,然后用gpt-mini做func call,效果好很多

@聪明的蜂鸟:我现在就是用的stepfun,这是目前国内唯一找到的realtime语音端到端+func call

演讲训练的语音评测工具

@稳重的海豚 想做一个演讲 coach,需要识别语音语调并量化评分。@风趣的企鹅 推荐科大讯飞的 Suntone 接口,支持多语种发音评测打分,内置语音识别和多维度评分。@开朗的企鹅 补充了腾讯云智聆和谷歌云/微软云的类似服务。

@风趣的企鹅:科大讯飞的Suntone可以测评好几国的语言声调,日常我们给英文做口语评价参考

Mac M3 Ultra 本地跑 DeepSeek V4 Flash

@今天群内信息量极大 测试了在 Mac M3 Ultra 上运行 DeepSeek V4 Flash 4bit MLX 的性能,@务实的长颈鹿 表示速度没有想象中快,原以为能到 50 tokens/s。分析认为对应的显存带宽已接近瓶颈,优化空间有限。

Tavily 搜索额度与替代方案

@稳重的海豚 反映 Tavily 每月一万多次搜索额度转眼用完,webfetch 质量又跟不上,引发关于是否该付费升级的讨论。

方法论

AI Coding 中”复利”与”负复利”

@今天群内信息量极大 发布了一篇关于 AI coding 中真正有复利的东西的文章。@猫仔 以亲身经历补充了”负面复利”的问题:AI 用了不合适的 pattern,后续轮次会不断复制这个错误,半小时的事可以拖成几小时。他还指出 GPT 5.5 做 refactor 能力很差,死活沿着原来的逻辑走,最终不得不 revert 重做。

@猫仔:只要一个不小心,AI用不合适的方法写代码自己没注意到,这个pattern很快就会被后面几轮一直复制。代码不想看也会逼你去看

@猫仔:gpt做refactor能力还不是一般的差,我跟他说你专门做这个class弄redirection没有必要,给我删了,他说好,转头redirect了另一边

AI 写作 vs 古法写作的取舍

@今天群内信息量极大 坦言用 AI 写文章太爽,导致手写 blog 和 knowledge bank 都断更了,陷入了思维定势。@冷静的麋鹿 表示鸭哥古法写作的内容读起来更有味道,AI 辅助写作容易被拉回”业内平均值”。@细心的海龟 表示一天写 10 篇之后需要冷静,太爽会质量下滑。

@冷静的麋鹿:AI 辅助写作,即便在中间加了一些自己的观点,但因为它会进行广泛调研,然后扩写,总感觉避免不了被整个模型和搜索拉回到业内平均值的感觉

@猫仔:AI写的文章废话太多了,现在看鸭哥的文章就真的是”一目十行”,从左上角到右下角扫过去

多 Agent 独立 review 与对抗式写作

@敏锐的海狸 分享了在调研和写作中使用多 agent 独立 review 的方法:用 Claude Code CLI 单独开 validator/adversary debater/reviewer agent,不共享 context window,往往有意想不到的效果。@今天群内信息量极大 认同这种做法,比喻为”写完东西雇个杠精先喷一轮”。

@敏锐的海狸:两个不share context window, 感觉往往会有很大的惊喜

@今天群内信息量极大:两边攻防几次,确保目标用户的问题都事先想过了

用独立进程拆分长任务的多智能体工程

@坦荡的灰熊 提出将 skill 炼成 subagent 的需求:项目增长后细节爆炸,遇到 bug 要频繁修改浪费上下文。@洒脱的鸳鸯 分享了自己的方案:在 skill 里通过脚本 fork 出独立的 Claude 进程,独立进程可以继续分出子进程,实现 plan-implement-review 的递归分层,主 agent 上下文保持短而干净。@猫仔 补充说架构和模块边界必须自己把握,”把各种屎关在屋子里不要让他流出来”。

@洒脱的鸳鸯:直接用单独 process 好处是它可以继续调用 skill 分出独立 process,这就比 subagent 先进了,subagent 没办法继续分 subagent

@猫仔:对于需要长期维护的项目,我认为架构还是得自己来把握,模块的边界是需要思考的

闲聊花絮

半夜打苍蝇与具身智能

@今天群内信息量极大 半夜起来打苍蝇未遂,发出灵魂呼唤”需要具身智能帮我打苍蝇”。@天真的狮子 提到了 AI 激光炮打蚊子的项目,@今天群内信息量极大 说自己有个 5W 手动激光炮但娃在睡觉不敢用。@冷静的飞鼠 吐槽盐枪”远了没用,近了直接肢解了,贼恶心”。最终@天真的浣熊@灵动的北极熊 一致推荐电蚊拍,称”电到苍蝇可以持续电到冒烟,还有烤肉味”。

@今天群内信息量极大:是的我真有个手动激光炮(5W)但娃在睡觉,不敢用,草。待我把娃脸遮住

@冷静的飞鼠:远了没用 近了直接肢解了 贼恶心

GPT 离奇抽风疑似 session 串台

@随和的飞鼠 在整理工作记录时遭遇 GPT 输出异常,怀疑是 multi-tenant 架构导致 session 相互污染,推测”和我一台服务器的哥们应该是搞博彩的”。@睿智的犀牛 评价输出”怎么看着跟豆包似的”。

@随和的飞鼠:multi-tenent吧,和我一台服务器的哥们应该是搞博彩的

Sonnet 鄙视 GLM 与帝王心术

@今天群内信息量极大 发现让 Sonnet 评价 GLM 时态度鄙夷,@随和的飞鼠 点评”相互瞧不上才好呀,对线的时候效果更佳”,引出”帝王心术”“后宫御术”的调侃。

@今天群内信息量极大:你们互相斗,就没空来反抗我了(捻须

本文由作者按照 CC BY 4.0 进行授权