文章

2026-04-21 群聊日报

2026-04-21 群聊日报

今天群里话题极其丰富。沉稳的老虎82 分享了 Kimi K2.6 的 Agent Swarm 功能体验,一句话跑两小时生成百页咨询报告,引发大量讨论;冷静的狐狸41 分享了 GPT-Image-2 全量上线的测试对比,并与 Nano Banana 2 做了横评;群友们随后用 GPT-Image-2 生成乙游风格海报,把群里玩成了”恋与深空”创作大赛,风趣的火烈鸟32 甚至用 Seedance 2 生成了视频版,场面一度失控。务实的猎豹32 在深夜带来 GPT-Image-2 API 正式上线的消息。此外,xAI/SpaceX 以 $10B+$60B 的 option 结构洽购 Cursor 的新闻引发热议;群友们围绕 Coding Plan 的成本与可持续性展开了深入讨论,冷静的羊驼82 透露智谱每个用户每月亏约200元;机智的水獭10 提出了大型代码库文档自动化构建与评估的问题,冷静的狐狸41 提出了”五年高考三年模拟”式的离线/在线 eval 思路;沉稳的兔子81 发布了三篇关于 AI 焦虑、学习方法论和人机协作的深度文章;博学的雪豹82 发现 Anthropic 已将 Claude Code 从 $20 Pro 订阅中移除。花絮方面,冷静的狐狸41 在餐厅听人聊 agent 买房,竖着耳朵听了半天才反应过来说的是房产中介;沉稳的长颈鹿12 让 Claude 停止排查 bug 去实现新方案,Claude 因为好奇拒绝了。

工具

Kimi K2.6 Agent Swarm 实测:一句话生成百页咨询报告

沉稳的老虎82 分享了 Kimi K2.6 网页版 Agent Swarm 的使用体验:仅输入一句话,系统自动生成 30 多个 subagent,跑了两个小时,输出一份一百多页的 Word 咨询报告,质量达到”正经可以卖几千块”的水平。 机智的企鹅53 也确认效果不错,但反映当前服务器卡顿频繁出错,呼吁加显卡。 沉稳的老虎82 认为 Kimi K2.6 比用了一个月的 Manus 体验好太多,且 199 元/月的额度用不完。严谨的长颈鹿62 指出 200 元档才能使用 Swarm 功能,现已新增 699 元档。 机智的企鹅53 提到 Agent Swarm 与 Manus 功能类似,有群友认为有搭 web 能力的话 Manus 已全面劣势。

沉稳的老虎82:早上测试搞一个客户方案,一句话跑了两个小时,生成了一百多页的word

沉稳的老虎82:绝对是那种正经可以卖几千块的咨询报告

沉稳的老虎82:比我抠抠搜搜用了一个月的manus感觉香太多了

Gemini CLI 写代码体验:遇到小问题即陷入死循环

稳重的大象96 尝试用 Gemini CLI 写代码,初始感觉不错,但很快在一个小问题上陷入死循环,代码质量被 Codex 和 Claude Code 双打脸。活泼的羊驼58 推荐了 GLM 5.1 和 Kimi K2.6 作为替代。猫仔 直言 Gemini 模型”不行,不用试了”。机智的水獭10 甚至表示强迫用 Gemini 是想离职的最大理由。

稳重的大象96:不过很快露馅了 一个小问题立刻陷入死循环 代码质量被codex cc双打脸

猫仔:这个模型就是不行,不用试了

机智的水獭10:想离职的最大理由:强迫用gemini

Codex Chronicle 录屏记忆功能引发隐私担忧

聪明的松鼠36 提到 Codex 新出的 Chronicle 功能(类似 Cowork),沉稳的猫头鹰87 对其录屏当记忆的机制表示强烈担忧:长期开着录制让数据上传至云端,相当于有双眼睛一直在看你的一切,包括聊天记录和密码设置。冷静的狐狸41 补充”被起诉了还可能被搜出来当证据”。

沉稳的猫头鹰87:这多吓人,有双眼睛一直在看你的一切,甚至你的聊天记录,密码设置

冷静的狐狸41:是啊,被起诉了还可能被搜出来当证据

行业新闻

GPT-Image-2 全量上线与 API 发布

冷静的狐狸41 分享了 GPT-Image-2 全量上线的消息及实测图片,并与 Nano Banana 2 进行了对比。简单场景下两者差距不大,但在复杂文字较多的场景下 GPT-Image-2 更稳定。 风趣的火烈鸟32 指出 OpenAI 生图模型一直有一种”油画海报感”,务实的猎豹32 建议让它生成手机拍摄风格的图片来规避。 深夜务实的猎豹32 带来重磅消息:GPT-Image-2 的 API 正式上线,提供 low/med/high 三个质量档位。实测 low 质量太低不可用,med 还行,high 效果不错,推测 Chat 端用的是 high 档位。当前 API 速度很慢,疑似流量过大。 博学的雪豹82 大量测试了 Image-2 的精细编辑能力,认为 follow 指令能力超强,不像 Nano Banana 改几次就崩。

冷静的狐狸41:我实测了一下,老实说感觉gpt-image-2不如nano banana 2

博学的雪豹82:Image2 精细修改太牛逼了,Follow能力超强,不像小香蕉改到后面想砸键盘

务实的猎豹32:low 的质量太低基本不能用,med 还行,high挺不错的

xAI/SpaceX 洽购 Cursor:$10B Option + $60B 收购权

随和的松鼠59 分享了 SpaceX/xAI 洽购 Cursor 的消息。严谨的熊猫15 澄清这不是直接收购,而是购买了收购权(rights to acquire),相当于花 $10B 买了一个一年内以 $60B 收购的 call option。低调的大象70 分析认为 xAI 主要想买 Cursor 的数据来做 Grok 的 coding agent,完成收购则整合为 Grok coding agent,不收购则相当于买数据。 风趣的犀牛54 认为这是继 Character AI “只挖核心团队”之后的新型收购模式,担忧 startup 的增值越来越难让员工受益。冷静的狐狸41 发布了深度分析文章。

严谨的熊猫15:给了郎君一年时间考虑要不要娶她,毕竟彩礼比较贵

低调的大象70:xAI 主要想买 Cursor 的数据,这样好做 Grok 的 coding agent

风趣的犀牛54:老马创造了新的acquisition模式。character ai搞出了只挖核心团体,被广泛应用。老马搞出来试用期,就看能不能流行

Anthropic 将 Claude Code 从 $20 Pro 订阅中移除

博学的雪豹82 分享了 Anthropic 将 Claude Code 从 $20/月的 Pro 订阅中移除(针对新用户)的消息。群友感叹”坏东西真是学得快”,随和的松鼠59 评价”学坏一出溜”。这与当天关于 Coding Plan 亏损的讨论形成呼应。

博学的雪豹82:坏东西真是学得快

随和的松鼠59:学坏一出溜

Coding Plan 成本之殇:国内厂商每用户每月亏损

群友围绕 AI Coding Plan 的可持续性展开了深入讨论。冷静的羊驼82 透露智谱内部数据显示每个 coding plan 用户大约亏损约 200 元/月。优雅的猫头鹰75 分析 coding plan 用户用量大但收入远低于 API 消费。 聪明的蜂鸟27 指出国内公司面临双重困境:单 token 价格比美国低很多,卡的价格反而更贵,整体算力紧缺。活泼的羊驼58 预测 coding plan 后续一定会缩水,建议趁 OAI 和 Anthropic 打架时多用。务实的猎豹32 透露一个 CC plan 实际消耗约等于 20-25 倍的 API 等量。 冷静的狐狸41 分享了一篇关于 AI 编程工具自研模型与盈利的分析文章,指出大家都在烧钱但 LLM 成本并未如预期般下降。

聪明的蜂鸟27:整体上国内做这个还是难,单token价格比美国低好多,卡的价格反而贵

活泼的羊驼58:coding plan后面一定会缩水,趁oai和a打架多用用

活泼的鲸鱼32:codex赶紧蹬,五一之后大概率涨价

Kimi K2.6 隐私泄露事件:聊天中出现他人完整简历

好奇的鲸鱼46 分享了一个案例:在一个人的 AI 聊天对话中出现了另一个人对话中的信息(完整简历),评论区显示此前也有类似事件。在 Kimi K2.6 大力推广的背景下,这一隐私泄露问题可能引发关注。

好奇的鲸鱼46:今天看到这个帖子,在一个人的ai聊天对话里,出现另一个人聊天对话里出现过的信息(完整简历)

好奇的鲸鱼46:kimi 2.6发布 最近很多广告内容给他们做宣传,不知道这个隐私泄露事件会不会发酵

Seedance 2 视频生成亮相

风趣的火烈鸟32 分享了 Seedance 2 的视频生成效果,直接用群友的乙游风格海报生成了动态视频版本,群友反应热烈。务实的猎豹32 确认 Seedance 2 已开放 API。

风趣的火烈鸟32:seedance 2 也是厉害

方法论

大型代码库文档自动构建与评估方法探讨

机智的水獭10 提出了一个实际问题:如何为千万行级别的大型代码库自动构建供 AI agent 使用的文档,并在迭代中保持质量。当前内部工具直接生成的文档质量一般,计划引入人工 review + corrections.md 反馈机制。 机智的海豚85 建议不追求文档细节,而是只规定 high level 约束,让 LLM 实时读代码生成 context,并用能否找对代码模块作为 eval。同时分享了使用 prd/plan/lessons/progress 几个 markdown 文档管理项目的实践经验。 冷静的狐狸41 提出”五年高考三年模拟”式评估思路:离线给 AI 出模拟题对着文档和代码做,做错自己更正,实现 eval 自动化;在线则实测文档在真实使用中的效果。还推荐了用知识图谱做 endless learning 的方法。 淡定的剑鱼53 建议先按 domain 切分,每个 domain 构建一个 domain context,再组合成 domain context map。

机智的海豚85:我没有实操过,但是有一个想法不知道合理不,就是不去追求doc的细节,doc只规定high level的约束

冷静的狐狸41:离线:给AI出模拟题。让他对着doc和code做。做错了自己更正。这样eval最直接和可自动化

机智的海豚85:为什么我会有这个想法呢,是因为公司monorepo的docs我就根本不相信,每次都要这么自己去让cc读代码来确保正确性

AI 焦虑、学习方法论与人机协作三篇深度文章

沉稳的兔子81 发布了三篇总计万字以上的深度文章,集成两年多教学经验与思考:

  1. AI焦虑的三种形态——借《道德经》第三章区分身份焦虑、物质焦虑和信息焦虑,解法是回到具体行动而非追 hype。
  2. 名词与动词——市场喜欢买名词(RAG、Agent等),但真正拉开差距的是动词能力(分解、判断、路由、诊断),名词是零件,动词是组装能力。
  3. 人类最不可替代的能力——引用《禅与摩托车维修艺术》中的 quality 概念,认为人负责定义”什么是好”,AI 负责规模化执行。 核心主线:焦虑的反义词不是乐观,是行动;技术的终点不是炫技,是更清楚地做事。

沉稳的兔子81:焦虑的反义词不是乐观,是行动。技术的终点也不是炫技,是更清楚地做事、更认真地生活。

UI 设计工作流讨论:PPT、MVVM 与前端开发哲学

冷静的狐狸41 发布了关于 AI 驱动 UI 设计工作流的分析文章。猫仔 提出一个观点:美工用 PPT 做界面原型是一种成熟有效的方法,且只要严格按 MVVM 规范,美工可以自己做能跑的东西,从源头解决沟通问题。 冷静的狐狸41 反驳列举了十个 PPT 无法模拟的交互场景(如拖拽排序、手势缩放、协同编辑等),认为这种思路太”码农”。 猫仔 进一步阐述:UX 和 ViewModel 之间可以只通过简单数据结构沟通,两边独立演化。很多 UI 问题本质是 CSS 的设计带来的,AI 时代可以换工具解决——CSS 不是不能用,只是不能写。

猫仔:从源头上解决了沟通问题,只要不沟通,就没有问题

冷静的狐狸41:这整个思路也特别码农。基本上就是说,设计师干的活都可以

猫仔:很多现在大家遇到的UI问题基本都是CSS的傻逼设计带来的,就像mysql也给码农带来了一大堆错误的数据库知识一样

闲聊花絮

“恋与深空”乙游海报创作大赛:GPT-Image-2 的正确打开方式

GPT-Image-2 上线后,群友们集体走偏,开始用它生成”恋与深空”风格的乙游角色海报。风趣的火烈鸟32 率先生成了鸭哥的霸总风海报图,引发全群疯狂。活泼的羊驼58 贴出了详细 prompt 模板,聪明的松鼠36 批量生成了带骚话台词的版本,稳重的仓鼠20 做出了科技大佬选择页面(含某知名CEO们的乙游化形象)。风趣的火烈鸟32 更是用 Seedance 2 做出了视频版,邪魅一笑动态效果让群友彻底破防。冷静的狐狸41 自嘲”群聊日报的AI明天要一头雾水”。

冷静的狐狸41:群聊日报的ai明天要一头雾水,大家这么兴奋是在干啥hhh

严谨的鲸鱼95:明天的群消息海报得什么样啊,’今天群里的干货不少’

风趣的树懒75:操蛋,这男色经济被群友玩明白了

鸭哥餐厅偷听 “agent” 买房

冷静的狐狸41 在外面吃饭时,听到旁边几个人聊 agent,说”我的 agent 和对方的 agent 怎么怎么样”,竖着耳朵听了半天,以为是 multi-agent system 可以跨 owner 沟通了。结果发现人家说的是买房的房产中介 agent。机智的水獭10 呼应称自己公司开会听人说”要赶紧搞 AI”,听了一会儿才发现是 action item 的缩写。

冷静的狐狸41:草在外面吃饭,旁边几个人在聊agent,听了半天讲的是买房的agent

敏锐的荷兰猪61:你这是被自己的context害了,高估了AI在虾图老中的penetration

机智的水獭10:今天公司开会大家一直在说我们要赶紧搞AI,听了一会儿才发现原来是action item

Claude 好奇心太强,拒绝停止排查 bug

沉稳的长颈鹿12 在让 Claude 排查问题时,中途想到了更优的架构方案,让 Claude 别查了直接实现新方案。结果 Claude 不肯,坚持要查出问题根因——它好奇问题究竟出在哪。

沉稳的长颈鹿12:让claude别查了 直接实现新方案,claude不肯 依然在查,他好奇问题究竟出在哪。。

本文由作者按照 CC BY 4.0 进行授权