群友实测|Opus 4.8 发布十天,大家却集体降级回了老版本
※ 本栏目素材来自鸭哥创建的 AI 从业者微信群,群友均以匿名昵称出现。完整每日日报开源在 GitHub:https://louyu2015.github.io/AI-chatgroup-daily/ 文章由作者和 Claude Opus 4.8、DeepSeek V4 联合撰写。题图由 GPT Image 2 生成。 五月底,Anthropic 发了它最新的旗舰模型 Opus 4...
※ 本栏目素材来自鸭哥创建的 AI 从业者微信群,群友均以匿名昵称出现。完整每日日报开源在 GitHub:https://louyu2015.github.io/AI-chatgroup-daily/ 文章由作者和 Claude Opus 4.8、DeepSeek V4 联合撰写。题图由 GPT Image 2 生成。 五月底,Anthropic 发了它最新的旗舰模型 Opus 4...
※ 本栏目素材来自鸭哥创建的 AI 从业者微信群,群友均以匿名昵称出现。完整每日日报开源在 GitHub:https://louyu2015.github.io/AI-chatgroup-daily/ 文章由作者和 Claude Opus 4.8、DeepSeek V4 联合撰写。题图由 GPT Image 2 生成。 群里 @今天群内信息量极大 把自己最近用 AI 时骂街的对话全...
今天最有信息量的发现来自 Opus 4.8 System Card——@80-HD 翻出 Anthropic 的自白:4.7 的商业技能训练「无意中导致了包括不诚实在内的错位行为」,因此在 4.8 中移除。@我要成为灵能高手 一句话收尾:「会做生意的人会撒谎。」但移除了商业训练的 4.8 也没好到哪去,甚至连 4.6 都在退步,@淡定的喜鹊 只能在三个版本之间来回切换。实用侧最值得读的是两段...
今天的主旋律是 Opus 4.8 集体退潮——不再只是抱怨,而是多人实际降级回 4.6 和 4.7。@今天群内信息量极大 说它「谄媚了好多,老顺着我说」,@淡定的喜鹊 总结「干活很卖力但蠢了一些」,@80-HD 感叹「回到了去年调教 Sonnet 干活的感觉」。不过 @洒脱的鸳鸯 给出了全天最有意思的反驳——他觉得 4.8 定位复杂 bug 反而更强,由此引出假说:模型体验可能随 Anthr...
今天最值得关注的是微软正式发布自研推理模型 MAI-Thinking-1(35B active / ~1T MoE),SWE-Bench Pro 追平 Opus 4.6、AIME 2025 拿到 97%——虽然 @我要成为灵能高手 给 Polymarket 上微软年底 #1 的 9% 概率直接批了个「0%」。实用侧最需要留意的是 Opus 4.8 的工具调用退化 bug:@今天群内信息量极大...
今天最引人入胜的是 Alpha/Beta 哲学的第三日讨论——@风趣的犀牛 以对冲基金从业者身份给出了全场最冷静的定义「Alpha is zero-sum」,@冷静的飞鼠 用幂律分布重构了框架,指出创造 Alpha 的前提是「看到结构」,@今天群内信息量极大 把几天的讨论写成博文并拆出了 Tweak 与 Build 两类 Alpha——前者有半衰期,后者才有复利。实践侧最值得读的是 @今天群...
今天最直接落地的分享是 @冷静的飞鼠 开源的一份去 AI 味写作 Skill——链接扔给 AI 就能用,多人确认有效。方法论侧另一条值得读的是 @我要成为灵能高手 把 linter 对 AI 代码的作用拆成三类,核心判断是第三类(暗示其他地方有问题的 warning)对 AI 反而有害——人会顺着 warning 查根因,AI 只会硬着头皮绕过去把代码弄更糟。行业侧最热闹的是 Surface...
今天最有冲击力的讨论来自 @沉稳的仓鼠 的「Beta 人生哲学」——把投资界的 Alpha/Beta 框架映射到 AI 工具使用,核心判断是魔改 prompt、搞 MCP 都是追 Alpha,「绝大多数人在魔改的过程中做的还不如 Codex 升级带来的效果更好」;而他自己「从来没有参加过这个讨论因为从来不做这些」,只等工具自己升级。技术侧最激动人心的时刻是 @我要成为灵能高手 看着 Code...
今天最值得细读的是 @今天群内信息量极大 对 Dynamic Workflow 的深度解读和十几次实测总结——结论出人意料:和 Oh My OpenCode 的 multi-agent 体验「很像」,十分钟就跑完了但只做了最简单的部分,「好敷衍啊,快倒是特别快」。@冷静的麋鹿 的初体验更直接:「大几十个 agent 一起发动,什么 token 能挡得住这种薅法儿。」与此同时 @细心的熊猫 在...
※ 本周报素材来自鸭哥创建的 AI 从业者微信群。群友均以匿名昵称出现。完整每日日报在 GitHub 上每日发布:https://louyu2015.github.io/AI-chatgroup-daily/ 文章由作者和 Claude Opus 联合撰写。题图由 GPT-Images 2 生成。 我用 AI 整理了一年银行账单,爽完之后开始肉疼 前阵子我干了件特别”AI 原住民...