从 Claude Code 到 Koder:我为什么要自己写一个 Coding Agent Jan 05, 2026

Image

这两年 AI 编程助手火得一塌糊涂。GitHub Copilot、Cursor、Codex、Claude Code……工具一个比一个强,用起来确实爽。只需要用自然语言描述需求,AI 就能帮你写代码、改 Bug、跑测试,甚至排查之前让你绞尽脑汁的线上问题。

...
Notion CEO:每个时代都有“奇迹材料”,现在轮到AI了 Dec 25, 2025

题记:Notion CEO Ivan Zhao 最近发表了一篇长文《蒸汽、钢铁与无限心智》,通过类比钢铁和蒸汽机的历史,探讨了 AI 如何重塑知识工作——从提升个人效率,到改变组织形态,乃至重构整个经济结构。文章视野开阔,类比精准,值得一读。原文链接:Steam, Steel, and Infinite Minds https://x.com/ivanhzhao/status/2003192654545539400。以下为全文翻译。

...
Anthropic万字报告揭秘 AI Agents 落地真相 Dec 17, 2025

如果你还在观望到底要不要在项目里使用 AI Agents,Anthropic 刚刚发布的《2026 State of AI Agents Report》会给你一个明确答案。

报告调研了 500 多家企业,发现 57% 的企业已经部署了多阶段工作流的 AI Agent。注意,这已早不是之前那种简单的聊天机器人,而是能独立完成客服解答、员工入职这类复杂任务的 AI 系统。并且,80% 的企业已经看到了真金白银的投资回报。

...
AI 编程助手的正确打开方式:OpenAI 工程师的实战指南 Dec 15, 2025

大多数人用 AI 编程助手的方式,其实是错的。

包括我自己。之前用 GitHub Copilot,后来又试了 Cursor、Claude Code 和 Codex。刚开始觉得挺神奇,让 AI 生成一段代码,几分钟就出来了。用多了就发现不对劲,生成的代码虽然能跑,质量参差不齐。有时候代码越改越乱,还不如自己写。

...
OpenAI 和 Anthropic 居然合作了?聊聊 Agentic AI 基金会背后的野心 Dec 11, 2025

Image

这两天,OpenAI 和 Anthropic 居然坐到了一起,联合 Block 成立了 Agentic AI 基金会(AAIF),把各自的核心开源项目捐给了 Linux Foundation。

看到这个消息,我第一反应是——这背后的野心不小。想想当年的 CNCF 就明白了。

...
Codex CLI 也能用 Skills 了:把 Claude Code 的“技能包”迁了过来 Dec 08, 2025

Codex CLI v0.65.0 带来了一个我期待已久的功能——Skills 支持。

这个功能最早是 Anthropic 在 Claude Code 上推出的,我已经用了一段时间,早就想着什么时候 Codex 也能有。上周末刷 Codex GitHub 看到合并的 PR,就花了点时间把之前写的 Claude Code Skills 迁移过来,顺手开源在了 GitHub https://github.com/feiskyer/codex-settings 上。

...
当 Kubernetes 遇见 AI:云厂商如何为大模型训练重塑基础设施 Dec 04, 2025

上个月的 KubeCon 上,Google Cloud 宣布在实验环境中成功运行了 13 万节点的 GKE 集群。而在更早的 7 月,AWS 也发布了 EKS 正式支持 10 万节点集群的消息。

10 万节点是什么概念?按 AWS 的说法,这意味着一个集群可以容纳 160 万颗 Trainium 芯片,或者 80 万块 NVIDIA GPU。这已经不是普通的“大规模”了,基本相当于把一个小城市的算力都集中到了一起。

...
一个 Claude Skill,解决 AI 编程最头疼的问题 Dec 01, 2025

上周我想让 Claude Code 帮我验证一个项目中所有数据查询的问题。虽然它们都散乱在项目的不同位置,但任务本身其实不算复杂,大概涉及 100 多个查询。主要复杂的问题在于失败后的处理:找到正确的数据结构、查询一些数据确认有效字段、汇总查询确认可能取值、最后再去重新构造查询。

...
Agent RFT 深度解析:如何让 AI 智能体自我进化 Nov 27, 2025

做过 Agent 开发的朋友应该都有体会,调 Prompt 真是个细活儿。有时候就改了几个词,模型的表现就可能天差地别。工具描述写得不够清楚,工具数量一多,模型就不知道该怎么选择了。任务定义稍微含糊一点,输出就开始极不稳定。这也是为什么很多 Agent 产品发布都很惊艳,但实际场景一上手就完全是另外一回事了。

...
Gemini 3.0 霸榜:AI性能天花板被彻底捅破了 Nov 19, 2025

Gemini 3.0 终于来了,谷歌昨天晚上正式发布了 Gemini 3.0 Pro 预览版,各项测评直接登顶,刷爆 LMArena 榜单。除 SWE-Bench Verified 这一项比 Sonnet 4.5 低一个百分点外,其他各个指标都超越 OpenAI GPT-5.1 和 Claude Sonnet 4.5。特别是 MathArena(数学推理基准)、ScreenSpot(高分辨率GUI基准)、ARC-AGI-2(抽象推理基准)、Human’s Last Exam(人类终极考试基准)等测评基准上都有一倍或数倍的能力提升,这在最近的各大新发顶级模型上还是头一次见。

...