从50%到100%：谷歌代码大模型的自我进化之战

2017年，我在山景城一间堆满服务器的机房里，第一次见证Transformer架构的威力。七年后的今天，同样的机房正在孕育一个更加疯狂的梦想——让AI自己写代码，让代码自己优化AI。从50%到100%：谷歌代码大模型的自我进化之战 IT技术

竞争倒逼下的战略转身

谷歌正经历一场深刻的内部变革。这家搜索巨头的深度学习团队已正式组建专项技术攻关小组，目标直指代码生成能力的质的飞跃。三位内部人士的确认，让这场静默的军备竞赛浮出水面。从50%到100%：谷歌代码大模型的自我进化之战 IT技术

变革的导火索，来自AnthropicClaudeCode的强势崛起。在基准测试中，这家AI独角兽的代码工具已全面超越谷歌Gemini的相应能力。更具讽刺意味的是，ClaudeCode团队今年1月透露，他们近百分之百的工程代码已实现AI自主生成。

谷歌的应对策略清晰而决绝：不再依赖开源数据集，而是直接用内部代码库从头训练专用模型。这条路艰难却必要。公开代码与谷歌私有代码在结构、风格、依赖关系上存在本质差异，前者训练出的模型永远无法精准适配后者的复杂场景。

专项团队由前预训练项目负责人塞巴斯蒂安·博尔若亲自挂帅。这支队伍的核心任务，是攻克模型在长程代码任务中的理解与生成瓶颈——那种需要模型完整扫描数千行代码、精准把握上下文意图的复杂任务。

真正的变革从来都是自上而下的。联合创始人谢尔盖·布林亲自介入，首席技术官科雷·卡武克库奥格鲁直接参与项目，这在谷歌历史上极为罕见。布林的内部备忘录措辞近乎命令：必须果断转向智能体技术，必须弥补执行能力的差距，必须让模型成为代码的核心开发者。

这不是技术升级，而是一场范式转换。代码智能体配合数学推理、实验自动化，意味着AI工程师的工作将在可见的未来被大规模替代。

战略意图需要战术执行来兑现。谷歌参照Meta的成熟经验，建立内部工具使用排行榜JetSki，所有Gemini项目工程师在处理复杂多步骤任务时，必须强制调用智能体工具。部分团队的工程师已被要求完成专项AI培训。

官方数据显示，谷歌当前约百分之五十的代码已由智能体完成。这一数字与Anthropic的近乎百分之百仍有显著差距，但追赶的路径已然清晰。

这场竞赛对从业者意味着什么？第一，代码生成能力已从辅助工具升级为核心竞争力，各家的投入只会持续加码。第二，内部专用模型的价值远超通用模型，用自有数据训练专用工具将成为行业标配。第三，AI代码生成的渗透率正在加速攀升，纯手写代码的时代窗口正在关闭。

布林说，要赢得最终冲刺。而冲刺的终点线，是AI能够自己跑向终点。