# 2026 年 AI 编程 从 入门到实践

TIP

在 2025 年 12 月 27 日的凌晨 Andrej Karpathy 在 X 上 (opens new window)说:

作为一名程序员,我从未感到如此落后。随着程序员贡献的部分越来越少,整个行业正在经历剧烈的重构。我感觉,如果我能正确地整合过去一年左右涌现的各种资源,我的能力可以提升十倍。而未能充分利用这些资源,让我感觉自己明显缺乏技能。

Andrej Karpathy 安德烈·卡帕西:曾任特斯拉人工智能总监,OpenAI 创始团队成员,斯坦福大学计算机科学博士/硕士。同时,也是首次提出 “Vibe Coding” 编程方式的人。

image-20260102234007391

觉醒,现在是编程最好的时代。

2025 年,AI 编程工具让"用自然语言描述需求,AI 生成代码"成为现实。本节将学习场变革的背景 并 带你具体动手实践。

# 一、2025 年,编程世界发生了什么

01-awakening_1.1-coder-to-commander_1.1.1-coder-to-commander.png

# 1、一条推文引发的革命

TIP

2025 年 2 月,前特斯拉 AI 总监、OpenAI 联合创始人 Andrej Karpathy 在社交媒体上发了一条推文。

他说:"有一种新的编程方式,我称之为 'vibe coding'(氛围编程)。你完全沉浸在感觉中,拥抱指数级变化,甚至忘记代码的存在。"

这条推文 (opens new window)引发广泛讨论的原因是——我们正在进入一个不需要"写"代码也能"做"软件的时代

image-20260102233249704

# 2、"Vibe Coding" 成为年度热词

TIP

  • 2025 年 3 月,《韦氏英语惯用法词典》(Merriam-Webster'sConcise Dictionary ofEnglish Usage)正式将“vibe coding (opens new window)”收录为年度科技词汇
  • 2025 年 11 月,柯林斯词典宣布:"Vibe Coding" 当选年度词汇。

# 3、数据不会说谎

TIP

Y Combinator 的惊人发现,2025 年 3 月,全球最著名的创业孵化器 Y Combinator 的 CEO Garry Tan 透露:

在最新一批创业公司中,有 25%的公司报告——它们 95%的代码是由 AI 生成的。

这些不是玩票的业余项目,而是正在融资、正在增长的真实创业公司。

更让人惊讶的是,这些公司的团队规模往往不到 10 人,却能做出以前需要几十人才能完成的产品。

# 4、行业数据

数据来源:Second Talent 2025 统计、Bubble 调研报

指标 数据
使用 AI 编程工具的美国开发者 92%
全球代码中 AI 生成的比例 41%
Vibe Coding 用户中非开发者占比 63%
使用 AI 后开发速度提升 最高 55%
市场规模预测(2032 年) 从 49 亿 →301 亿美元

注:

其中的 63%——超过一半的 Vibe Coding 用户根本不是程序员。他们是设计师、产品经理、创业者、甚至文科生。

# 5、意味着什么

让我们把这几件事串起来:

image-20260112213847340

编程正在从"专业技能"变成"通用工具"。

就像 Excel 让每个人都能处理数据,Word 让每个人都能排版文档一样,AI 编程工具正在让每个人都能创造软件。

# 6、从 程序员 到 指挥官 的角色转变

image-20260105183031637

用开车来打个比方

时代名称 类比场景 详细描述 对应编程场景
手动挡时代(传统编程) 从北京开车去上海用手动挡 需熟练掌握离合器、换挡技巧,时刻关注转速,新手易熄火 必须掌握很多“操作技巧”,才能让程序跑起来
自动挡时代(代码补全) 从北京开车去上海换自动挡 不用管离合器和换挡,可把更多注意力放在路况上 GitHub Copilot 等工具,AI 帮你补全代码片段,但仍需懂代码、会“开车”
"自动驾驶时代"(Vibe Coding) 乘坐自动驾驶出租车去外滩 只需说“我要去外滩”,车子自己规划路线、自己开,走错了说一声就行 说清楚目的地,AI 完成所有操作

注:

当前实际开发中,还远远没有到 "自动驾驶" 阶段,还是处于 L2+(辅助驾驶) ~ L3(有条件自动驾驶) 过渡阶段,都需要驾驶员接管。L2 责任人仍然是驾驶员,L3 事故责任开始从驾驶员转向系统/制造商

# 7、工作流程的变化

传统编程 AI 时代
学习编程语言:花几个月学 JavaScript、Python 或其他语言 告诉 AI 你想要什么:"帮我做一个待办清单,可以添加任务、标记完成、删除任务"
理解语法规则:记住各种括号、分号、缩进规则 看 AI 生成代码:几秒钟后,代码就出现了
一行一行写代码:把每个功能都"翻译"成计算机能懂的指令 试试看效果:运行一下,看看是不是你想要的
不停地调试:程序报错了?自己一行行找问题 告诉 AI 怎么改:"把完成的任务变成灰色,加一个删除线"
查文档、问社区:遇到不会的,花几小时搜索解决方案 继续迭代:直到满意为止
整个过程像在学一门外语——你得先学会语法,才能表达自己想说的话。 整个过程更像在和一个懂技术的助手对话——你说想法,它来实现。

# 8、核心技能的迁移

过去的核心技能 现在的核心技能
记住语法规则 把需求说清楚
手写代码 判断代码对不对
调试找 bug 描述问题让 AI 修
阅读技术文档 知道什么该问、什么该查

用开车的类比:

你需要知道的 你不需要知道的
我要去哪(需求) 发动机怎么工作(底层原理)
走哪条路更快(大方向) 变速箱的原理(语法细节)
到没到、对不对(验收) 如何修车(手写每行代码)
路况不对要调整(迭代) 汽车电路图(复杂架构)

简单说:从"写代码"变成"表达清楚 + 判断对错"。

# 9、什么没变

TIP

虽然"怎么做"变了,但有些东西永远不会变:

  • 你需要知道自己想要什么:AI 再聪明,也不能替你想清楚要做什么
  • 你需要判断结果好不好:AI 可能会出错,你得能看出来
  • 你需要有解决问题的思路:遇到问题时,知道怎么一步步排查

AI 目前还不是"完全自动驾驶"

就像今天的自动驾驶汽车,AI 编程也需要你保持关注、随时接手、负最终责任。Vibe Coding 更像是"L3 级自动驾驶"——大部分时候 AI 来做,但你得盯着,关键时刻你得上,最终还得咱自己负责。

AI 接管了"执行",但"思考"和"决策"还是你的事。

# 10、2025 年下半年继续进化

TIP

2025 年下半年,行业开始从 Vibe Coding 进化到 Context Engineering(上下文工程)。

Vibe Coding 强调"跟着感觉走",快速出结果。Context Engineering 则强调:给 AI 提供足够的上下文,让它理解你的项目背景、代码规范、业务逻辑。

换句话说:想让 AI 帮得更好,你需要学会"提供好的上下文"。这也是接下来要重点学习的内容。

# 11、对我们意味着什么

TIP

如果你会用滴滴打车,你就已经具备了 Vibe Coding 最核心的能力:

  • 说清楚你要去哪(表达需求)
  • 判断司机有没有走错路(验收结果)
  • 必要时给司机指路(引导调整)

这取决于个人优势。如果你擅长表达、沟通,擅长想清楚需求,对细节敏感、能发现问题——这些都是你的优势。

如果你还懂编程,那真是 游刃有余,不再会匆匆忙忙

# 二、学习 AI 编程必懂的理论基础

TIP

深入浅出 人工智能的 5 个阶段,国内外不同阶段的产品代表。国内外知名的大模型和工具,AI 编程的经济学相关内容。

# 1、人工智能的 5 个 阶段

TIP

OpenAI 公司在 2024 年 7 月正式提出,这套分级系统旨在衡量通往“通用人工智能(AGI)”的进展,帮助外界理解 AI 能力的演进路径。

OpenAI 领导层制定这套标准是为了让员工、投资者和董事会更清晰地了解公司距离实现 AGI 还有多远。目前已经成为行业共识。

阶段 定义 能力特征 应用场景
L1: 聊天机器人
(Chatbots)
具备交互能力的 AI:以自然的语言为基础对话的交互系统,聚焦语言理解与生成 极高的语言理解力,具备原生多模态交互(实时音视频),能处理千万级超长上下文。 客户服务、日常对话、信息查询、简单任务执行
L2: 推理者
(Reasoners)
具有人类博士水平的解决问题能力,能进行复杂逻辑推理。 具备“慢思考”模式,通过强化学习实现深度逻辑推导:逻辑推理、数学证明、代码编写、专业领域问题解决、多步骤推导 高级编程架构、学术研究、科学实验模拟、精密审计、复杂数学证明。
L3: 智能体
(Agents)
可以采取行动的系统 (执行力):自主执行复杂任务的行动系统 2025 年的行业重心。AI 不仅是大脑,还拥有“手”。
能自主操作电脑 (Computer Use)、调用跨平台工具并闭环执行任务。
自动化流程、智能助手、复杂任务执行。
自动处理复杂的差旅报销、自主开发并部署应用、全自动化自媒体运营。
L4: 创新者
(Innovators)
能够辅助人类进行科学发现,提出新的理论或发明创造。 科学理论创新、技术发明、创意设计、突破性成果生成
能够生成超越现有训练数据的知识。通过 AI for Science 发现新规律。
科学研究、技术突破、创意产业、新药研发
新型超导材料研发、靶向药物分子设计、预测极端气候模型。
L5: 组织者
(Organizations)
可以自主运行 并 协作组织工作的 AI
统筹全局的智能管理系统。
处理一个完整组织(如公司)的任务。
AGI 的终极形态。AI 能够管理一个完整的机构,自主进行战略规划、资源调配和人员(智能体)协作。
全自动化的未来形态
“一人独角兽公司”、全自动化的全球供应链管理。

# 2、国内外人工智能 5 个阶段的产品代表

截止 2025 年 12 月,国内外 人工智能 5 个阶段的产品代表

阶段 国内 国际
L1:聊天机器人 (Chatbots) DeepSeek、豆包、文心一言、通义千问、腾讯元宝、Kimi Chat、讯飞星火、MiniMax Gemini 3 Flash, Claude 4.5 Sonnet, GPT-5.2 mini 等
L2:推理者 (Reasoners) DeepSeek V3.2-Speciale, Kimi k0-math 2.1、GLM-4.7、QwQ-32B、讯飞星火 X1、Doubao-1.5-thinking-pro、文心 X1.1 GPT-5.2 (Thinking), Claude 4.5 Opus、Gemini 3 Deep Think 等
L3:智能体 (Agents) DeepSeek V3.2 (Agent 模式), 智谱 AutoGLM、扣子(Coze)、Moonshot AI Agents (Kimi) OpenAI Operator**, Manus (正式版), **Gemini Deep Research Agent 等
L4:创新者 (Innovators) 各大厂都有内部创新项目 AlphaFold 3 (升级版), Google GNoME, GPT-5.2 Pro (科研专用)
L5:组织 (Organizations) “城市大脑”/“产业大脑”,多智能体协作系统研究 现状: 处于理论概念验证阶段,尚未出现成熟的单一商用产品。

# 3、什么是 AI 大模型

TIP

AI 大模型,通常指的是“大规模预训练模型”(Large Pre-trained Models)。你可以把它想象成一个被海量数据“喂养”长大的、非常聪明的“数字大脑”。

模型的本质: 负责理解意图和生成内容

专业解释:

AI 大模型是参数量巨大、基于深度神经网络构建的模型,通过海量数据预训练实现通用能力,再经微调适配特定任务。其核心特征包括参数量大(通常达数十亿至万亿级)、训练数据庞大(超万亿 token)、计算资源消耗高,且具备多模态处理能力(如文本、图像、音频、视频的联合理解与生成)。

它的核心特点是:

  • 规模巨大: 模型的参数数量极其庞大,通常从数十亿到数万亿不等。参数越多,模型能学习和存储的知识就越复杂、越细致。
  • 预训练: 在正式“上岗”解决特定问题前,它会先在包含互联网上几乎所有公开文本、代码、图片等海量、多样化的数据上进行“通识教育”(即预训练)。这让它掌握了语言、逻辑、世界知识等通用能力。
  • 强大的泛化能力: 完成预训练后,这个模型就成了一个通用的“基础模型”。我们只需要用少量特定的数据对它进行“微调”(Fine-tuning),就能让它迅速适应并高效完成各种具体任务,比如写文章、回答问题、写代码、画画等。

简单来说,AI 大模型 = 海量数据 + 巨大模型 + 强大算力

# 3.1、大模型 与 工具的关系

TIP

  • 模型:负责理解意图和生成内容。比如你问"怎么写登录功能",模型分析后返回代码方案。
  • 工具:负责执行具体操作。比如读取文件、运行命令、提交代码。

工具需要接入模型才能工作。

# 3.2、国内外知名的 AI 大模型

以下是一些在国内外非常知名的代表性大模型,它们各有千秋:

国际厂商

模型名称 所属公司 主要特点和应用 代表性发布/更新时间
GPT OpenAI 行业风向标:融合了 o 系列的逻辑推理与 GPT 系列的快速响应。GPT-5 具备极强的多模态理解力及自主 Agent 执行力。 2025 年 8 月 (GPT-5)
Gemini Google 原生多模态:在搜索集成、长上下文(200 万+ tokens)和视频理解上极具优势。Gemini 2.0 系列强调低延迟交互。 2024 年 12 月 (2.0 系列)
Llama Meta
(Facebook)
开源领袖:全球最受欢迎的开源模型。Llama 4 系列在推理能力上已能与最顶级的闭源模型(如 GPT-4/5)抗衡。 2025 年中 (Llama 4)
Claude Anthropic 人文与逻辑平衡:以“宪法 AI”著称,安全性高。Claude 4.x 在创意写作、长文档分析和复杂编程(Claude Code)方面表现卓越。 2025 年 8 月 (Claude 4)
Grok xAI 实时性与硬核推理:深度集成 X 平台实时数据。Grok-3 在科学计算和工程问题上表现强劲,风格犀利、无审查。由埃隆·马斯克创立的公司开发。 2025 年末 (Grok-3)
Mistral Mistral AI 欧洲最强/高效率:强调推理效率。Mistral Large 3 系列在混合专家模型 (MoE) 架构上达到极致,受开发者青睐。来自法国的初创公司 2025 年 12 月 (Large 3)

国内厂商

模型名称 所属公司 主要特点和应用 代表性发布/更新时间
DeepSeek 深度求索 性价比之王:中国最强开源力量。DeepSeek-V3.2/R1 系列在数学逻辑和代码能力上惊艳全球,推理成本极低。 2025 年 12 月 (V3.2 正式版)
Doubao (豆包) 字节跳动 超大规模应用:原云雀模型。日均调用量惊人,擅长语音交互和消费者应用,插件生态极其丰富。 2024 年 5 月 (品牌更名)
文心大模型 百度 企业级服务:ERNIE 4.5/5.0 系列深度集成百度搜索生态,中文理解及政企定制化能力极强。 2025 年 (迭代至 5.0)
Qwen (通义千问) 阿里巴巴 全能型/商业生态:支持超长上下文,在中文榜单和代码榜单常年领先,与阿里云深度绑定。 2025 年 4 月 (Qwen 3)
Hunyuan (混元) 腾讯 全模态/社交集成:在视频生成(可信度高)和微信生态集成方面有独特优势,擅长多轮对话逻辑。 2025 年 (多次迭代)
GLM (智谱清言) 智谱 AI 学术背景/强推理:源自清华。GLM-5 系列在复杂推理和智能体 Agent 调度上表现出色,是国内开源社区的核心。 2025 年 (迭代至 5 代)
Kimi 月之暗面 长文本专家:国内率先攻克“长上下文”瓶颈。Kimi-K2 推理模型在处理数百万字文档、学术检索方面口碑极佳。 2025 年 (K2 系列)
MiniMax 稀宇极智 情感交互/全模态:旗下海螺 AI 在语音生成和视频生成(Hailuo 2.0)上处于国际领先水平,AI 社交属性强。 2025 年 12 月 (M2.1 系列)

# 4、AI 编程的经济学

TIP

"模型决定代码能力的速度和上限",以及成本意识在 AI 开发中的重要性。Token 就是钱,每次调用模型都在消耗真实的费用。

  • 理解 Token 是 AI 模型的计价单位,掌握输入/输出 Token 的计费机制
  • 建立成本意识,学会通过精准提示词控制 AI 上下文范围来优化成本
  • 掌握提示词优化的核心原则:指定路径、明确范围、删除客套话
  • 理解上下文大小与花费的关系,学会避免不必要的 Token 消耗

# 4.1、什么是 LLM

TIP

LLM(Large Language Model,大语言模型)是基于海量文本训练的 AI 模型,能够理解和生成人类语言、代码等。

# 4.2、什么是 Token

TIP

Token 是 AI 模型的计价单位,也是模型处理文本的基本单元。

换算关系

  • 1 个汉字 ≈ 1 Token
  • 1 个英文单词 ≈ 0.75 Token
  • 1 行代码 ≈ 5-15 Token

模型按照输入(Prompt)和输出(Completion)的 Token 数量计费。

扣减费用 = token 消耗量 × 模型单价

# 4.3、什么是 输入/输出 Token

TIP

  • 输入 Token(Input):你发送给模型的内容(提示词、代码、上下文)
  • 输出 Token(Output):模型生成的内容(代码、解释、回答)

花费怎么算:输入和输出的 Token 数量都会计费,输出通常比输入贵一些。

但作为用户,你不需要记住具体单价——工具会显示每次调用的花费,用完了充值即可。重要的是理解:上下文越大,花费越高

# 4.4、什么是 Context Window

TIP

Context Window 是模型能处理的上下文长度上限,以 Token 为单位。GLM-4.7 支持 200K 上下文,足够处理完整的大型文件和长对话。

超出上限会自动压缩:当上下文接近或超出限制时,模型会自动压缩早期的对话内容,保留最新和最相关的信息。这可能导致部分历史细节被简化或忽略。

# 4.5、钱花哪去了

image-20260112215231311

TIP

  • 单次调用很便宜,但累积起来也是钱
  • 上下文越大 = 花费越高:读取整个项目 vs 只读一个文件,差异是数量级的
  • 频繁调试时要注意:循环修改会不断累积 Token

如何控制花费

大多数 AI 编程工具都会:

  • 显示每次调用的 Token 数和花费
  • 提供套餐或使用额度
  • 额度用完后提醒你充值

你不需要记住具体单价,但需要养成好习惯(见下一节)来减少不必要的消耗。

# 4.6、成本与质量优化策略

TIP

关键认知:提示词本身通常很少,真正消耗 Token 的是 AI 读取的上下文——也就是为了让 AI 理解你的需求而必须加载的项目文件、代码、历史对话等。

因此,提示词优化不是在"打磨话术",而是减少 AI 需要读取的上下文范围,同时控制输出长度

上下文范围既影响成本,也影响质量:精准的上下文让 AI 聚焦问题,输出更准确;无关的上下文会分散注意力,增加错误概率。

优化原则

  • 指定文件/文件夹路径 —— 缩小 AI 搜索范围
  • 指明功能范围 —— "登录功能有问题"比"项目有问题"更聚焦
  • 删除客套话 —— 无需"请"、"谢谢"、"如果可能的话"

示例对比

❌ 模糊提示(AI 读取更多上下文):
"帮我看看项目里有没有什么问题,然后修复它"
→ AI 不确定从哪里开始,可能读取大量无关文件

✅ 精准提示(AI 聚焦相关区域):
→ 或者更直接:"修复 src/routes/auth.ts 第 26 行的类型错误:user 可能为 null"

不需要设定"专家角色"

很多人习惯在提示词开头加"你是一位资深的 React 专家..."——这是多余的

CLI 工具或 AI IDE 的系统提示词已经包含了角色设定和编程语言上下文。你只需要直接描述任务,AI 会根据项目类型自动适配。

直接说事 比 "先设定角色再说事" 更高效。

# 4.7、实战建议

TIP

关注使用情况

  • AI 编程工具通常会显示每次调用的 Token 数和花费。你也可以在对应模型的开放平台查看详细使用情况。
  • 额度用完就充值 —— 就像话费流量一样,不需要过度焦虑,但要有意识地避免浪费。

成本意识检查清单

  • 指定文件/文件夹路径
  • 指明功能范围
  • 删除客套话
  • 定期清理对话历史

总结:上下文决定花费和质量,直接比客套更重要。 指定路径或功能范围,让 AI 只读取必要上下文。精准上下文既省钱,又让输出更准确。

# 三、AI 编程的工具形态

TIP

什么是 AI 编程工具:AI 编程工具是集成了 AI 能力的编辑器,能帮你写代码、查错误、解释代码。

# 1、全球 AI 编程工具形态

TIP

目前全球市场中,AI 编程的工具形态有 3 种

  • AI Plugin 以插件形态:在现有开发工具中安装插件就能使用 AI 能力(文心快码、通义灵码、Claude Code for VS Code 等)
  • AI IDE ,AI 集成开发工具:Cursor、TRAE、Antigravity ... 等
  • AI CLI ,命令行 Agent:Gemini CLI、GitHub Copilot CLI、Codex CLI、Claude Code ... 等
形态 工具类型 描述 特点 产品
AI Plugin 智能副驾 插件形态,覆盖市场主流 IDE - 覆盖如 VSCode、JetBrains IDEs 等 IDE。
- 不改变现有研发使用 IDE 习惯。
- 团队内快速落地 AI Coding。
文心快码、通义灵码、GitHub Copilot、Claude Code for VS Code 、OpenCode、JetBrains 全家桶 ...等
AI IDE 一站式 AI 工作台 独立 IDE,开箱即用 - “集成开发环境”转为“智能开发环境”。
- 产设研一体,软件工程全生命周期覆盖。
Cursor、TRAE、Antigravity ... 等
AI CLI Agent 操作系统 命令行 Agent,终端即开发 - Unix 类命令行交互。
- 批处理、多系统异步协作,7x24 运行。
- 融入现有 DevOps 工具链。
Gemini CLI、GitHub Copilot CLI、Codex CLI、Claude Code ... 等

# 2、AI Plugin 以 IDE 插件形态

TIP

这是目前最主流、应用最广泛的形态。它们作为插件无缝集成到开发者熟悉的集成开发环境(IDE)中,或以独立应用形式提供实时代码补全、函数生成、代码解释等功能。

产品名称 出品公司 核心大模型 支持 IDE 和 语言
通义灵码 (opens new window) 阿里巴巴 通义大模型 主流编程语言都支持
支持 VSCode、Visual Studio、JetBrains IDEs 等主流编程工具
Comate 文心快码 (opens new window) 百度 文心大模型 主流编程语言都支持
支持 VSCode、JetBrains IDEs、Visual Studio、Xcode、Eclipse 等
GitHub Copilot (opens new window) GitHub 和 OpenAI 联合开发 默认 GPT 模型 主流编程语言都支持
深度集成在 VS Code、JetBrains IDEs 等
Claude Code for VS Code (opens new window) Anthropic Claude Opus 4.5、Sonnet 4.5 和 Haiku 4.5 模型 主流编程语言都支持
支持 VS Code、Cursor 和 Windsurf 等 VS Code 分支以及 JetBrains 的原生扩展
OpenCode (opens new window) AnomalyCo(由开源社区驱动) 几乎所有模型 主流编程语言都支持
支持 VS Code 及 所有 AI IDE,通过终端所有都支持

以上的所有插件在现有的 IDE 编程工具插件商店中直接搜索名称,即可安装使用

# 3、AI IDE 编程开发工具

TIP

IDE 是图形界面的开发环境:左侧是文件目录,中间是代码编辑区,底部是终端和输出窗口。你可以直接查看文件、安装可视化插件、在界面内调试和运行代码。

AI IDE 在此基础上集成了 AI Agent。这些 Agent 可以使用内置终端执行命令,读取和编辑项目文件,调用 Git 操作——和 AI CLI 工具的能力完全相同。区别只在于交互方式:IDE 用图形界面,CLI 用命令行。

本质上,IDE 里的 AI 和 CLI 工具里的 AI 是同一个东西,只是住的地方不同。

# 3.1、IDE 开发工具 与 VSCode 的关系

TIP

大部分 AI IDE 基于 VS Code 开发(VS Code 是开源项目):

  • Cursor:VS Code 的分支,深度集成 AI
  • Windsurf:基于 VS Code,由 Codeium 开发
  • TraeQoder:兼容 VS Code 生态
  • ...

# 3.2、IDE 开发工具的技术实现

TIP

利用 VSCode 庞大的用户基础 和 “足够好”的架构,以最低的迁移成本提供最强的 AI 能力。Cursor 是此路线的开创者和典型代表。

  • 界面和操作习惯与 VS Code 一致
  • 无缝兼容海量 VSCode 插件 和 主题,用户无学习成本
  • 快速启动:基于成熟架构,能快速推出稳定产品
  • 深度集成、多文件 Agent 体验极佳
  • VSCode 作为底层编辑器,在其之上深度集成 AI 能力(如智能补全、对话、代码管理)
  • 只要使用过 VSCode,目前市场上所有的 AI IDE 编程开发工具都可以零成本上手
  • 最大短板:插件兼容性风险、需要迁移整个开发环境

# 3.3、国际厂商 IDE 开发工具

工具 所属公司 主要特点 / 定位 发布时间
Cursor (opens new window) Anysphere 行业先行者 / 深度集成:目前最流行的 AI 代码编辑器。首创了 Composer(多文件编辑)和 Tab(强力预测补全)功能,能精准索引本地代码库上下文。 2023 年 1 月 23 日
Windsurf (opens new window) Codeium Flow 状态流 / 上下文引擎:主打“Flow”概念。其最大的特点是 AI 代理与开发者之间的“无缝协作”,模型不仅能写代码,还能实时感知你当前的操作意图。 2024 年 10 月 22 日
Kiro (opens new window) AWS(亚马逊) 规范驱动 (Spec-Driven) / 企业级:主打“告别随缘代码”。要求先写需求和设计文档,再由 AI 执行。能自动生成测试用例并进行基于属性的测试,非常严谨。 2025 年 7 月 14 日
Antigravity (opens new window) Google 端到端代理 (Agent-first) / 全自动化:定位是“任务执行平台”而非单纯编辑器。能自主操作终端、浏览器和编辑器。特色是会生成“执行录屏”供人类审计任务进度。 2025 年 11 月 19 日
GitHub Copilot (opens new window) Microsoft (GitHub) 行业标杆 / 通用助手:基于 OpenAI 模型。深度集成于 VS Code 等主流 IDE,支持代码补全、聊天对话及拉取请求总结。 2021 年 6 月 (预览版)
JetBrains AI (opens new window) JetBrains 深度集成 / 语义感知:专为 IntelliJ IDEA、PyCharm 等 IDE 设计。特点是能理解复杂的项目结构,中国区版本与阿里云通义大模型深度合作。 2023 年 6 月 (预览版)
Zed Zed Collective 极致性能 / 原生 AI:由 Rust 编写的高性能编辑器。定位是“快”,其 AI 服务原生集成了 Anthropic 的 Claude 模型,强调极低延迟的实时代码生成。 2024 年 1 月 (开源)
OpenCode (opens new window) AnomalyCo(由开源社区驱动) OpenCode 的定位是**“为终端(Terminal)而生的 AI 编码代理”**,旨在挑战像 Cursor 或 Claude Code 这样的工具,但它更强调极客感和灵活性。 2025 年 6 月(开源)

# 3.4、国内厂商 IDE 开发工具

工具 所属公司 主要特点 / 定位 发布时间
TRAE (opens new window) 字节跳动 AI 原生的智能开发工具,支持通过Builder 模式从零生成完整项目,具备代码解释、修改、Bug 排查等辅助功能。 2025 年 1 月 19 日
Comate AI IDE (opens new window) 百度 AI 原生集成开发环境,深度整合文心大模型,覆盖需求理解、智能编码、辅助调试及软件运维全流程。 2025 年 6 月 23 日
CodeBuddy (opens new window) 腾讯 全球首个产设研一体的 AI 全栈工程师,实现产品 → 设计 → 研发 → 部署一站式全流程,深度集成 Figma 设计稿转代码功能,强腾讯生态 2025 年 7 月 22 日
Qoder (opens new window) 阿里巴巴 阿里 Agentic 编程平台,支持 Quest 模式,通过自然语言描述即可自动拆解开发任务、编写代码并执行,实现从 0 到 1 生成项目。支持一次检索 10 万代码文件,智能路由选择最佳模型 2025 年 8 月 22 日
CodeGeeX (opens new window) 清华大学 + 智谱 AI 多语言支持 / 国产自研:基于智谱大模型。支持 100+ 语言,对中文注释理解极佳,提供免费的个人版,支持 VS Code 和 JetBrains 全家桶。 2022 年 9 月 (开源)

# 3.5、常用 AI IDE 开发工具的 模型支持 及 费用

工具名称 支持的 AI 模型 模型免费额度 模型特点与定位
Antigravity Gemini 3 Pro、Gemini 3 Flash、Claude Sonnet 4.5、Claude Opus 4.5 、GPT-OSS 120B 免费使用/有额度限制,每 5 小时刷新一次 整合 Google、Anthropic、OpenAI 三大主流模型,支持多模型切换
Kiro Sonnet 4、Sonnet 4.5、Haiku 4.5、Opus 4.5 **限时免费 **首次 500 积分/30 天 深度集成 Anthropic 最新 Claude 系列,强调安全性和可控性
Qoder Claude、GPT、Gemini 系列都支持 **限时免费 **为期 2 周的 Pro 试用 及 300 积分 采用智能路由机制,自动为不同任务匹配最合适的模型
CodeBuddy 国际版:Claude、GPT、Gemini;
国内版:腾讯混元、DeepSeek
限时免费 每月 2000 积分 双轨模型架构,国际版与国内版分别接入不同模型生态
Cursor Gemini 3 Pro、Gemini 3 Flash、Claude Sonnet 4.5、Claude Opus 4.5 、GPT-5.2 等 限时免费 一周 Pro 试用 专注高质量代码生成,在复杂项目重构方面表现突出
TRAE 豆包(doubao-1.5-pro)、DeepSeek R1、DeepSeek V3 国内版:免费使用
国际版:每月高级模型 10 个快速请求50 个慢速请求
国产模型为主,针对中文场景优化,提供免费使用
Windsurf OpenAI、Claude、Gemini、xAI 系列等 限时免费 每月 25 个即时积分 完全免费使用,融合两种顶级模型能力
Comate AI IDE 文心大模型(ERNIE) 个人标准版免费,功能受限 基于百度文心大模型,结合百度内部编程大数据训练
GitHub Copilot Anthropic Claude Sonnet 4、GPT-5、Gemini 2.5 Pro 等 免费试用 Copilot Pro 30 天 无限制代理模式和与 GPT-5 的聊天

# 4、AI CLI 命令行终端工具

TIP

CLI 工具在终端里运行,通过文字交互。没有图形界面,但能做同样的事:读取文件、搜索代码、运行命令、提交 Git。

你告诉它"修复这个 Bug",它会自己找出问题、修改代码、运行测试。你扮演产品经理的角色,告诉它要做什么,它负责实现。

名称 开发商 官网
Claude Code Anthropic https://claude.com/product/claude-code (opens new window)
Codex CLI OpenAI https://openai.com/codex (opens new window)
Qoder CLI 阿里巴巴 https://qoder.com (opens new window)
Factory Droid Factory AI https://factory.ai/product/cli (opens new window)
Warp Warpdotdev https://www.warp.dev (opens new window)
OpenCode AnomalyCo(由开源社区驱动) https://github.com/anomalyco/opencode (opens new window)

# 4.1、AI CLI 特点 和 优势

维度 特点 (Features) 优势 (Advantages) 缺点 (Disadvantages)
交互模式 文本驱动:通过自然语言指令直接触发系统命令或代码修改。 极致速度:无需在浏览器、编辑器和终端之间反复切换(Context Switching)。 学习曲线:用户需要具备基础的终端操作知识,对非技术人员不友好。
操作权限 系统级读写:能直接访问本地文件、运行测试、读写数据库、操作 Git。 端到端自动化:能实现“指令 -> 修改 -> 测试 -> 提交”的全流程闭环。 安全风险:如果 AI 指令理解有误,可能误删文件或执行高风险系统命令。
工作流 代理式 (Agentic):不仅生成建议,还能自主执行一系列任务。 深度上下文感知:AI 能感知整个项目的目录结构和环境变量,而不仅是单个文件。
工具能理解当前目录、操作系统、已安装软件(如 Git, Docker)等环境信息。
不可见性:缺乏图形化界面的视觉反馈,修改大量文件时“感知度”较低。
性能消耗 轻量化:无图形渲染压力,占用内存极低。 远程友好:完美支持 SSH 远程服务器开发,即便网络波动也能稳定工作。 费用不可控:部分工具按 API 调用计费,复杂的自主循环可能导致账单超支。
协作方式 透明化记录:所有的 AI 交互都留在终端历史或 Git 提交记录中。 易于集成:非常容易集成进 CI/CD 流程或现有的自动化脚本中。 审查成本: Review AI 修改的代码 diff(差异)在终端下不如 IDE 方便。

# 4.2、为什么开发者偏爱 AI CLI

TIP

在 AI 时代的编程中,最浪费时间的操作是:“复制 AI 生成的代码 -> 打开 IDE -> 找到对应行 -> 粘贴 -> 运行报错 -> 复制报错回 AI”

AI CLI 彻底消灭了这个循环。它直接在你的工作目录下“施工”,报错了它自己看,改好了它自己测,你只需要在终端回复 y (Yes) 或 n (No)。

# 4.3、适用场景建议

TIP

  • 推荐使用 CLI: 复杂的重构任务、全库 Bug 扫描、自动化测试生成、DevOps 运维脚本编写、远程服务器维护。
  • 推荐使用 GUI (如 Cursor): UI 界面调整、初学者的代码解释、小规模的功能点编写、需要精细视觉核对的代码修改。

# 5、国内外大厂“对话式” 编程应用开发平台(适合无任何代码经验)

TIP

国外内互联网大厂推出的、可通过提示词(自然语言)生成网站或应用的无代码和 AI 代码工具。

以下是“对话式”应用开发平台,基于 AI 大模型构建,通过多智能体协作实现生成式应用开发,用户无需编写代码即可创建各类应用。

国际 “对话式” 编程应用开发平台

平台名称 所属公司 主要特点 官网/体验地址
Manus Manus 一个通用人工智能代理 (General AI Agent):被誉为“AI 版的 DeepSeek”。它不是聊天机器人,而是“行动引擎”,能自主操作浏览器、分析股票、规划旅行并编程等完成端到端任务。
2025 年 12 月末,Meta 以超过 20 亿美元的价格将其收购
https://manus.im (opens new window)
AnyGen 字节 业级自动化代理:AnyGen 是一家以人与 AI 协作办公为核心,通过多模态记录、结构化加工与可交付输出,重构工作链路并提升内容质量的生成式 AI 平台 https://www.anygen.io (opens new window)
Google Al Studio Google 开发者原型平台:基于 Gemini 系列模型主要特点是提供一个集成化的环境,让开发者能够轻松构建、测试和部署基于机器学习的智能应用。
提供极大的上下文窗口(最高支持 200 万+ tokens),是开发者测试 Gemini 新功能、获取 API 的核心入口。
https://aistudio.google.com (opens new window)
bolt StackBlitz 全栈 AI 编辑器:基于 WebContainer 技术,能在浏览器内运行 Node.js 环境。它不仅写 UI,还能生成后端代码(数据库、API),是一个闭环的开发环境。
用户只需一段话,它就能在浏览器里直接生成、预览并部署包含前端、后端和数据库的完整应用。
https://bolt.new/ (opens new window)
v0 Vercel UI/UX 生成专家:专注于 React、Next.js 和 Tailwind CSS。强项在于极致的视觉效果和组件规范,适合从对话直接生成高保真、可商用的前端界面,与 Vercel 部署生态无缝集成。 https://v0.app/ (opens new window)
vibecodeapp Vibecode 手机原生开发工具(移动优先的“Vibe Coding”):全球首款专门为手机设计的 AI 应用构建器。主打“在手机上写 App”。专为移动端手势设计,让用户通过简单的语音或文字描述,让非技术人员在手机上完成从设计到上架 App Store 的全过程。 https://www.vibecodeapp.com/ (opens new window)

国内 “对话式” 编程应用开发平台

平台名称 所属公司 主要特点 官网/体验地址
秒哒 百度 无代码/自然语言开发: 2024 年底国内首个“对话式”的“划时代”产品,用户只需通过自然语言描述,系统自动调用各种 Agent(智能体)来完成需求、代码生成及部署。 https://www.miaoda.cn (opens new window)
NoCode 美团 AI 零代码工具,通过自然语言和对话形式快速生成应用、小游戏、产品原型等,并可实时预览和一键部署。目前完全免费使用。 nocode.host (opens new window)
CodeWave 网易 智能低代码平台:定位“专业级低代码”。结合了大模型与可视化拖拽,支持从逻辑生成到页面搭建的全栈应用开发,适合企业级复杂业务。 https://codewave.163.com/aidev (opens new window)
千问 阿里巴巴 千问是阿里通义千问大模型打造的 AI 对话助手,通义千问支持问答、写作、代码、翻译、录音、PPT 创作、文档处理、音视频速读。 https://www.qianwen.com (opens new window)
豆包编程、扣子编程 字节 云端 AI IDE:提供网页版和插件版。特点是内置了全套开发环境(Cloud IDE),让开发者无需配置本地环境即可开始 AI 驱动的编程。 https://www.doubao.com/code/chat (opens new window)
https://code.coze.cn/home (opens new window)
MiniMax Agent MiniMax MiniMax Agent 是基于顶尖多模态大语言模型打造的智能 AI 伙伴,可精准搜索解答、一目了然的图像识别、沉浸式语音对话、专业创意写作、文档闪速解析,网页制作、AI PPT 等,还有独家悬浮球功能让复杂任务变得轻而易举。 https://agent.minimaxi.com/ (opens new window)
Kimi Code 月之暗面 长文本推理编程:依托 Kimi-K2 强大的长文本和逻辑思考能力。擅长阅读上万行的遗留代码库(Legacy Code)并进行重构或 Bug 修复。可使用网页应用,移动应用 等 https://www.kimi.com/ (opens new window)

# 四、AI Agent 智能体

TIP

理解什么是 Agent ,了解常见的 Agent 产品

# 1、什么是 Agent

TIP

Agent = AI 本身

AI 本身就是一个 Agent,它的工作是:

  • 理解你的意图和需求
  • 做决策(用什么工具、先做什么后做什么)
  • 协调各种工具完成任务

可以把 Agent 理解为一个任务执行器

  • 接收你的指令(提示词)
  • 调用各种工具完成任务
  • 返回执行结果

与普通 AI 对话的区别

普通 AI 对话 Agent
只能聊天 能调用工具
被动回答 主动决策
单轮交互 持续执行

# 2、AI 智能体/工作流平台

TIP

  • Coze/扣子:零代码制作可一键部署到各大平台的“AI 员工”
  • GPTs:为你的 ChatGPT 穿上专属“制服”,打造个人定制版超级助手
  • Dify:像搭积木一样,用可视化工具构建企业级、可私有化部署的 AI 应用
平台名称 所属公司 主要特点 官网/体验地址
Coze/扣子 字节跳动 强大的 AI 智能体平台,可通过自然语言创建 AI Bot 并一键部署到多个平台(飞书、微信等),支持插件、知识库和工作流 https://www.coze.cn/ (opens new window)
Dify 国内创业公司 开源 LLM 应用开发平台,可视化编排 AI 工作流,支持多种模型,开源平台可让企业可私有化部署 https://dify.ai/ (opens new window)
GPTs OpenAI 无需代码创建自定义 ChatGPT,可添加知识库、自定义指令和 API 能力 需 ChatGPT Plus 订阅
Manus Manus 一个通用人工智能代理 (General AI Agent),可以完成 信息处理与研究、编程与软件开发、数据分析与可视化、内容创作与生成、日常任务与工作流自动化 https://manus.im/ (opens new window)
AnyGen 字节 AnyGen 是一家以人与 AI 协作办公为核心,通过多模态记录、结构化加工与可交付输出,重构工作链路并提升内容质量的生成式 AI 平台 https://www.anygen.io/ (opens new window)
Google Al Studio Google Google AI Studio 的主要特点是提供一个集成化的环境,让开发者能够轻松构建、测试和部署基于机器学习的智能应用。 https://aistudio.google.com/ (opens new window)

# 五、深入 Vibe Coding 和 AI 辅助工程

TIP

讲清楚 Vibe Coding 和 AI 辅助工程的区别 ,同时如何使用 AI 工具进行项目的开发

# 1、什么是 Vibe Coding

TIP

2025 年 2 月 3 日,前 特斯拉人工智能总监,OpenAI 联合创始人、斯坦福大学计算机科学博士/硕士 Andrej Karpathy 安德烈·卡帕西 提出了 “Vibe Coding” 编程方式。他本人对 “Vibe Coding” 的解读如下图

其大意是说:有一种新的编码方式,我称之为 Vibe 编程;它让你完全沉浸在氛围中,拥抱指数级增长,甚至忘记代码的存在。

Karpathy 用一种近乎诗意的语言描述了他的编程体验:“这已经不能算是真正的编程了,我只是看看、说说、运行、复制并粘贴,然后程序就能运行了。”这句话瞬间击中了无数开发者的内心,因为它精准地概括了一种全新的软件开发体验。在短短 48 小时内,这条推文获得了超过 50 万次转发,Vibe 编程的话题迅速登上全球趋势榜。

image-20260102233249704

Vibe 编码(也写作vibecoding)是一个新近出现的术语,指的是这样一种编程实践:只需告诉人工智能程序你的需求,它就能为你生成代码、网页或应用程序。在Vibe 编码中,程序员无需理解代码的工作原理,并且通常需要接受代码中存在一定数量的错误和故障。——《韦氏英语惯用法词典》的解释

# 2、革命性概念的诞生:从“写代码” 到 “说代码”

TIP

Vibe 编程这种“说代码”的方式正在改变数字产品的创造方式,让软件开发从精英专属的技术活动转变为人人可参与的创造过程,因此,Vibe 编程在全球范围内开始流行。

一位使用 Vibe 编程 的设计师这样描述自己的感受:就像从手工绘图转向了 Photoshop,我突然发现自己可以实现以前根本不敢想象的创意。

“Vibe 编程”这个术语的精妙之处在于,它捕捉到了这种编程方式的本质特征。“Vibe”一词来源于 vibration(振动),在现代俚语中表示一种感觉、氛围或直觉。当我们说某个音乐有“好的 vibe”时,指的是它给人的整体感受,而不是具体的音符和节拍。同样,Vibe 编程强调的是开发者对软件功能和用户体验的整体感 知,而不是具体的代码实现细节。

2025 年 3 月,《韦氏英语惯用法词典》(Merriam-Webster'sConcise Dictionary ofEnglish Usage)正式将“vibe coding (opens new window)”收录为年度科技词汇,并定义为:通过自然语言提示与 AI 协作生成可运行代码的新型软件开发范式,如下图所示。这一收录标志着 Vibe 编程 从一个网络热词正式成为计算机科学术语。

image-20260103190912738

《韦氏英语惯用法词典》收录了 Vibe Coding

注:

2025 年 11 月,柯林斯词典宣布:"Vibe Coding" 当选年度词汇。

这个词的官方定义是:一种使用人工智能、通过自然语言描述来生成计算机代码的方式。

换句话说,你不需要学什么编程语言,只要用自然语言告诉 AI"我想要一个 XX",它就能帮你做出来。

# 3、Vibe Coding 的技术基础与工作原理

TIP

这场变革之所以能够发生,是其背后有着强大的技术支撑。2025 年初,随着 Claude3.7Sonnet 等混合推理模型的出现,AI 生成的代码的质量得到了大幅提升。

  • 根据 Cursor 技术团队的评测,Claude3.7Sonnet 生成的代码的语法正确率达到 95%,比前代模型提升了 17%。
  • 在 LeetCode 中等难度问题上的通过率高达 92%。

这种突破性进展主要归功于混合推理能力的引入:

  • 模型能够根据任务复杂度在快速回答与深度思考模式间无缝切换,既能应对简单的日常编码,又能处理需要深度分析的复杂系统架构设计。
  • 更重要的是,现在的 AI 不仅能生成代码,还能理解复杂的业务逻辑、调试 bug,甚至进行系统架构设计。

这意味着 Vibe 编程已经从实验性质的工具变成了真正可以依赖的生产力工具。

# 3.1、技术基础

TIP

Vibe Coding 的实现依赖于以下几项关键技术:

  1. 大型语言模型 (Large Language Models, LLM):这是最核心的基础。 像 GPT 系列、Gemini、Claude 等模型经过海量代码和文本数据的训练,具备了理解自然语言指令并将其转换为代码的能力。
  2. AI 原生集成开发环境 (AI-Native IDE) 或插件: 为了实现流畅的“氛围”,Vibe Coding 通常在专门的工具中进行。这些工具将 LLM 深度集成到编码环境中。
    • AI 原生 IDE:例如 CursorWindsurf、字节跳动的 Trae 等,它们将 AI 聊天、代码生成、重构、调试等功能无缝融合在编辑器中。
    • IDE 插件:例如 GitHub Copilot,它可以在 VS Code 等常用编辑器中提供代码补全和生成能力。
  3. 提示词工程 (Prompt Engineering):开发者的技能从写代码转变为如何清晰、准确地向 AI 下达指令。高质量的提示词直接决定了生成代码的质量。
  4. 上下文理解 (Context Understanding):先进的 AI 编程工具能够理解整个项目的结构、依赖库、代码风格等上下文信息,从而生成更贴合现有项目的代码,而不仅仅是孤立的代码片段。

# 3.2、工作原理与流程

TIP

Vibe Coding 的工作流程可以概括为一个高度互动和迭代的循环。 它颠覆了传统“设计-编码-测试”的瀑布流模式,变得更像与一个程序员同事结对编程。

一个典型的 Vibe Coding 流程如下:

  1. 明确意图 与 计划:首先,你需要清晰地规划出你想要实现的功能,哪怕只是一个很小的目标。计划越清晰,AI 越能理解你的需求。
  2. 下达自然语言指令: 在 AI 原生的 IDE(如 Cursor)中,通过聊天窗口或快捷键,用自然语言描述你的需求。
    • 反例:“给我一个按钮。”
    • 正例:“请使用 React 和 Tailwind CSS 创建一个蓝色的、圆角的按钮,文字是‘点击我’,点击后在控制台打印‘Hello World’。”
  3. AI 生成代码:AI 工具(如 Cursor 或 Copilot)会解析你的指令,并自动生成相应的代码,直接插入到你的文件中。
  4. 测试与验证:运行生成的代码,检查功能是否符合预期。你甚至可以要求 AI 先为你编写测试用例。 如果出现错误,直接将错误信息反馈给 AI。
  5. 迭代与微调:通过持续的对话来改进代码。你可以要求 AI 进行修改,例如:
    • “把背景颜色改成深色主题。”
    • “请为这段代码增加错误处理逻辑。”
    • “重构这个函数来提升性能。”
  6. 版本控制:在每个功能稳定后,使用 Git 等工具进行版本控制,方便在 AI“失控”时回滚到稳定版本。
  7. 重复循环:完成一个功能后,回到第一步,继续开发下一个功能。

# 4、传统开发与 Vibe 编程开发流程对比

流程阶段 传统开发流程 (命令式编程) Vibe 编程流程 (意图式编程)
1. 需求与设计 明确验证方式、数据库结构、安全机制等细节,并绘制 ER 图与接口文档。 意图输入:开发者使用自然语言描述核心目标,如“创建一个支持用户名/密码登录的功能,使用 BCrypt 加密,登录成功则返回 JWT Token”。
2. 环境与搭建 手动配置本地开发环境、数据库服务、Web 框架,并引入加密库和身份验证中间件。 由平台自动完成环境与基础架构的配置。
3. 代码实现 后端:手动实现用户接口、令牌逻辑、数据库交互层。 前端:手动构建 UI、处理表单事件、对接鉴权。 AI 自动生成:平台根据意图,自动生成完整的后端接口、数据库迁移脚本和前端页面组件,并自动集成安全最佳实践。
4. 测试与调试 手动进行:通过接口工具、单元测试框架验证功能和逻辑,并排查跨域、令牌异常等问题。 由平台辅助,内置的智能机制可减少常见错误。
5. 部署与运维 手动完成代码打包、上线部署、配置 SSL 与安全策略。后续需持续手动修复漏洞、支持演进。 一键部署:代码可直接部署至云平台,SSL 配置与 API 文档同步自动生成智能运维:平台内置监控模块,可检测异常并AI 自动提示优化建议、修复常见漏洞。
6. 扩展与变更 接入新功能(如 OAuth、2FA)常需大规模手动重构代码。 后续功能扩展仅需调整配置或描述,无需大规模重构。
核心特点总结 技术链条长、依赖多,对开发者专业要求高。细节处理易疏漏,多人协作时联调、同步易成效率瓶颈。 流程显著简化,开发者聚焦于描述“做什么”(意图),而非“怎么做”(实现)。由系统自动化完成大部分编码与配置工作,提升效率与安全性

# 6、AI 辅助工程

TIP

Google Chrome 开发者体验负责人 Addy Osmani 在最近一期《The Pragmatic Engineer》播客中,Addy 详细阐述了他的新书《Beyond Vibe Coding》的核心观点——AI 能帮你提速,但无法替你思考

AI 工具可以快速完成 70%的工作,但剩下那关键的 30%,必须靠真正理解系统的工程师完成。

# 6.1、Vibe Coding vs AI 辅助工程

这两种利用 AI 的模式,处于“工程光谱”的两端:

名称 定义 特点 适用场景
Vibe Coding (氛围感编程) 强调创意流、高层次提示词,甚至“忘记代码存在”。 快速迭代、实验性强,接受 AI 建议而不进行深度审查。 原型设计(MVP)、个人小工具、快速验证想法。
AI-Assisted Engineering (AI 辅助工程) 将 AI 视为协作伙伴,但严格遵守工程原则。 强调规划(Spec)、系统架构、安全性、可维护性。 大规模生产环境、需要长期维护的商业系统。

# 6.2、“70% 问题” 与 关键的 30%

TIP

  • AI 只能完成前 70%: AI 可以极速生成样板代码和基础功能,给开发者带来“虚假的自信”。
  • 消失的后 30%(最后一公里): 真正的挑战在于调试、安全加固、性能优化以及与复杂旧系统的集成。
  • 工程师的护城河: 只有具备批判性思维系统性解决能力的专业工程师,才能完成这最后的 30%。如果完全依赖 AI,开发者会陷入“反被 AI 绑架”的困境,无法解释和修复系统。

# 6.3、AI 时代下的软件工程新准则

TIP

即使有了 AI,传统的工程最佳实践依然是“保命符”:

  • 规范驱动开发 (Spec-driven Development): 在写提示词之前,先明确“我们要构建什么”和“期望是什么”。
  • 上下文工程 (Context Engineering): 提供高质量的描述、文档和示例,弥补 AI 对团队内部“隐性知识”的缺失。
  • 人类监督不可缺席: 不能让“AI 写代码 + AI 审代码”形成闭环。人类必须理解每一行进入生产系统的代码。
  • 测试先行: 用自动化测试来验证 AI 输出的正确性,这是防止 AI “胡言乱语”的最高效手段。

# 6.4、行业角色的演变趋势

TIP

  • 高级工程师(Senior): 价值更高。他们从“搬砖者”转变为“乐团指挥”或“智能体编排者”,负责管理多个 AI Agent 并进行严格的代码评审。
  • 产品经理(PM)与工程经理(EM): PM 的核心竞争力将转向 ** “品味”与“定义问题的能力”。
  • EM 将更多地关注 AI 治理、安全评估与流程优化

新协作模式: 可能出现“三人编程”(资深开发者 + 新手 + AI),AI 充当教学助理。

# 6.5、核心重点

TIP

  • “AI 能帮你提速,但无法替你思考。”
  • “你的专业水平越高,AI 工具的效果越好。”
  • “如果你无法完整解释一段代码,就不应该提交它。”

AI 极大地降低了“起步”的门槛,但并没有降低“交付高质量生产系统”的门槛;工程师的职责已从“单纯写代码”转向“架构设计、上下文重构与质量把关”。

最后引用英伟达机器人部门总监兼杰出科学家 Jim Fan 博士的话来总结:

image-20260103223426143

# 六、失去动力的年轻人,才是 AI 时代最大的危机

TIP

这股 AI 狂热中最令人不安的,是部分本可成为顶尖人才的年轻人,正陷入一种“学什么都没用,反正 AI 全都懂”的虚无主义。然而,真正的未来属于 AI 协作编程

讨论 AI 是否取代开发者已毫无意义。在可预见的未来,人机协作将进化为一种“高度同频”的关系。Vibe Coding(氛围感编程) 的兴起,意味着编程门槛的下移,更多非专业人士将具备解决基础需求的能力。

所谓的“六个月内被取代”已成了喊了三年的狼来了。事实是:企业的招聘从未停止,只是标准更高了。AI 不会降低人才门槛,反而拉高了上限。顶尖开发者通过 AI 洞察技术边界、提升交付效率,而开发者自身的技术深度,才是决定“降本增效”质量的核心。

记住,今天逻辑已变:AI 时代:成功,才是成功之母。

上次更新时间: 1/13/2026, 12:09:44 AM

大厂最新技术学习分享群

大厂最新技术学习分享群

微信扫一扫进群,获取资料

X