# 2026 年 AI 编程 从 入门到实践
TIP
在 2025 年 12 月 27 日的凌晨 Andrej Karpathy 在 X 上 (opens new window)说:
作为一名程序员,我从未感到如此落后。随着程序员贡献的部分越来越少,整个行业正在经历剧烈的重构。我感觉,如果我能正确地整合过去一年左右涌现的各种资源,我的能力可以提升十倍。而未能充分利用这些资源,让我感觉自己明显缺乏技能。
Andrej Karpathy 安德烈·卡帕西:曾任特斯拉人工智能总监,OpenAI 创始团队成员,斯坦福大学计算机科学博士/硕士。同时,也是首次提出 “Vibe Coding” 编程方式的人。

觉醒,现在是编程最好的时代。
2025 年,AI 编程工具让"用自然语言描述需求,AI 生成代码"成为现实。本节将学习场变革的背景 并 带你具体动手实践。
# 一、2025 年,编程世界发生了什么

# 1、一条推文引发的革命
TIP
2025 年 2 月,前特斯拉 AI 总监、OpenAI 联合创始人 Andrej Karpathy 在社交媒体上发了一条推文。
他说:"有一种新的编程方式,我称之为 'vibe coding'(氛围编程)。你完全沉浸在感觉中,拥抱指数级变化,甚至忘记代码的存在。"
这条推文 (opens new window)引发广泛讨论的原因是——我们正在进入一个不需要"写"代码也能"做"软件的时代。

# 2、"Vibe Coding" 成为年度热词
TIP
- 2025 年 3 月,《韦氏英语惯用法词典》(Merriam-Webster'sConcise Dictionary ofEnglish Usage)正式将“vibe coding (opens new window)”收录为年度科技词汇
- 2025 年 11 月,柯林斯词典宣布:"Vibe Coding" 当选年度词汇。
# 3、数据不会说谎
TIP
Y Combinator 的惊人发现,2025 年 3 月,全球最著名的创业孵化器 Y Combinator 的 CEO Garry Tan 透露:
在最新一批创业公司中,有 25%的公司报告——它们 95%的代码是由 AI 生成的。
这些不是玩票的业余项目,而是正在融资、正在增长的真实创业公司。
更让人惊讶的是,这些公司的团队规模往往不到 10 人,却能做出以前需要几十人才能完成的产品。
# 4、行业数据
数据来源:Second Talent 2025 统计、Bubble 调研报
| 指标 | 数据 |
|---|---|
| 使用 AI 编程工具的美国开发者 | 92% |
| 全球代码中 AI 生成的比例 | 41% |
| Vibe Coding 用户中非开发者占比 | 63% |
| 使用 AI 后开发速度提升 | 最高 55% |
| 市场规模预测(2032 年) | 从 49 亿 →301 亿美元 |
注:
其中的 63%——超过一半的 Vibe Coding 用户根本不是程序员。他们是设计师、产品经理、创业者、甚至文科生。
# 5、意味着什么
让我们把这几件事串起来:

编程正在从"专业技能"变成"通用工具"。
就像 Excel 让每个人都能处理数据,Word 让每个人都能排版文档一样,AI 编程工具正在让每个人都能创造软件。
# 6、从 程序员 到 指挥官 的角色转变

用开车来打个比方
| 时代名称 | 类比场景 | 详细描述 | 对应编程场景 |
|---|---|---|---|
| 手动挡时代(传统编程) | 从北京开车去上海用手动挡 | 需熟练掌握离合器、换挡技巧,时刻关注转速,新手易熄火 | 必须掌握很多“操作技巧”,才能让程序跑起来 |
| 自动挡时代(代码补全) | 从北京开车去上海换自动挡 | 不用管离合器和换挡,可把更多注意力放在路况上 | GitHub Copilot 等工具,AI 帮你补全代码片段,但仍需懂代码、会“开车” |
| "自动驾驶时代"(Vibe Coding) | 乘坐自动驾驶出租车去外滩 | 只需说“我要去外滩”,车子自己规划路线、自己开,走错了说一声就行 | 说清楚目的地,AI 完成所有操作 |
注:
当前实际开发中,还远远没有到 "自动驾驶" 阶段,还是处于 L2+(辅助驾驶) ~ L3(有条件自动驾驶) 过渡阶段,都需要驾驶员接管。L2 责任人仍然是驾驶员,L3 事故责任开始从驾驶员转向系统/制造商
# 7、工作流程的变化
| 传统编程 | AI 时代 |
|---|---|
| 学习编程语言:花几个月学 JavaScript、Python 或其他语言 | 告诉 AI 你想要什么:"帮我做一个待办清单,可以添加任务、标记完成、删除任务" |
| 理解语法规则:记住各种括号、分号、缩进规则 | 看 AI 生成代码:几秒钟后,代码就出现了 |
| 一行一行写代码:把每个功能都"翻译"成计算机能懂的指令 | 试试看效果:运行一下,看看是不是你想要的 |
| 不停地调试:程序报错了?自己一行行找问题 | 告诉 AI 怎么改:"把完成的任务变成灰色,加一个删除线" |
| 查文档、问社区:遇到不会的,花几小时搜索解决方案 | 继续迭代:直到满意为止 |
| 整个过程像在学一门外语——你得先学会语法,才能表达自己想说的话。 | 整个过程更像在和一个懂技术的助手对话——你说想法,它来实现。 |
# 8、核心技能的迁移
| 过去的核心技能 | 现在的核心技能 |
|---|---|
| 记住语法规则 | 把需求说清楚 |
| 手写代码 | 判断代码对不对 |
| 调试找 bug | 描述问题让 AI 修 |
| 阅读技术文档 | 知道什么该问、什么该查 |
用开车的类比:
| 你需要知道的 | 你不需要知道的 |
|---|---|
| 我要去哪(需求) | 发动机怎么工作(底层原理) |
| 走哪条路更快(大方向) | 变速箱的原理(语法细节) |
| 到没到、对不对(验收) | 如何修车(手写每行代码) |
| 路况不对要调整(迭代) | 汽车电路图(复杂架构) |
简单说:从"写代码"变成"表达清楚 + 判断对错"。
# 9、什么没变
TIP
虽然"怎么做"变了,但有些东西永远不会变:
- 你需要知道自己想要什么:AI 再聪明,也不能替你想清楚要做什么
- 你需要判断结果好不好:AI 可能会出错,你得能看出来
- 你需要有解决问题的思路:遇到问题时,知道怎么一步步排查
AI 目前还不是"完全自动驾驶"
就像今天的自动驾驶汽车,AI 编程也需要你保持关注、随时接手、负最终责任。Vibe Coding 更像是"L3 级自动驾驶"——大部分时候 AI 来做,但你得盯着,关键时刻你得上,最终还得咱自己负责。
AI 接管了"执行",但"思考"和"决策"还是你的事。
# 10、2025 年下半年继续进化
TIP
2025 年下半年,行业开始从 Vibe Coding 进化到 Context Engineering(上下文工程)。
Vibe Coding 强调"跟着感觉走",快速出结果。Context Engineering 则强调:给 AI 提供足够的上下文,让它理解你的项目背景、代码规范、业务逻辑。
换句话说:想让 AI 帮得更好,你需要学会"提供好的上下文"。这也是接下来要重点学习的内容。
# 11、对我们意味着什么
TIP
如果你会用滴滴打车,你就已经具备了 Vibe Coding 最核心的能力:
- 说清楚你要去哪(表达需求)
- 判断司机有没有走错路(验收结果)
- 必要时给司机指路(引导调整)
这取决于个人优势。如果你擅长表达、沟通,擅长想清楚需求,对细节敏感、能发现问题——这些都是你的优势。
如果你还懂编程,那真是 游刃有余,不再会匆匆忙忙
# 二、学习 AI 编程必懂的理论基础
TIP
深入浅出 人工智能的 5 个阶段,国内外不同阶段的产品代表。国内外知名的大模型和工具,AI 编程的经济学相关内容。
# 1、人工智能的 5 个 阶段
TIP
OpenAI 公司在 2024 年 7 月正式提出,这套分级系统旨在衡量通往“通用人工智能(AGI)”的进展,帮助外界理解 AI 能力的演进路径。
OpenAI 领导层制定这套标准是为了让员工、投资者和董事会更清晰地了解公司距离实现 AGI 还有多远。目前已经成为行业共识。
| 阶段 | 定义 | 能力特征 | 应用场景 |
|---|---|---|---|
| L1: 聊天机器人 (Chatbots) | 具备交互能力的 AI:以自然的语言为基础对话的交互系统,聚焦语言理解与生成 | 极高的语言理解力,具备原生多模态交互(实时音视频),能处理千万级超长上下文。 | 客户服务、日常对话、信息查询、简单任务执行 |
| L2: 推理者 (Reasoners) | 具有人类博士水平的解决问题能力,能进行复杂逻辑推理。 | 具备“慢思考”模式,通过强化学习实现深度逻辑推导:逻辑推理、数学证明、代码编写、专业领域问题解决、多步骤推导 | 高级编程架构、学术研究、科学实验模拟、精密审计、复杂数学证明。 |
| L3: 智能体 (Agents) | 可以采取行动的系统 (执行力):自主执行复杂任务的行动系统 | 2025 年的行业重心。AI 不仅是大脑,还拥有“手”。 能自主操作电脑 (Computer Use)、调用跨平台工具并闭环执行任务。 | 自动化流程、智能助手、复杂任务执行。 自动处理复杂的差旅报销、自主开发并部署应用、全自动化自媒体运营。 |
| L4: 创新者 (Innovators) | 能够辅助人类进行科学发现,提出新的理论或发明创造。 | 科学理论创新、技术发明、创意设计、突破性成果生成 能够生成超越现有训练数据的知识。通过 AI for Science 发现新规律。 | 科学研究、技术突破、创意产业、新药研发 新型超导材料研发、靶向药物分子设计、预测极端气候模型。 |
| L5: 组织者 (Organizations) | 可以自主运行 并 协作组织工作的 AI 统筹全局的智能管理系统。 处理一个完整组织(如公司)的任务。 | AGI 的终极形态。AI 能够管理一个完整的机构,自主进行战略规划、资源调配和人员(智能体)协作。 全自动化的未来形态 | “一人独角兽公司”、全自动化的全球供应链管理。 |
# 2、国内外人工智能 5 个阶段的产品代表
截止 2025 年 12 月,国内外 人工智能 5 个阶段的产品代表
| 阶段 | 国内 | 国际 |
|---|---|---|
| L1:聊天机器人 (Chatbots) | DeepSeek、豆包、文心一言、通义千问、腾讯元宝、Kimi Chat、讯飞星火、MiniMax | Gemini 3 Flash, Claude 4.5 Sonnet, GPT-5.2 mini 等 |
| L2:推理者 (Reasoners) | DeepSeek V3.2-Speciale, Kimi k0-math 2.1、GLM-4.7、QwQ-32B、讯飞星火 X1、Doubao-1.5-thinking-pro、文心 X1.1 | GPT-5.2 (Thinking), Claude 4.5 Opus、Gemini 3 Deep Think 等 |
| L3:智能体 (Agents) | DeepSeek V3.2 (Agent 模式), 智谱 AutoGLM、扣子(Coze)、Moonshot AI Agents (Kimi) | OpenAI Operator**, Manus (正式版), **Gemini Deep Research Agent 等 |
| L4:创新者 (Innovators) | 各大厂都有内部创新项目 | AlphaFold 3 (升级版), Google GNoME, GPT-5.2 Pro (科研专用) |
| L5:组织 (Organizations) | “城市大脑”/“产业大脑”,多智能体协作系统研究 | 现状: 处于理论概念验证阶段,尚未出现成熟的单一商用产品。 |
# 3、什么是 AI 大模型
TIP
AI 大模型,通常指的是“大规模预训练模型”(Large Pre-trained Models)。你可以把它想象成一个被海量数据“喂养”长大的、非常聪明的“数字大脑”。
模型的本质: 负责理解意图和生成内容
专业解释:
AI 大模型是参数量巨大、基于深度神经网络构建的模型,通过海量数据预训练实现通用能力,再经微调适配特定任务。其核心特征包括参数量大(通常达数十亿至万亿级)、训练数据庞大(超万亿 token)、计算资源消耗高,且具备多模态处理能力(如文本、图像、音频、视频的联合理解与生成)。
它的核心特点是:
- 规模巨大: 模型的参数数量极其庞大,通常从数十亿到数万亿不等。参数越多,模型能学习和存储的知识就越复杂、越细致。
- 预训练: 在正式“上岗”解决特定问题前,它会先在包含互联网上几乎所有公开文本、代码、图片等海量、多样化的数据上进行“通识教育”(即预训练)。这让它掌握了语言、逻辑、世界知识等通用能力。
- 强大的泛化能力: 完成预训练后,这个模型就成了一个通用的“基础模型”。我们只需要用少量特定的数据对它进行“微调”(Fine-tuning),就能让它迅速适应并高效完成各种具体任务,比如写文章、回答问题、写代码、画画等。
简单来说,AI 大模型 = 海量数据 + 巨大模型 + 强大算力。
# 3.1、大模型 与 工具的关系
TIP
- 模型:负责理解意图和生成内容。比如你问"怎么写登录功能",模型分析后返回代码方案。
- 工具:负责执行具体操作。比如读取文件、运行命令、提交代码。
工具需要接入模型才能工作。
# 3.2、国内外知名的 AI 大模型
以下是一些在国内外非常知名的代表性大模型,它们各有千秋:
国际厂商
| 模型名称 | 所属公司 | 主要特点和应用 | 代表性发布/更新时间 |
|---|---|---|---|
| GPT | OpenAI | 行业风向标:融合了 o 系列的逻辑推理与 GPT 系列的快速响应。GPT-5 具备极强的多模态理解力及自主 Agent 执行力。 | 2025 年 8 月 (GPT-5) |
| Gemini | 原生多模态:在搜索集成、长上下文(200 万+ tokens)和视频理解上极具优势。Gemini 2.0 系列强调低延迟交互。 | 2024 年 12 月 (2.0 系列) | |
| Llama | Meta (Facebook) | 开源领袖:全球最受欢迎的开源模型。Llama 4 系列在推理能力上已能与最顶级的闭源模型(如 GPT-4/5)抗衡。 | 2025 年中 (Llama 4) |
| Claude | Anthropic | 人文与逻辑平衡:以“宪法 AI”著称,安全性高。Claude 4.x 在创意写作、长文档分析和复杂编程(Claude Code)方面表现卓越。 | 2025 年 8 月 (Claude 4) |
| Grok | xAI | 实时性与硬核推理:深度集成 X 平台实时数据。Grok-3 在科学计算和工程问题上表现强劲,风格犀利、无审查。由埃隆·马斯克创立的公司开发。 | 2025 年末 (Grok-3) |
| Mistral | Mistral AI | 欧洲最强/高效率:强调推理效率。Mistral Large 3 系列在混合专家模型 (MoE) 架构上达到极致,受开发者青睐。来自法国的初创公司 | 2025 年 12 月 (Large 3) |
国内厂商
| 模型名称 | 所属公司 | 主要特点和应用 | 代表性发布/更新时间 |
|---|---|---|---|
| DeepSeek | 深度求索 | 性价比之王:中国最强开源力量。DeepSeek-V3.2/R1 系列在数学逻辑和代码能力上惊艳全球,推理成本极低。 | 2025 年 12 月 (V3.2 正式版) |
| Doubao (豆包) | 字节跳动 | 超大规模应用:原云雀模型。日均调用量惊人,擅长语音交互和消费者应用,插件生态极其丰富。 | 2024 年 5 月 (品牌更名) |
| 文心大模型 | 百度 | 企业级服务:ERNIE 4.5/5.0 系列深度集成百度搜索生态,中文理解及政企定制化能力极强。 | 2025 年 (迭代至 5.0) |
| Qwen (通义千问) | 阿里巴巴 | 全能型/商业生态:支持超长上下文,在中文榜单和代码榜单常年领先,与阿里云深度绑定。 | 2025 年 4 月 (Qwen 3) |
| Hunyuan (混元) | 腾讯 | 全模态/社交集成:在视频生成(可信度高)和微信生态集成方面有独特优势,擅长多轮对话逻辑。 | 2025 年 (多次迭代) |
| GLM (智谱清言) | 智谱 AI | 学术背景/强推理:源自清华。GLM-5 系列在复杂推理和智能体 Agent 调度上表现出色,是国内开源社区的核心。 | 2025 年 (迭代至 5 代) |
| Kimi | 月之暗面 | 长文本专家:国内率先攻克“长上下文”瓶颈。Kimi-K2 推理模型在处理数百万字文档、学术检索方面口碑极佳。 | 2025 年 (K2 系列) |
| MiniMax | 稀宇极智 | 情感交互/全模态:旗下海螺 AI 在语音生成和视频生成(Hailuo 2.0)上处于国际领先水平,AI 社交属性强。 | 2025 年 12 月 (M2.1 系列) |
# 4、AI 编程的经济学
TIP
"模型决定代码能力的速度和上限",以及成本意识在 AI 开发中的重要性。Token 就是钱,每次调用模型都在消耗真实的费用。
- 理解 Token 是 AI 模型的计价单位,掌握输入/输出 Token 的计费机制
- 建立成本意识,学会通过精准提示词控制 AI 上下文范围来优化成本
- 掌握提示词优化的核心原则:指定路径、明确范围、删除客套话
- 理解上下文大小与花费的关系,学会避免不必要的 Token 消耗
# 4.1、什么是 LLM
TIP
LLM(Large Language Model,大语言模型)是基于海量文本训练的 AI 模型,能够理解和生成人类语言、代码等。
# 4.2、什么是 Token
TIP
Token 是 AI 模型的计价单位,也是模型处理文本的基本单元。
换算关系:
- 1 个汉字 ≈ 1 Token
- 1 个英文单词 ≈ 0.75 Token
- 1 行代码 ≈ 5-15 Token
模型按照输入(Prompt)和输出(Completion)的 Token 数量计费。
扣减费用 = token 消耗量 × 模型单价
# 4.3、什么是 输入/输出 Token
TIP
- 输入 Token(Input):你发送给模型的内容(提示词、代码、上下文)
- 输出 Token(Output):模型生成的内容(代码、解释、回答)
花费怎么算:输入和输出的 Token 数量都会计费,输出通常比输入贵一些。
但作为用户,你不需要记住具体单价——工具会显示每次调用的花费,用完了充值即可。重要的是理解:上下文越大,花费越高。
# 4.4、什么是 Context Window
TIP
Context Window 是模型能处理的上下文长度上限,以 Token 为单位。GLM-4.7 支持 200K 上下文,足够处理完整的大型文件和长对话。
超出上限会自动压缩:当上下文接近或超出限制时,模型会自动压缩早期的对话内容,保留最新和最相关的信息。这可能导致部分历史细节被简化或忽略。
# 4.5、钱花哪去了

TIP
- 单次调用很便宜,但累积起来也是钱
- 上下文越大 = 花费越高:读取整个项目 vs 只读一个文件,差异是数量级的
- 频繁调试时要注意:循环修改会不断累积 Token
如何控制花费
大多数 AI 编程工具都会:
- 显示每次调用的 Token 数和花费
- 提供套餐或使用额度
- 额度用完后提醒你充值
你不需要记住具体单价,但需要养成好习惯(见下一节)来减少不必要的消耗。
# 4.6、成本与质量优化策略
TIP
关键认知:提示词本身通常很少,真正消耗 Token 的是 AI 读取的上下文——也就是为了让 AI 理解你的需求而必须加载的项目文件、代码、历史对话等。
因此,提示词优化不是在"打磨话术",而是减少 AI 需要读取的上下文范围,同时控制输出长度。
上下文范围既影响成本,也影响质量:精准的上下文让 AI 聚焦问题,输出更准确;无关的上下文会分散注意力,增加错误概率。
优化原则:
- 指定文件/文件夹路径 —— 缩小 AI 搜索范围
- 指明功能范围 —— "登录功能有问题"比"项目有问题"更聚焦
- 删除客套话 —— 无需"请"、"谢谢"、"如果可能的话"
示例对比:
❌ 模糊提示(AI 读取更多上下文):
"帮我看看项目里有没有什么问题,然后修复它"
→ AI 不确定从哪里开始,可能读取大量无关文件
✅ 精准提示(AI 聚焦相关区域):
→ 或者更直接:"修复 src/routes/auth.ts 第 26 行的类型错误:user 可能为 null"
不需要设定"专家角色"
很多人习惯在提示词开头加"你是一位资深的 React 专家..."——这是多余的。
CLI 工具或 AI IDE 的系统提示词已经包含了角色设定和编程语言上下文。你只需要直接描述任务,AI 会根据项目类型自动适配。
直接说事 比 "先设定角色再说事" 更高效。
# 4.7、实战建议
TIP
关注使用情况
- AI 编程工具通常会显示每次调用的 Token 数和花费。你也可以在对应模型的开放平台查看详细使用情况。
- 额度用完就充值 —— 就像话费流量一样,不需要过度焦虑,但要有意识地避免浪费。
成本意识检查清单
- 指定文件/文件夹路径
- 指明功能范围
- 删除客套话
- 定期清理对话历史
总结:上下文决定花费和质量,直接比客套更重要。 指定路径或功能范围,让 AI 只读取必要上下文。精准上下文既省钱,又让输出更准确。
# 三、AI 编程的工具形态
TIP
什么是 AI 编程工具:AI 编程工具是集成了 AI 能力的编辑器,能帮你写代码、查错误、解释代码。
# 1、全球 AI 编程工具形态
TIP
目前全球市场中,AI 编程的工具形态有 3 种
- AI Plugin 以插件形态:在现有开发工具中安装插件就能使用 AI 能力(文心快码、通义灵码、Claude Code for VS Code 等)
- AI IDE ,AI 集成开发工具:Cursor、TRAE、Antigravity ... 等
- AI CLI ,命令行 Agent:Gemini CLI、GitHub Copilot CLI、Codex CLI、Claude Code ... 等
| 形态 | 工具类型 | 描述 | 特点 | 产品 |
|---|---|---|---|---|
| AI Plugin | 智能副驾 | 插件形态,覆盖市场主流 IDE | - 覆盖如 VSCode、JetBrains IDEs 等 IDE。 - 不改变现有研发使用 IDE 习惯。 - 团队内快速落地 AI Coding。 | 文心快码、通义灵码、GitHub Copilot、Claude Code for VS Code 、OpenCode、JetBrains 全家桶 ...等 |
| AI IDE | 一站式 AI 工作台 | 独立 IDE,开箱即用 | - “集成开发环境”转为“智能开发环境”。 - 产设研一体,软件工程全生命周期覆盖。 | Cursor、TRAE、Antigravity ... 等 |
| AI CLI | Agent 操作系统 | 命令行 Agent,终端即开发 | - Unix 类命令行交互。 - 批处理、多系统异步协作,7x24 运行。 - 融入现有 DevOps 工具链。 | Gemini CLI、GitHub Copilot CLI、Codex CLI、Claude Code ... 等 |
# 2、AI Plugin 以 IDE 插件形态
TIP
这是目前最主流、应用最广泛的形态。它们作为插件无缝集成到开发者熟悉的集成开发环境(IDE)中,或以独立应用形式提供实时代码补全、函数生成、代码解释等功能。
| 产品名称 | 出品公司 | 核心大模型 | 支持 IDE 和 语言 |
|---|---|---|---|
| 通义灵码 (opens new window) | 阿里巴巴 | 通义大模型 | 主流编程语言都支持 支持 VSCode、Visual Studio、JetBrains IDEs 等主流编程工具 |
| Comate 文心快码 (opens new window) | 百度 | 文心大模型 | 主流编程语言都支持 支持 VSCode、JetBrains IDEs、Visual Studio、Xcode、Eclipse 等 |
| GitHub Copilot (opens new window) | GitHub 和 OpenAI 联合开发 | 默认 GPT 模型 | 主流编程语言都支持 深度集成在 VS Code、JetBrains IDEs 等 |
| Claude Code for VS Code (opens new window) | Anthropic | Claude Opus 4.5、Sonnet 4.5 和 Haiku 4.5 模型 | 主流编程语言都支持 支持 VS Code、Cursor 和 Windsurf 等 VS Code 分支以及 JetBrains 的原生扩展 |
| OpenCode (opens new window) | AnomalyCo(由开源社区驱动) | 几乎所有模型 | 主流编程语言都支持 支持 VS Code 及 所有 AI IDE,通过终端所有都支持 |
以上的所有插件在现有的 IDE 编程工具插件商店中直接搜索名称,即可安装使用
# 3、AI IDE 编程开发工具
TIP
IDE 是图形界面的开发环境:左侧是文件目录,中间是代码编辑区,底部是终端和输出窗口。你可以直接查看文件、安装可视化插件、在界面内调试和运行代码。
AI IDE 在此基础上集成了 AI Agent。这些 Agent 可以使用内置终端执行命令,读取和编辑项目文件,调用 Git 操作——和 AI CLI 工具的能力完全相同。区别只在于交互方式:IDE 用图形界面,CLI 用命令行。
本质上,IDE 里的 AI 和 CLI 工具里的 AI 是同一个东西,只是住的地方不同。
# 3.1、IDE 开发工具 与 VSCode 的关系
TIP
大部分 AI IDE 基于 VS Code 开发(VS Code 是开源项目):
- Cursor:VS Code 的分支,深度集成 AI
- Windsurf:基于 VS Code,由 Codeium 开发
- Trae、Qoder:兼容 VS Code 生态
- ...
# 3.2、IDE 开发工具的技术实现
TIP
利用 VSCode 庞大的用户基础 和 “足够好”的架构,以最低的迁移成本提供最强的 AI 能力。Cursor 是此路线的开创者和典型代表。
- 界面和操作习惯与 VS Code 一致
- 无缝兼容海量 VSCode 插件 和 主题,用户无学习成本
- 快速启动:基于成熟架构,能快速推出稳定产品
- 深度集成、多文件 Agent 体验极佳
- VSCode 作为底层编辑器,在其之上深度集成 AI 能力(如智能补全、对话、代码管理)
- 只要使用过 VSCode,目前市场上所有的 AI IDE 编程开发工具都可以零成本上手
- 最大短板:插件兼容性风险、需要迁移整个开发环境
# 3.3、国际厂商 IDE 开发工具
| 工具 | 所属公司 | 主要特点 / 定位 | 发布时间 |
|---|---|---|---|
| Cursor (opens new window) | Anysphere | 行业先行者 / 深度集成:目前最流行的 AI 代码编辑器。首创了 Composer(多文件编辑)和 Tab(强力预测补全)功能,能精准索引本地代码库上下文。 | 2023 年 1 月 23 日 |
| Windsurf (opens new window) | Codeium | Flow 状态流 / 上下文引擎:主打“Flow”概念。其最大的特点是 AI 代理与开发者之间的“无缝协作”,模型不仅能写代码,还能实时感知你当前的操作意图。 | 2024 年 10 月 22 日 |
| Kiro (opens new window) | AWS(亚马逊) | 规范驱动 (Spec-Driven) / 企业级:主打“告别随缘代码”。要求先写需求和设计文档,再由 AI 执行。能自动生成测试用例并进行基于属性的测试,非常严谨。 | 2025 年 7 月 14 日 |
| Antigravity (opens new window) | 端到端代理 (Agent-first) / 全自动化:定位是“任务执行平台”而非单纯编辑器。能自主操作终端、浏览器和编辑器。特色是会生成“执行录屏”供人类审计任务进度。 | 2025 年 11 月 19 日 | |
| GitHub Copilot (opens new window) | Microsoft (GitHub) | 行业标杆 / 通用助手:基于 OpenAI 模型。深度集成于 VS Code 等主流 IDE,支持代码补全、聊天对话及拉取请求总结。 | 2021 年 6 月 (预览版) |
| JetBrains AI (opens new window) | JetBrains | 深度集成 / 语义感知:专为 IntelliJ IDEA、PyCharm 等 IDE 设计。特点是能理解复杂的项目结构,中国区版本与阿里云通义大模型深度合作。 | 2023 年 6 月 (预览版) |
| Zed | Zed Collective | 极致性能 / 原生 AI:由 Rust 编写的高性能编辑器。定位是“快”,其 AI 服务原生集成了 Anthropic 的 Claude 模型,强调极低延迟的实时代码生成。 | 2024 年 1 月 (开源) |
| OpenCode (opens new window) | AnomalyCo(由开源社区驱动) | OpenCode 的定位是**“为终端(Terminal)而生的 AI 编码代理”**,旨在挑战像 Cursor 或 Claude Code 这样的工具,但它更强调极客感和灵活性。 | 2025 年 6 月(开源) |
# 3.4、国内厂商 IDE 开发工具
| 工具 | 所属公司 | 主要特点 / 定位 | 发布时间 |
|---|---|---|---|
| TRAE (opens new window) | 字节跳动 | AI 原生的智能开发工具,支持通过Builder 模式从零生成完整项目,具备代码解释、修改、Bug 排查等辅助功能。 | 2025 年 1 月 19 日 |
| Comate AI IDE (opens new window) | 百度 | AI 原生集成开发环境,深度整合文心大模型,覆盖需求理解、智能编码、辅助调试及软件运维全流程。 | 2025 年 6 月 23 日 |
| CodeBuddy (opens new window) | 腾讯 | 全球首个产设研一体的 AI 全栈工程师,实现产品 → 设计 → 研发 → 部署一站式全流程,深度集成 Figma 设计稿转代码功能,强腾讯生态 | 2025 年 7 月 22 日 |
| Qoder (opens new window) | 阿里巴巴 | 阿里 Agentic 编程平台,支持 Quest 模式,通过自然语言描述即可自动拆解开发任务、编写代码并执行,实现从 0 到 1 生成项目。支持一次检索 10 万代码文件,智能路由选择最佳模型 | 2025 年 8 月 22 日 |
| CodeGeeX (opens new window) | 清华大学 + 智谱 AI | 多语言支持 / 国产自研:基于智谱大模型。支持 100+ 语言,对中文注释理解极佳,提供免费的个人版,支持 VS Code 和 JetBrains 全家桶。 | 2022 年 9 月 (开源) |
# 3.5、常用 AI IDE 开发工具的 模型支持 及 费用
| 工具名称 | 支持的 AI 模型 | 模型免费额度 | 模型特点与定位 |
|---|---|---|---|
| Antigravity | Gemini 3 Pro、Gemini 3 Flash、Claude Sonnet 4.5、Claude Opus 4.5 、GPT-OSS 120B | 免费使用/有额度限制,每 5 小时刷新一次 | 整合 Google、Anthropic、OpenAI 三大主流模型,支持多模型切换 |
| Kiro | Sonnet 4、Sonnet 4.5、Haiku 4.5、Opus 4.5 | **限时免费 **首次 500 积分/30 天 | 深度集成 Anthropic 最新 Claude 系列,强调安全性和可控性 |
| Qoder | Claude、GPT、Gemini 系列都支持 | **限时免费 **为期 2 周的 Pro 试用 及 300 积分 | 采用智能路由机制,自动为不同任务匹配最合适的模型 |
| CodeBuddy | 国际版:Claude、GPT、Gemini; 国内版:腾讯混元、DeepSeek | 限时免费 每月 2000 积分 | 双轨模型架构,国际版与国内版分别接入不同模型生态 |
| Cursor | Gemini 3 Pro、Gemini 3 Flash、Claude Sonnet 4.5、Claude Opus 4.5 、GPT-5.2 等 | 限时免费 一周 Pro 试用 | 专注高质量代码生成,在复杂项目重构方面表现突出 |
| TRAE | 豆包(doubao-1.5-pro)、DeepSeek R1、DeepSeek V3 | 国内版:免费使用 国际版:每月高级模型 10 个快速请求和50 个慢速请求 | 国产模型为主,针对中文场景优化,提供免费使用 |
| Windsurf | OpenAI、Claude、Gemini、xAI 系列等 | 限时免费 每月 25 个即时积分 | 完全免费使用,融合两种顶级模型能力 |
| Comate AI IDE | 文心大模型(ERNIE) | 个人标准版免费,功能受限 | 基于百度文心大模型,结合百度内部编程大数据训练 |
| GitHub Copilot | Anthropic Claude Sonnet 4、GPT-5、Gemini 2.5 Pro 等 | 免费试用 Copilot Pro 30 天 | 无限制代理模式和与 GPT-5 的聊天 |
# 4、AI CLI 命令行终端工具
TIP
CLI 工具在终端里运行,通过文字交互。没有图形界面,但能做同样的事:读取文件、搜索代码、运行命令、提交 Git。
你告诉它"修复这个 Bug",它会自己找出问题、修改代码、运行测试。你扮演产品经理的角色,告诉它要做什么,它负责实现。
| 名称 | 开发商 | 官网 |
|---|---|---|
| Claude Code | Anthropic | https://claude.com/product/claude-code (opens new window) |
| Codex CLI | OpenAI | https://openai.com/codex (opens new window) |
| Qoder CLI | 阿里巴巴 | https://qoder.com (opens new window) |
| Factory Droid | Factory AI | https://factory.ai/product/cli (opens new window) |
| Warp | Warpdotdev | https://www.warp.dev (opens new window) |
| OpenCode | AnomalyCo(由开源社区驱动) | https://github.com/anomalyco/opencode (opens new window) |
# 4.1、AI CLI 特点 和 优势
| 维度 | 特点 (Features) | 优势 (Advantages) | 缺点 (Disadvantages) |
|---|---|---|---|
| 交互模式 | 文本驱动:通过自然语言指令直接触发系统命令或代码修改。 | 极致速度:无需在浏览器、编辑器和终端之间反复切换(Context Switching)。 | 学习曲线:用户需要具备基础的终端操作知识,对非技术人员不友好。 |
| 操作权限 | 系统级读写:能直接访问本地文件、运行测试、读写数据库、操作 Git。 | 端到端自动化:能实现“指令 -> 修改 -> 测试 -> 提交”的全流程闭环。 | 安全风险:如果 AI 指令理解有误,可能误删文件或执行高风险系统命令。 |
| 工作流 | 代理式 (Agentic):不仅生成建议,还能自主执行一系列任务。 | 深度上下文感知:AI 能感知整个项目的目录结构和环境变量,而不仅是单个文件。 工具能理解当前目录、操作系统、已安装软件(如 Git, Docker)等环境信息。 | 不可见性:缺乏图形化界面的视觉反馈,修改大量文件时“感知度”较低。 |
| 性能消耗 | 轻量化:无图形渲染压力,占用内存极低。 | 远程友好:完美支持 SSH 远程服务器开发,即便网络波动也能稳定工作。 | 费用不可控:部分工具按 API 调用计费,复杂的自主循环可能导致账单超支。 |
| 协作方式 | 透明化记录:所有的 AI 交互都留在终端历史或 Git 提交记录中。 | 易于集成:非常容易集成进 CI/CD 流程或现有的自动化脚本中。 | 审查成本: Review AI 修改的代码 diff(差异)在终端下不如 IDE 方便。 |
# 4.2、为什么开发者偏爱 AI CLI
TIP
在 AI 时代的编程中,最浪费时间的操作是:“复制 AI 生成的代码 -> 打开 IDE -> 找到对应行 -> 粘贴 -> 运行报错 -> 复制报错回 AI”
AI CLI 彻底消灭了这个循环。它直接在你的工作目录下“施工”,报错了它自己看,改好了它自己测,你只需要在终端回复 y (Yes) 或 n (No)。
# 4.3、适用场景建议
TIP
- 推荐使用 CLI: 复杂的重构任务、全库 Bug 扫描、自动化测试生成、DevOps 运维脚本编写、远程服务器维护。
- 推荐使用 GUI (如 Cursor): UI 界面调整、初学者的代码解释、小规模的功能点编写、需要精细视觉核对的代码修改。
# 5、国内外大厂“对话式” 编程应用开发平台(适合无任何代码经验)
TIP
国外内互联网大厂推出的、可通过提示词(自然语言)生成网站或应用的无代码和 AI 代码工具。
以下是“对话式”应用开发平台,基于 AI 大模型构建,通过多智能体协作实现生成式应用开发,用户无需编写代码即可创建各类应用。
国际 “对话式” 编程应用开发平台
| 平台名称 | 所属公司 | 主要特点 | 官网/体验地址 |
|---|---|---|---|
| Manus | Manus | 一个通用人工智能代理 (General AI Agent):被誉为“AI 版的 DeepSeek”。它不是聊天机器人,而是“行动引擎”,能自主操作浏览器、分析股票、规划旅行并编程等完成端到端任务。 2025 年 12 月末,Meta 以超过 20 亿美元的价格将其收购 | https://manus.im (opens new window) |
| AnyGen | 字节 | 业级自动化代理:AnyGen 是一家以人与 AI 协作办公为核心,通过多模态记录、结构化加工与可交付输出,重构工作链路并提升内容质量的生成式 AI 平台 | https://www.anygen.io (opens new window) |
| Google Al Studio | 开发者原型平台:基于 Gemini 系列模型主要特点是提供一个集成化的环境,让开发者能够轻松构建、测试和部署基于机器学习的智能应用。 提供极大的上下文窗口(最高支持 200 万+ tokens),是开发者测试 Gemini 新功能、获取 API 的核心入口。 | https://aistudio.google.com (opens new window) | |
| bolt | StackBlitz | 全栈 AI 编辑器:基于 WebContainer 技术,能在浏览器内运行 Node.js 环境。它不仅写 UI,还能生成后端代码(数据库、API),是一个闭环的开发环境。 用户只需一段话,它就能在浏览器里直接生成、预览并部署包含前端、后端和数据库的完整应用。 | https://bolt.new/ (opens new window) |
| v0 | Vercel | UI/UX 生成专家:专注于 React、Next.js 和 Tailwind CSS。强项在于极致的视觉效果和组件规范,适合从对话直接生成高保真、可商用的前端界面,与 Vercel 部署生态无缝集成。 | https://v0.app/ (opens new window) |
| vibecodeapp | Vibecode | 手机原生开发工具(移动优先的“Vibe Coding”):全球首款专门为手机设计的 AI 应用构建器。主打“在手机上写 App”。专为移动端手势设计,让用户通过简单的语音或文字描述,让非技术人员在手机上完成从设计到上架 App Store 的全过程。 | https://www.vibecodeapp.com/ (opens new window) |
国内 “对话式” 编程应用开发平台
| 平台名称 | 所属公司 | 主要特点 | 官网/体验地址 |
|---|---|---|---|
| 秒哒 | 百度 | 无代码/自然语言开发: 2024 年底国内首个“对话式”的“划时代”产品,用户只需通过自然语言描述,系统自动调用各种 Agent(智能体)来完成需求、代码生成及部署。 | https://www.miaoda.cn (opens new window) |
| NoCode | 美团 | AI 零代码工具,通过自然语言和对话形式快速生成应用、小游戏、产品原型等,并可实时预览和一键部署。目前完全免费使用。 | nocode.host (opens new window) |
| CodeWave | 网易 | 智能低代码平台:定位“专业级低代码”。结合了大模型与可视化拖拽,支持从逻辑生成到页面搭建的全栈应用开发,适合企业级复杂业务。 | https://codewave.163.com/aidev (opens new window) |
| 千问 | 阿里巴巴 | 千问是阿里通义千问大模型打造的 AI 对话助手,通义千问支持问答、写作、代码、翻译、录音、PPT 创作、文档处理、音视频速读。 | https://www.qianwen.com (opens new window) |
| 豆包编程、扣子编程 | 字节 | 云端 AI IDE:提供网页版和插件版。特点是内置了全套开发环境(Cloud IDE),让开发者无需配置本地环境即可开始 AI 驱动的编程。 | https://www.doubao.com/code/chat (opens new window) https://code.coze.cn/home (opens new window) |
| MiniMax Agent | MiniMax | MiniMax Agent 是基于顶尖多模态大语言模型打造的智能 AI 伙伴,可精准搜索解答、一目了然的图像识别、沉浸式语音对话、专业创意写作、文档闪速解析,网页制作、AI PPT 等,还有独家悬浮球功能让复杂任务变得轻而易举。 | https://agent.minimaxi.com/ (opens new window) |
| Kimi Code | 月之暗面 | 长文本推理编程:依托 Kimi-K2 强大的长文本和逻辑思考能力。擅长阅读上万行的遗留代码库(Legacy Code)并进行重构或 Bug 修复。可使用网页应用,移动应用 等 | https://www.kimi.com/ (opens new window) |
# 四、AI Agent 智能体
TIP
理解什么是 Agent ,了解常见的 Agent 产品
# 1、什么是 Agent
TIP
Agent = AI 本身
AI 本身就是一个 Agent,它的工作是:
- 理解你的意图和需求
- 做决策(用什么工具、先做什么后做什么)
- 协调各种工具完成任务
可以把 Agent 理解为一个任务执行器:
- 接收你的指令(提示词)
- 调用各种工具完成任务
- 返回执行结果
与普通 AI 对话的区别:
| 普通 AI 对话 | Agent |
|---|---|
| 只能聊天 | 能调用工具 |
| 被动回答 | 主动决策 |
| 单轮交互 | 持续执行 |
# 2、AI 智能体/工作流平台
TIP
- Coze/扣子:零代码制作可一键部署到各大平台的“AI 员工”
- GPTs:为你的 ChatGPT 穿上专属“制服”,打造个人定制版超级助手
- Dify:像搭积木一样,用可视化工具构建企业级、可私有化部署的 AI 应用
| 平台名称 | 所属公司 | 主要特点 | 官网/体验地址 |
|---|---|---|---|
| Coze/扣子 | 字节跳动 | 强大的 AI 智能体平台,可通过自然语言创建 AI Bot 并一键部署到多个平台(飞书、微信等),支持插件、知识库和工作流 | https://www.coze.cn/ (opens new window) |
| Dify | 国内创业公司 | 开源 LLM 应用开发平台,可视化编排 AI 工作流,支持多种模型,开源平台可让企业可私有化部署 | https://dify.ai/ (opens new window) |
| GPTs | OpenAI | 无需代码创建自定义 ChatGPT,可添加知识库、自定义指令和 API 能力 | 需 ChatGPT Plus 订阅 |
| Manus | Manus | 一个通用人工智能代理 (General AI Agent),可以完成 信息处理与研究、编程与软件开发、数据分析与可视化、内容创作与生成、日常任务与工作流自动化 | https://manus.im/ (opens new window) |
| AnyGen | 字节 | AnyGen 是一家以人与 AI 协作办公为核心,通过多模态记录、结构化加工与可交付输出,重构工作链路并提升内容质量的生成式 AI 平台 | https://www.anygen.io/ (opens new window) |
| Google Al Studio | Google AI Studio 的主要特点是提供一个集成化的环境,让开发者能够轻松构建、测试和部署基于机器学习的智能应用。 | https://aistudio.google.com/ (opens new window) |
# 五、深入 Vibe Coding 和 AI 辅助工程
TIP
讲清楚 Vibe Coding 和 AI 辅助工程的区别 ,同时如何使用 AI 工具进行项目的开发
# 1、什么是 Vibe Coding
TIP
2025 年 2 月 3 日,前 特斯拉人工智能总监,OpenAI 联合创始人、斯坦福大学计算机科学博士/硕士 Andrej Karpathy 安德烈·卡帕西 提出了 “Vibe Coding” 编程方式。他本人对 “Vibe Coding” 的解读如下图
其大意是说:有一种新的编码方式,我称之为 Vibe 编程;它让你完全沉浸在氛围中,拥抱指数级增长,甚至忘记代码的存在。
Karpathy 用一种近乎诗意的语言描述了他的编程体验:“这已经不能算是真正的编程了,我只是看看、说说、运行、复制并粘贴,然后程序就能运行了。”这句话瞬间击中了无数开发者的内心,因为它精准地概括了一种全新的软件开发体验。在短短 48 小时内,这条推文获得了超过 50 万次转发,Vibe 编程的话题迅速登上全球趋势榜。

Vibe 编码(也写作vibecoding)是一个新近出现的术语,指的是这样一种编程实践:只需告诉人工智能程序你的需求,它就能为你生成代码、网页或应用程序。在Vibe 编码中,程序员无需理解代码的工作原理,并且通常需要接受代码中存在一定数量的错误和故障。——《韦氏英语惯用法词典》的解释
# 2、革命性概念的诞生:从“写代码” 到 “说代码”
TIP
Vibe 编程这种“说代码”的方式正在改变数字产品的创造方式,让软件开发从精英专属的技术活动转变为人人可参与的创造过程,因此,Vibe 编程在全球范围内开始流行。
一位使用 Vibe 编程 的设计师这样描述自己的感受:就像从手工绘图转向了 Photoshop,我突然发现自己可以实现以前根本不敢想象的创意。
“Vibe 编程”这个术语的精妙之处在于,它捕捉到了这种编程方式的本质特征。“Vibe”一词来源于 vibration(振动),在现代俚语中表示一种感觉、氛围或直觉。当我们说某个音乐有“好的 vibe”时,指的是它给人的整体感受,而不是具体的音符和节拍。同样,Vibe 编程强调的是开发者对软件功能和用户体验的整体感 知,而不是具体的代码实现细节。
2025 年 3 月,《韦氏英语惯用法词典》(Merriam-Webster'sConcise Dictionary ofEnglish Usage)正式将“vibe coding (opens new window)”收录为年度科技词汇,并定义为:通过自然语言提示与 AI 协作生成可运行代码的新型软件开发范式,如下图所示。这一收录标志着 Vibe 编程 从一个网络热词正式成为计算机科学术语。

注:
2025 年 11 月,柯林斯词典宣布:"Vibe Coding" 当选年度词汇。
这个词的官方定义是:一种使用人工智能、通过自然语言描述来生成计算机代码的方式。
换句话说,你不需要学什么编程语言,只要用自然语言告诉 AI"我想要一个 XX",它就能帮你做出来。
# 3、Vibe Coding 的技术基础与工作原理
TIP
这场变革之所以能够发生,是其背后有着强大的技术支撑。2025 年初,随着 Claude3.7Sonnet 等混合推理模型的出现,AI 生成的代码的质量得到了大幅提升。
- 根据 Cursor 技术团队的评测,Claude3.7Sonnet 生成的代码的语法正确率达到 95%,比前代模型提升了 17%。
- 在 LeetCode 中等难度问题上的通过率高达 92%。
这种突破性进展主要归功于混合推理能力的引入:
- 模型能够根据任务复杂度在快速回答与深度思考模式间无缝切换,既能应对简单的日常编码,又能处理需要深度分析的复杂系统架构设计。
- 更重要的是,现在的 AI 不仅能生成代码,还能理解复杂的业务逻辑、调试 bug,甚至进行系统架构设计。
这意味着 Vibe 编程已经从实验性质的工具变成了真正可以依赖的生产力工具。
# 3.1、技术基础
TIP
Vibe Coding 的实现依赖于以下几项关键技术:
- 大型语言模型 (Large Language Models, LLM):这是最核心的基础。 像 GPT 系列、Gemini、Claude 等模型经过海量代码和文本数据的训练,具备了理解自然语言指令并将其转换为代码的能力。
- AI 原生集成开发环境 (AI-Native IDE) 或插件: 为了实现流畅的“氛围”,Vibe Coding 通常在专门的工具中进行。这些工具将 LLM 深度集成到编码环境中。
- AI 原生 IDE:例如 Cursor、Windsurf、字节跳动的 Trae 等,它们将 AI 聊天、代码生成、重构、调试等功能无缝融合在编辑器中。
- IDE 插件:例如 GitHub Copilot,它可以在 VS Code 等常用编辑器中提供代码补全和生成能力。
- 提示词工程 (Prompt Engineering):开发者的技能从写代码转变为如何清晰、准确地向 AI 下达指令。高质量的提示词直接决定了生成代码的质量。
- 上下文理解 (Context Understanding):先进的 AI 编程工具能够理解整个项目的结构、依赖库、代码风格等上下文信息,从而生成更贴合现有项目的代码,而不仅仅是孤立的代码片段。
# 3.2、工作原理与流程
TIP
Vibe Coding 的工作流程可以概括为一个高度互动和迭代的循环。 它颠覆了传统“设计-编码-测试”的瀑布流模式,变得更像与一个程序员同事结对编程。
一个典型的 Vibe Coding 流程如下:
- 明确意图 与 计划:首先,你需要清晰地规划出你想要实现的功能,哪怕只是一个很小的目标。计划越清晰,AI 越能理解你的需求。
- 下达自然语言指令: 在 AI 原生的 IDE(如 Cursor)中,通过聊天窗口或快捷键,用自然语言描述你的需求。
- 反例:“给我一个按钮。”
- 正例:“请使用 React 和 Tailwind CSS 创建一个蓝色的、圆角的按钮,文字是‘点击我’,点击后在控制台打印‘Hello World’。”
- AI 生成代码:AI 工具(如 Cursor 或 Copilot)会解析你的指令,并自动生成相应的代码,直接插入到你的文件中。
- 测试与验证:运行生成的代码,检查功能是否符合预期。你甚至可以要求 AI 先为你编写测试用例。 如果出现错误,直接将错误信息反馈给 AI。
- 迭代与微调:通过持续的对话来改进代码。你可以要求 AI 进行修改,例如:
- “把背景颜色改成深色主题。”
- “请为这段代码增加错误处理逻辑。”
- “重构这个函数来提升性能。”
- 版本控制:在每个功能稳定后,使用 Git 等工具进行版本控制,方便在 AI“失控”时回滚到稳定版本。
- 重复循环:完成一个功能后,回到第一步,继续开发下一个功能。
# 4、传统开发与 Vibe 编程开发流程对比
| 流程阶段 | 传统开发流程 (命令式编程) | Vibe 编程流程 (意图式编程) |
|---|---|---|
| 1. 需求与设计 | 需明确验证方式、数据库结构、安全机制等细节,并绘制 ER 图与接口文档。 | 意图输入:开发者使用自然语言描述核心目标,如“创建一个支持用户名/密码登录的功能,使用 BCrypt 加密,登录成功则返回 JWT Token”。 |
| 2. 环境与搭建 | 手动配置本地开发环境、数据库服务、Web 框架,并引入加密库和身份验证中间件。 | 由平台自动完成环境与基础架构的配置。 |
| 3. 代码实现 | 后端:手动实现用户接口、令牌逻辑、数据库交互层。 前端:手动构建 UI、处理表单事件、对接鉴权。 | AI 自动生成:平台根据意图,自动生成完整的后端接口、数据库迁移脚本和前端页面组件,并自动集成安全最佳实践。 |
| 4. 测试与调试 | 手动进行:通过接口工具、单元测试框架验证功能和逻辑,并排查跨域、令牌异常等问题。 | 由平台辅助,内置的智能机制可减少常见错误。 |
| 5. 部署与运维 | 手动完成代码打包、上线部署、配置 SSL 与安全策略。后续需持续手动修复漏洞、支持演进。 | 一键部署:代码可直接部署至云平台,SSL 配置与 API 文档同步自动生成。 智能运维:平台内置监控模块,可检测异常并AI 自动提示优化建议、修复常见漏洞。 |
| 6. 扩展与变更 | 接入新功能(如 OAuth、2FA)常需大规模手动重构代码。 | 后续功能扩展仅需调整配置或描述,无需大规模重构。 |
| 核心特点总结 | 技术链条长、依赖多,对开发者专业要求高。细节处理易疏漏,多人协作时联调、同步易成效率瓶颈。 | 流程显著简化,开发者聚焦于描述“做什么”(意图),而非“怎么做”(实现)。由系统自动化完成大部分编码与配置工作,提升效率与安全性。 |
# 6、AI 辅助工程
TIP
Google Chrome 开发者体验负责人 Addy Osmani 在最近一期《The Pragmatic Engineer》播客中,Addy 详细阐述了他的新书《Beyond Vibe Coding》的核心观点——AI 能帮你提速,但无法替你思考。
AI 工具可以快速完成 70%的工作,但剩下那关键的 30%,必须靠真正理解系统的工程师完成。
# 6.1、Vibe Coding vs AI 辅助工程
这两种利用 AI 的模式,处于“工程光谱”的两端:
| 名称 | 定义 | 特点 | 适用场景 |
|---|---|---|---|
| Vibe Coding (氛围感编程) | 强调创意流、高层次提示词,甚至“忘记代码存在”。 | 快速迭代、实验性强,接受 AI 建议而不进行深度审查。 | 原型设计(MVP)、个人小工具、快速验证想法。 |
| AI-Assisted Engineering (AI 辅助工程) | 将 AI 视为协作伙伴,但严格遵守工程原则。 | 强调规划(Spec)、系统架构、安全性、可维护性。 | 大规模生产环境、需要长期维护的商业系统。 |
# 6.2、“70% 问题” 与 关键的 30%
TIP
- AI 只能完成前 70%: AI 可以极速生成样板代码和基础功能,给开发者带来“虚假的自信”。
- 消失的后 30%(最后一公里): 真正的挑战在于调试、安全加固、性能优化以及与复杂旧系统的集成。
- 工程师的护城河: 只有具备批判性思维和系统性解决能力的专业工程师,才能完成这最后的 30%。如果完全依赖 AI,开发者会陷入“反被 AI 绑架”的困境,无法解释和修复系统。
# 6.3、AI 时代下的软件工程新准则
TIP
即使有了 AI,传统的工程最佳实践依然是“保命符”:
- 规范驱动开发 (Spec-driven Development): 在写提示词之前,先明确“我们要构建什么”和“期望是什么”。
- 上下文工程 (Context Engineering): 提供高质量的描述、文档和示例,弥补 AI 对团队内部“隐性知识”的缺失。
- 人类监督不可缺席: 不能让“AI 写代码 + AI 审代码”形成闭环。人类必须理解每一行进入生产系统的代码。
- 测试先行: 用自动化测试来验证 AI 输出的正确性,这是防止 AI “胡言乱语”的最高效手段。
# 6.4、行业角色的演变趋势
TIP
- 高级工程师(Senior): 价值更高。他们从“搬砖者”转变为“乐团指挥”或“智能体编排者”,负责管理多个 AI Agent 并进行严格的代码评审。
- 产品经理(PM)与工程经理(EM): PM 的核心竞争力将转向 ** “品味”与“定义问题的能力”。
- EM 将更多地关注 AI 治理、安全评估与流程优化。
新协作模式: 可能出现“三人编程”(资深开发者 + 新手 + AI),AI 充当教学助理。
# 6.5、核心重点
TIP
- “AI 能帮你提速,但无法替你思考。”
- “你的专业水平越高,AI 工具的效果越好。”
- “如果你无法完整解释一段代码,就不应该提交它。”
AI 极大地降低了“起步”的门槛,但并没有降低“交付高质量生产系统”的门槛;工程师的职责已从“单纯写代码”转向“架构设计、上下文重构与质量把关”。
最后引用英伟达机器人部门总监兼杰出科学家 Jim Fan 博士的话来总结:

# 六、失去动力的年轻人,才是 AI 时代最大的危机
TIP
这股 AI 狂热中最令人不安的,是部分本可成为顶尖人才的年轻人,正陷入一种“学什么都没用,反正 AI 全都懂”的虚无主义。然而,真正的未来属于 AI 协作编程。
讨论 AI 是否取代开发者已毫无意义。在可预见的未来,人机协作将进化为一种“高度同频”的关系。Vibe Coding(氛围感编程) 的兴起,意味着编程门槛的下移,更多非专业人士将具备解决基础需求的能力。
所谓的“六个月内被取代”已成了喊了三年的狼来了。事实是:企业的招聘从未停止,只是标准更高了。AI 不会降低人才门槛,反而拉高了上限。顶尖开发者通过 AI 洞察技术边界、提升交付效率,而开发者自身的技术深度,才是决定“降本增效”质量的核心。
记住,今天逻辑已变:AI 时代:成功,才是成功之母。
大厂最新技术学习分享群
微信扫一扫进群,获取资料
X