Skip to content

2025 AI review

2022 年 ChatGPT 发布至今,

已经有三年的时间,

从客观的角度来讲,

这三年中,

宏观和微观层面,

也许都有挺大的变化。

而从个人的体感来讲,

今年的变化应该是最大的。

具体体现在

  1. AI 似乎成为了主流词汇
  2. 个人日常使用不愿离开 AI
  3. 工作中也有些 AI 工程层相关
  4. 大多行业及其应用都在集成 AI

也许你会和我有同样的感受,

所以,我希望在今年也记录下关于 AI 的内容。

本文会从偏客观和偏主观的两个方面细化。

  • 偏客观:2025 年的 AI 相关发布情况,从而去尝试总结今年发展。
  • 偏主观:从日常使用 AI、AI 对我的影响、重新看待 AI这三个方面梳理并结合具体的例子,来发表我个人的想法(不一定对)。

实际上,

写这篇文章对我来说有点挑战。

我不确定分主/客观的逻辑是否能讲清楚,

我不确定文笔是否能让不同的人好理解,

我不确定这些内容信息量如何,不确定长文/短文。

但我还是希望先记录下来,

希望其中有些内容能引起你的共鸣,

也许,这也算传递些增量的信息。

一、我眼中的 2025 AI

图片-1

如果让我总结我眼中 2025 AI 的发展,

大概会有几个关键点吧。

  • 推理模型兴起
  • 标准协议制定
  • 工程基建补齐
  • 应用形态创新

下方我们具体来看看吧

**模型层:**推理型模型成为主流能力范式

  • 2024 状态:生成式模型主导市场,依赖预训练规模扩展提升能力,但 Scaling Law 收益递减,模型缺乏深度推理能力、OpenAI O1 推理模型发布
  • 2025 突破:推理时计算成为新范式,模型具备 System 2 深度思考能力,从"快速生成"转向"深度推理",在复杂任务上质变式提升。
  • 标志事件:OpenAI o1/o3 系列率先验证推理模型路径;DeepSeek R1 以开源方式证明推理能力可平民化,行业形成共识,其余厂家也采用推理模型路径;

图片-1

**协议层:**Agent / Tool 等关键协议逐步标准化

  • 2024 状态:各家 AI 厂商各自为战,工具调用、Agent 通信、UI 交互均采用私有协议,生态碎片化严重,开发者需要为不同平台重复开发适配层。MCP 协议刚推出,但还没有成主流规范。
  • 2025 突破:今年协议逐步趋向行业统一,覆盖工具集成(MCP)、Agent 协作(A2A)、能力封装(Skills)等协议,AI 生态从封闭走向互操作,开发者可以"一次编写,到处运行"。
  • 标志事件:MCP (Model Context Protocol)协议发布及厂商跟进支持;Google 推动 A2A(Agent-to-Agent);Skills 能力推出,后续演变成通用标准。

图片-1

**工程层:**AI 应用工程化基础设施补齐

  • 2024 状态:AI 应用开发处于"手工作坊"阶段,框架零散且功能单一,缺乏成熟的编排引擎、调试工具、可观测性方案,开发者需要自行拼接 Prompt 管理、工具调用、状态管理等基础能力。
  • 2025 突破:工程范式演进(从 Prompt Engineering 演变 Context Engineering);基础设施补齐(可观测性、成本监控、部署平台成熟);框架生态完善(通用 Agent SDK、编排引擎、记忆管理、工具调用),开发者可以像构建传统应用一样构建 AI 应用,具备完整的开发、调试、监控、部署能力。
  • 标志事件:Context Engineering 提出、Multi-Agent 编排模式标准化、Human-in-the-Loop (HITL) 模式出现;Anthropic Claude Agent SDK 发布、LangGraph 1.0 发布、MCP Servers 生态丰富**。**

图片-1

**应用层:**Agent 应用新形态的出现

  • 2024 状态:AI 应用以 Copilot 辅助模式为主(代码补全、文本续写),交互形态单一(纯文本对话框),能力边界清晰但狭窄(单轮问答、被动响应),缺乏主动性与持续性,无法完成复杂多步骤任务,更像"智能工具"而非"智能助手"。
  • 2025 突破:从 Copilot(辅助)演进到 Agent(自主),从通用对话扩展到垂直场景深度渗透,从单一文本交互拓展到多模态人机协作,Coding Agent 应用验证 Agent 商业价值,Agent 开始具备任务规划、工具调用、持续执行、主动反馈等自主能力。
  • 标志事件:Manus 发布,全球首款通用型 Agent;Claude Code, Cursor 等 AI 编程工具发布;客服、销售、数据分析、设计等领域专用 Agent,如 Lovart Agent。

图片-2

是吧,短短一年之中,

AI 在模型层、协议层、工程层、应用层都有所进展,

而 AI Agent 应用也开始了从“可提问”逐渐进入“可执行”。

讲完了 2025 偏宏观层面 AI 的发展,

那么聚焦到我个人,

我希望与你分享我日常如何使用 AI。

二、我如何使用 AI

目前可以说日常已经离不开 AI,

或者说没有 AI 的话,

我的效率会有所降低。

而自己主要是用在下方几个方面。

2.1 信息处理

信息处理是一个比较抽象的词,

我们在这里,将其简化为

“输入 → 提炼 → 关联 → 梳理 → 输出”

实际上,你会发现每个环节都可以有 AI 的参与。

输入

AI 能够根据你的语意要求,

从而去检索对应的资料信息。

如果你用过 DeepResearch,

大概能理解我想表达的意思。

虽然他无法保证帮你找到所有的信息,

但至少公域内的高质量信息还是能找到的。

提炼

作为一名信息爱好者,

面对日益增长的信息源,

一直在想如何提高阅读效率。

而 AI 确实能够与阅读相结合,

提供全文总结,思维导图,问答等能力,

从而辅助我们进行阅读。

如阅读 Andrej Karpathy 的 2025 年总结

也许这样能够更好地理解信息吧。

关联

“链接”是个很神奇的动词,

有的时候能够起 1 + 1 > 2 的效果,

或者我更喜欢称为**“连点成线”**。

而 AI 也能把你做找关联,以及链接的能力。

而当你的节点足够多了之后,

也许你能得到一张丰富的网络。

输出

而在当我做具体写作的时候,

AI 可以给我一些建议输入,资料查询。

同时呢,他也可以将这些散落的点关联起来。

2.2 知识学习

近几年接触下来,

我感觉 AI 在知识学习方面,

能够有不错的帮助。

因为我觉得 AI 是一种新的媒介。

他能够根据场景适配内容、展示形态、提供反馈

也就是说,“信息也许变成液态的,可交互,双向反馈的”

如理解一个新的概念。

理解一个书籍内容

2.3 日常审视

作为一名日常喜欢记录的人,

我一直想着说,

能否有个外部视角,

能够通过我记录的行为,

从而来看待我这个人。

但在前几年,

貌似并不好做这个事。

而今年貌似可以做了。

如用 notion 总结了自己写了三年的 Blog

如自己写日记,并让 AI 进行总结。

你能够看到你一段时间内的痕迹。

同时,你还可以看到,你没有留意到的东西。

虽然他给的回复不一定客观,

甚至可能还有些拍马屁的行为。

但也许有些外界的反馈输入,

并且自己做好判断,

也许是一个不错的输入视角。

2.4 AI Coding

让我比较震惊的是 AI 和 Coding 的结合。

前两年的时候,主要是以代码片段粒度为主, copolit 的辅助代码助手。

而去年的时候,演变成以文件粒度为主,能够改动单文件的工具。

而今年,变成了以模块/需求粒度,能自行交付任务的 Coding Agent。

或者有一些更直观的个人例子

  • 下半年算起,个人项目的代码应该有 90% 是他写的。
  • 一个复杂需求中,用一个小时不到时间,完成本需要花一、两天的代码重构。

如:此前让他集成一个 PDF 结合 RAG 的模块。

  • 拆解任务:拆解成一个一个小任务

  • 具体编码:几轮对话之后,基本就完成了编码。

  • 最终效果:最终效果超出我原本的预想。

再比如,国庆假期的时候,我也在编码。而到假期回头看的时候,也确实添加了不少功能。

过去这一年中,

AI Coding 的发展比我想象中的快很多,

22 年时候,让 ChatGPT 写一个简单的程序。

25 年的今天,我基本能让他自行完成一个需求。

实际上,我将 Coding Agent 看成是 Software Meta Builder

【构建软件的成本比以往降低了不少】

有种感觉“软件构建器”的概念。

有一种循环的感觉

“构建工具 -> 处理数据 -> 构建工具 -> 处理数据”。

同时,他也许不仅仅是工具的范围了。

总得来说,在使用过程中,貌似 AI 已经是一个伙伴的角色。

三、AI 对我的影响

我们塑造工具,随后工具塑造我们。 ——麦克卢汉

在使用 AI 的过程中,

有些新的体会,

或者说,

AI 也在影响我们吧。

其实看科技发展历史,

会发现

  • 农作物的出现,让人们更注重计划。
  • 时钟的出现,从而演化出了八小时工作制。
  • 网络的出现,让我们时刻在线、信息过载、即使信息消费者,也是被消费者。

……

而 AI 对我的影响,

我梳理成下方几点。

3.1 允执厥中

“不执两端,而取其中”

“允执厥中”一词出自《尚书》

我的理解是**“在两个看似对立面之间,根据实际情况找到平衡**”。

这也是我今年在工作、生活的一大感悟。

但我没想到,今年 AI 也给我相关的启发。

确定性与不确定性

作为一名工程师,

在以往的开发中,

更多是做预设、确定性的场景,

给定了一定的输入,

也许会有大差不差的输出。

而 AI 工程更多是,

你给了一段输入,

可能会有各种,

甚至有相反的输出。

一开始会很不适应,

因为这种不确定性很难把控。

但也许,

确定性能保证下限,

而不确定性可能能突破上限。

需要根据具体场景做判断。

场景与选择

倘若你做 AI 工程应用,

大概会接触下方名词:

Function Calling, 通用 Agent, Skills, Workflow

并且你会发现,

没有哪种手段是完美的答案。

我对复杂度和通用性做了分类,

但实际的场景也比上方复杂的多,

并非所有任务都能落到象限中心,

更多的是,在象限的交界处。

需要判断好不同的任务场景,

从而选择不同的处理方式,

甚至可以将不同的方式做组合。

理论和实践

实际上,

这里我更希望称为抽象理论具体实践。

在做 AI 工程的时候,

我确实收集了很多关于 AI 工程的信息。

并且也把他拆成几个部分

知识库,MCP/工具,Memory,Agent Orchestrators 等。

貌似把这些模块做了集成就能得到不错的 Agent 效果,

但到具体实际落地的时候,

会有更重细节和场景,

  • RAG 中:如何具体分 Chunk; PDF 中的图表如何做切分。
  • Agent Orchestrator: 自己实现的 ReACT 怎么就只能跑几轮。
  • Skills:为什么这个 skill 不执行。

理论抽象固然重要,

而具体实践才能撑起理论,

并且修正此前的理论抽象。

这是一个往复的过程,

但能同时有宏观视角看事物,

又能微观视角落细节,

属实不易,

也在不断修炼中。

也许,大多情况下,

如果看清情况,

我们不需要过多极端的选择,

但我们可以判断选择是否极端。

3.2 规划与执行

钢铁、蒸汽是历史上出现的新材料,而 AI 也是一种材料,他带来无限的智力。

你可能会觉得这句话有些眼熟,

没错,

这来源于 Notion CEO 前不久的一篇博客。

主要观点是:

AI 是新时代的原材料(无限的大脑),并从个人、组织、经济体举例可能的影响和变化。

我们需要认识到惯性,重新审视如何使用这种新型的材料。

也许你会感觉“无限地大脑”可能有点夸张,

但貌似已经有类型的场景了。

如在使用 Claude Code Web,

你可以指定好任务,

然后让 Coding Agent 做后续执行。

而到最后他确实能够交付任务,

如图中,Claude Code 已经完成了 10/20+ 任务。

而在我的感受中,

你需要做的是,

编排好任务,然后充足上下文,

就能够转动这个“无限的大脑”了。

但要做好这些并不容易,

这些要你能宏观编排,

又能有深入检查细节能力。

3.3 开环和闭环

这里的“闭环”并非互联网黑话,

而是控制论中的“开环/闭环”系统的概念。

“开环”系统:没有外部反馈输入。

“闭环”系统:会有外部反馈输入,从而调节自己的行为。

区别点在于是否有外部的反馈来更新自己行为。

而 AI 能够给我们带来反馈,

  • 问答本就是一种双向反馈的交互
  • AI 可以在具体的场景给你反馈建议。

而这些反馈也许会改变你的动作。

但也要审视,

因为这些反馈并不一定准,

他只是外部给的一个信号,

很多时候需要做好判断。

比如今年 AI 给我的三个小建议是

  • 少想多做:理论够了,该动手了
  • 走出去验证:自洽不等于正确,去验证
  • 允许非理性:不是所有时间都要有意义

实际上我觉得这几点也有道理,

但这也可能只是我的某一切面。

3.4 连点成线

非结构化、非基于规则、语意的信息关联。

我曾多次发表过:

“信息”应该是可关联的,

本质上是将非结构化信息通过非规则的手段,

进行语意的信息关联,

从而产生新的信息内容。

但这种关联,

并非仅通过“向量相似度计算”的关联,

而是检索之后还有生成的能力;

甚至语意完全不同的信息,

也可以做关联。

这样子你就可以做

  • 对比:对比两个方法的优劣之处,如方案 A 和方案 B的优点/缺点是啥
  • 关系:了解统一分支下不同概念之间潜在的关系,如深度学习和机器学习的关系。
  • 灵感:找到不同学科、信息中的交叉点,如哲学、工程、艺术是否存在某些观念。
  • 细节点:能通过关联,找到相似的细节点。

如下方关联 A2UI 和 GenUI 的例子

我无法具体说清,

这种用法的好处。

但我觉得这种方法,

让我看到事物可能存在的关联点,

而在日常思考的过程中,

会无意识找到对应的关联点,

结合做具体的分析。

那是种奇妙的感觉。

四、重新看待 AI

4.1 客观理性看待

AI 日益融进生活,更应该需要客观理性看待。

一两年前的某一天,

我问了自己几个问题,

  • 我们今天所接触到的,到底是 AI、LLM、AIGC?
  • 什么是 AGI, ASI,你又任何理解?
  • 机器学习、深度学习、LLM 又是什么?
  • 如何理解符号主义、连接主义、行为主义?

当时,我发现我并不能回答好这个问题。

貌似今天接受到是 AI、LLM、AGI 的概念,

当然这有个好处是便于传播,减少沟通成本。

但实际上传递的是模糊、压缩后的内容。

以个人见解,

今天我们接触比较多的,

可能叫 生成式 AI 更准确。

他是深度学习的子集

而深度学习是机器学习的子集,

而机器学习是 AI 的子集。

至于 AGI, ASI,

貌似有人提这些概念,

但并没有一个比较准确的描述。

我并不是说用这些词不好,

而是我觉得这些词会让人产生理解偏差。

而在今天的信息环境中,

关于 AI 的新闻充斥着整个环境,

但对于 AI 通识的内容信息却比较少。

但更重要的是,

我们可能需要理解这些词背后的含义,

这样子也许能较为客观理性地看待 “AI”。

4.2 AI 影响信息

AI 影响了重要元素,即信息,而信息是组成社会基础元素。

本章节的观点,

实际上并非我原创,

更多是来源于赫拉利的两本书籍

  • 《人类简史》
  • 《智人之上》

如果读过这两本书,

相信你可能会和我有同样的观点。

《人类简史》中表明**“信息的重要性和基础性,实际上人类之所以能发展,也是靠信息来链接。”**

《智人之上》中表明**“ AI 实际上会影响信息层(如信息生产、分发、处理),从而获得更多主导权。”**

而这种影响,大概率还是潜移默化的。

今年有两个例子

  • 网上 AI 生成内容数量已经超过了 人类生成内容数量。
  • 我今年有几次对 AI 生成的假内容深信不疑,直到后面有人提醒。但也许还有很多我没留意到。

甚至,

目前转变了观念,

社交媒体的信息,

默认判断为 AI 生成。

这个趋势也许是不可逆的。

4.3 AI 新媒介

AI 是新的媒介,不仅作为传播渠道,也修改/创造了传播的内容和形态。

“媒介即讯息”:媒介本身的特性和形式,比它所传播的具体内容,对社会和人类的影响更为深远和根本。

今天的 AI 影响了我们生产/消费传递内容的形态。

  • 生产:在生产侧,提供的内容/产品不再是预设的,而是根据场景动态变化的。
  • 消费:在消费侧,接受者接受的内容也可以根据个人偏好做适配场景。

这也意味着 AI 不仅仅是一个传输渠道,而且内容/产品的协作者。

至少在软件工程层面,

软件从原本较为确定的开发模式,

开始融入了 Agent 但不确定的开发模式。

借助这种能力,

软件中承载的内容/服务,

也许能做到超出预设软件达不到的效果。

也许这就像酿酒一样,

你需要塑造一个环境,

让微生物发挥他的能力,

也许你会得到一个普普通通的酒,

但也许也能得到未曾尝过的美妙滋味。

但更为重要的是,

你需要营造一个环境,

让 AI 这种新媒介生长、发挥作用。

当然这不限于软件工程。

且也许我们需要用新视角来看待新的媒介。

4.4 过程的压缩

拥抱 AI,使用 AI, 但也具体分场景看,不要过分依赖,否则会造成“过程的压缩”。

如果是 LLM 有个关键词是**“压缩”**,

那么这个词可能也适合放到这几年吧。

而对我而言,

更多的是**“过程的压缩/消失”。**

当通过提问能直接获取答案,

当通过描述需求就能生成代码,

当仅给点一个主题就生成长文。

貌似获得结果更快了,

但我却没有以前的乐趣。

也许是这过程被无限压缩了,

甚至“过程”直接消失了,

而也许我更希望在过程中找乐趣。

图片-1

也许这样子确实能提高效率,

但貌似在有些情况下,

我并不清楚里面的细节,

我不知道具体场景中有哪些难点,

我甚至无法给做出的结果做客观评价。

而当我回答不了上述的问题,

反过头来说,

“这些结果真的是我做的么”

“Journey is the reward.”

也许我们可以,

让部分过程不被压缩。

写在最后

写到这里,

这篇文章的结构、内容,

已经和我一开始想有所偏差。

有些点没能表达出来,

有些点表达得效果一般,

文章在细节上有点糙。

但也许这些是我目前所能表达的吧,

请读者多多体谅,也可直接给予反馈。

外部的声音对我来说是稀有的财富。

作为一名信息爱好者,

我希望在这个

变化过快,信息过多,碎片化注意力

的时间段上

提供一点较好的视角,

分享一些个人的想法,

传播一些有趣的内容。

希望这篇文章,

能在某个时刻,

对你有一点点帮助。

Released under the MIT License.