文 | 有界 UnKnown天元证券 - 正规股票证券资讯服务平台_天元证券有限公司,作家丨山茶,编著|钱江
回来 2025年,AI行业最进击的变化不是模子,而是Agent实在插足处事流。
11月,Nano Banana 还是发布就在创作器用赛谈撕出一起缺口。它不是毛糙地帮东谈主作念打算,而是重构了打算师的处事样式,让 AI 第一次具备可用的、领域化的产出智商。
不错说,Nano Banana 将总共打算谋划的处事样式齐改了一遍。同样,国内 AI Agent 也以迅雷之势渗入进百行万企的办公场景。写一个文档、作念一套 PPT、裁剪一个播客节目、整理数据报表——越来越多处事被 Agent 相连。
不错说,打工东谈主的处事样式,这一年也被悄然改写了一遍。
在国外,Microsoft Copilot、Google Gemini、Notion AI 等多模态办公与创作器用矩阵已成型;国内厂商同样不甘过期,百度文库和网盘蚁合推出的 GenFlow3.0、金山的 WPS.AI、阿里的千问和夸克、字节的扣子空间等纷繁入局,将写文档、作念 PPT、数据处理、图像生成、自动化分发等整合成一站式多模态 Agent 系统。
但问题随之涌现——当 AI 垂手而得、无处不在时,用户实在需要的Agent究竟是什么?是统统替代原有过程?照旧在处事中主动打算决议?是自动化智商的重复?照旧创造力的膨胀?
更波折的是,在总共大厂集体下场之后——谁会成为"中国的 Nano Banana ",转变国东谈主的处事样式?谁会实在界说下一代创作与办公场景?
带着这些问题,咱们挑选了咫尺国内 5 家主流大厂系 Agent 进行实测:百度 GenFlow3.0、腾讯 ima、金山 WPS.AI、扣子空间、夸克。而通过 5 款居品测评后,咱们发现 3 次代际分层正在出现:
1、有智商出产完好处事流;
2、有智商形成数据闭环;
3、有智商捏续齐集默契与记念。
但咫尺仅两家跨进第三阶段。
1、Agent 的 3 个料到尺度
在回答问题之前,咱们需要先贯通:AI 到底如何改变了当下的出产和创作样式。
夙昔,无论是早期的 Office,照旧其后兴起的千般 SaaS 创作平台(如 Canva 等),其结构骨子齐很毛糙——底层是编著套件,表层是创作模板、素材和协同器用。
在这一阶段,出产力的核心仍然是"东谈主",创作平台更多只是"器用箱"。
ChatGPT 问世后,微软率先将 AI 智商整合进 Office,开启了传统创作器用的第一次转型。但早期 Agent 只可作念文本处理、润色、扩写,内容生成等,直到本年多模态模子熟识,Agent才启动深度介入创作全过程,并鼓舞AI从单一器用,走向一站式"智能活水线"。
在这一配景下,Agent 架构也变得更复杂。基于咱们对多款 Agent 居品的调研,咫尺的一站式 Agent 梗概不错拆分为三个层级:
这个三层结构,恰是撑捏改日 AI Agent 从援救走向主导的波折框架。

在这个全新的结构下,有 3 个 Agent 的料到尺度十分进击:
最初是多模态一站式生成智商。AI 左右正从"一个器用经管一个问题"的单点时期,迈向"一个居品经管多类任务"的通用时期。正如 Sam Altman 近期访谈提到:"时时情况下,大多数用户齐但愿领有一款单一且高效的 AI 服务,巧合链接其通盘生活轨迹并捏续提供价值,是以 ChatGPT 需要握住加多更多功能。"本岁首,Manus 爆火也加快了这一趋势,通用、多功能整合成为行业共鸣。
其次是学问库买通程度。实在让 Agent 之间拉开差距、形成壁垒的,不在于大模子,也不在 prompt 和器用,而在于它能在多大范围转机数据。若是素材、语料、用户偏好齐能系统化千里淀成学问且跨素材调用、跨作风贯通、跨任务迁徙,那每次创作就齐能诞生在可学习、可进化的学问结构上,AI 不错像东谈主一样,越作念越好。
临了是东谈主与AI的合营。这亦然 Agent 与传统 AI 器用最大的不同。传统 AI 器用由东谈主掌控,创作家相识不错径直贯彻到作品;Agent 则是与东谈主共同创作,AI 是创作家的搭档、助手、副驾驶。这也意味着,东谈主类需要以更主动、全面的姿态介入到传统的" AI黑盒"——东谈主机合营编著愈加进击。
因此,咱们不错对一款AI Agent 是否具备竞争力作念出科学的判断,主要有以下三个核心判断尺度:
1、是否有充足丰富的 AI 创作器用 /Agent,巧合支捏全模态、一站式的内容生成;
2、是否有强劲的学问库,巧合千里淀学问和记念,并将这些数据反哺到创作当中;
3、是否有细致的东谈主机合营框架,让东谈主与 AI 充分合营。
围绕这些尺度,咱们对 5 家主流 Agent 进行了系统性测评,并把测试恶果拘谨整理,形成这张总览图:

居品实测:谁是中国的" Nano Banana " ?
当 AI 实在走进创作与办公场景,决定体验各别的第一起分水岭,并不在于模子参数或算法智商,而在于——它到底能不成把一件事完好的作念完。
料到这少许的首要方针,恰是平台功能的完备程度。下表展示了各平台在创作深度与任务跨度上的支捏情况:

从功能掩饰度来看,GenFlow3.0是咫尺唯独具备全模态创作智商的平台,基本掩饰了主流 AI 创作平台的总共核心智商;夸克与WPS位列第二梯队,巧合撑捏起绝大多数常见的创作与办公场景。比较之下,扣子空间与 ima在多模态智商、文档器用链及专科功能上仍存在不同程度的缺口,全体居品形态尚处于捏续完善的爬坡期。
关联词,跟着各家 AI 的任务掩饰面渐渐趋同,决定用户体验各别的第二谈分水岭果决出现:核心矛盾不再是 AI "能不成生成",而是东谈主类"能不成随时禁受和修正"。
在这一维度上,决定合营深度的波折方针,恰是对Office体系的兼容程度:

测试恶果娇傲,各平台在这一维度上的发达口角分明。撤除本人即是办公软件的WPS占据主场上风外,GenFlow3.0是唯独完结"原生级兼容"的 AI 平台:它不仅支捏径直输出 Office 样式,更买通了跨器用、跨开导的编著链路,实在完结了从" AI 生成"到"落地推行"的闭环。
在交互打算上,GenFlow3.0 接管了私有的"双模态编著"政策:
轻量微调:生成文档或 PPT 时,右侧预览窗支捏对话式修改,无论是 Excel 高亮制定列、生成雷达图,照旧诊疗 PPT 样式,一句提示即可完成。
深度精修:若需复杂的排版,一键切换至"高档编著"模式即可插足高度薪金 Office 的专科界面,操作风气与功能体验简直无缝说合。
比较之下,扣子空间、夸克和 ima诚然也配备了预览窗口及基础的图文编著功能,但其内核仍是"轻量级编著器",穷乏完好的 Office 器用套件支捏,难以搪塞深度的文档处理需求。
除生成智商外,东谈主与Agent的合营顺畅度组成了居品体验的第三谈分水岭。这其中的核心命题在于:系统是否赋予了东谈主类在推行过程中随时介入与调优的职权。
竟然的创作往往口舌线性的——它是一个边作念边想、跟着灵感涌现而握住修正逻辑的动态演进过程。这种"螺旋式高涨"的念念维模式,才是东谈主类处事的常态。
缺憾的是,咫尺大多数 Agent 仍沿用机械的"单向推行"逻辑:一朝启动便难以打断,即便用户半途发现方针跑偏,也只可被动恭候其推行完结后再推倒重来,变成了多数算力与时辰的双重销耗。
为了遁入这种"过程黑盒"带来的偏航风险,主流居品广博采取了折中的"前置证明"政策。举例 GenFlow3.0、扣子空间、ima 和夸克等,在生成 PPT 或长文档前,齐会强制先生成提纲与视觉作风,待用户"署名画押"后,才敢插足厚爱生成的要津。
天然,"前置通常"并非行业标配。以WPS为代表的部分居品仍沿用传统的提示逻辑:用户下达需求后,AI 便插足"黑盒推行"情状,直至径直输出完好恶果。
值得一提的是,GenFlow3.0在此次测试中展现出了最具各别化的交互形态。它不仅具备尺度的"前置证明"过程,更始创了"断点续写"智商——即允许用户在生成过程中随时按下暂停键进行滋扰。
实测中,咱们在撰写年终总结时特意遗漏了波折信息,半途暂停并补充提示条件"详实强调全年纪迹亮点"。GenFlow3.0 招揽提示后,并未机械地推倒重来,而是不仅贯通了新需求,还能"接得住"之前的进程,在原有逻辑流上无缝陆续生成。
这种"动态纠偏"智商,符号着 AI 合营从"提示式"实在迈向了"交互式"。
至此,东谈主机联系已发生质变:AI 不再是单纯的输出器用,而是插足了被经管、被纠偏、深度合营的"职工形态"。
但当 AI 需要捏续参与长链条任务,甚而面对用户的反复打断与修正时,一个底层手艺命题随之浮出水面:它凭什么能谨记住高下文、接得住新提示、且越干越顺遂?
这就涉及到了 AI 的核心记念核心——学问库。
如今,学问库虽已成为 Agent 居品的标配,但实在的体验领域在于:它究竟是一个颓靡的"仓库",照旧一套天然流动的"学问引擎"。空想的学问体系,不应成为用户的极端责任,而应在阅读、念念考与创作的过程中无感千里淀、天然滋长。
因此,评测的焦点不再是"有莫得",而在"怎么存(学问取得)"与"怎么用(学问左右)"这两个波折闭环上。对此,咱们对各家的发达进行了全景扫描:

在"学问取得"这一要津,各家的生态基因决定了三种截然相背的护城河:
最初是 ima,它的上风在于对腾讯生态内容的深度整合。它不仅支捏腾讯文档的一键导入,更径直买通了微信公众号著作的保藏链路。这意味着那些顽固在微信私域内的高价值内容,只好 ima 能将其简约地回荡为可调用的学问钞票。夸克的上风则诞生在浏览器这一高频进口上,通过截屏与划词,夸克不错将碎屑化信息的汇集门槛降至最低。
比较之下,GenFlow3.0的上风不单是是全,更在于"专"。依靠百度文库和百度学术的繁密数据库,它能取得到海量别东谈主搜不到的内容——比如各行业民众上传的专科文档、公文模板、测验题库以及深度的学术论文。这些时时需要付费或特定权限智力看到的独家干货,组成了 GenFlow3.0 最硬核的学问底座。
此外,GenFlow3.0 还构建了一套私有的"内轮回"机制:总共由 AI 生成的内容,齐不错一键回流至学问库,在画布中被摆脱拖拽、重组,并再次参与创作。学问不再只是被存放,而是在反复使用中捏续升值,实在完结了随取随用、越用越强。
天然,学问的取得不是目的,让取得的学问为创作赋能才是目的。
当咱们将视角转向"学问左右"时,体验的分水岭随之披露:
夸克诚然在汇集端发达出色,但咫尺存在显然的"存储 - 左右"断层——其保藏的内容多以"书签"样式存在,无法在创作中径直调用,这大大减轻了学问库的实用价值。同样,ima的学问库底座诚然强劲,但却由于器用链过于单薄,巧合调用学问库的场景三三两两,导致千里淀的学问价值无法被充分线路出来。
实在的闭环出咫尺GenFlow3.0和WPS身上。
WPS 依托云盘买通了手机、电脑、平板及微信等全端文献,支捏及时上传与调用,构建了"素材存储 - 内容创作"的尺度闭环。
GenFlow3.0则构建了更立体的"四重贵府体系":对外联接百度文库、百度学术的专科学问,对内通过百度网盘同步各端数据;同期还能自动备份你的查资历史和 AI 生成内容,再加上自界说学问库,同样买通了"收、存、用"的完好闭环。
3、淘汰赛厚爱启动!
许多东谈主说 2025 年是 AI 左右的元年,到了年底,AI 左右却已经迈入了下一阶段。
一方面,单一的AI器用正在加快向一站式Agent创作平台演进。另一方面,行业状貌也在重排——大厂正飞快取代创业公司,成为这场竞争的实在主角。
这两大变化互相重复,明晰地勾画出 AI Agent 的下一阶段走向。
在此之前,Agent 靠各别化生计——找到充足微细的赛谈就能驻足;但在这之后,百川汇流,Agent 厚爱插足正面斗争。若是说夙昔是"晋级赛",那咫尺接下来算是插足"淘汰赛"了。
淘汰赛的竞争是全处所的,这种全处所,不仅包含图片、视频、音频、翰墨在内的多模态模子;也包括流量和进口在内的生态协同。这亦然为什么大厂在这场游戏中渐渐占据上风的一个进击原因。
但问题也偶合出咫尺这里,当牌桌上只剩下大厂,全球同样资源浑厚时,实在不错拉开差距的地方,赫然照旧居品。
那么,AI 时期 Agent 的终极形态应该是什么样?我不知谈,但我不错细目的是:Agent的终极方针,毫不是在一套固定过程里替用户完成几项固定任务。
它应该成为一个"伙伴",而不是"器用";它也不应该只服务于具体的处事场景,而是链接你生活与创作经久。
正如李飞飞所说,AI 的最终责任,是成为东谈主类搪塞紧要挑战的给力伙伴,让东谈主类潜能得到更大的开释,创造一个更好意思好的改日。
关联词,这恰是当下许多居品濒临的最大挑战——许多居品依然停留在过程化念念维中,把创作贯通为可预设的措施。但赫然,若是 AI 只是按照过程行事,那它终究又会回到传统 SaaS 的老路,失去应有的创造力与可能性。
因此,改日 Agent 的核心赛点不再取决于单次的"生成惊艳度",而在于它能否实在渗入进复杂的处事现场,并经久驻防下来。
对绝大多数东谈主而言,处事的骨子并非对话框里的谈天,而是对文档、PPT 与表格的反复打磨。若是 AI 留步于一次性托付,无法插足这些深度编著场景,那它终究只然则游离于核心处事流以外。
是以,咱们以为实在的下一代 Agent,必须重构三大智商营救:
当 Agent 具备了这些训导,竞争便越过了模子接口的参数之争,转变为东谈主类职工"经久合营伙伴"的生态位之争。
在办公和创作场景下,实在的中国版" Nano Banana ",不会出生在某个炫技式的 Demo 中天元证券 - 正规股票证券资讯服务平台_天元证券有限公司,而只会出生在——阿谁你每天齐离不开的,多模态创作的"超等职工"身上。
天元证券 - 正规股票证券资讯服务平台_天元证券有限公司提示:本文来自互联网,不代表本网站观点。