新Agent玩起了“无限流”
Manus的“上帝之手”称号近日被一个新的AI智能体——Flowith旗下的Neo夺走了。这款智能体背后的团队不仅异常年轻,还在社交媒体上宣称在0营销投入的情况下,实现了130万美元的ARR收入。
在GAIA智能体评测标准的三个等级中,Neo不仅超越了Manus,还创下了新的评分记录。其中Level1和Level3更是突破了“整数级”评分。
目前的智能体市场可谓是“大风起兮云飞扬”,新玩家不断涌入这一赛道。从传统互联网巨头到专注产品研发的初创团队皆有涉足。
各类产品纷纷打着“AI智能体”的旗号,但正如一些网友所说:许多所谓的智能体,不过是在Manus的框架上又叠加了一层LLM而已,万物皆可套壳。
今天,让我们深入分析下这款标榜自己是“下一代AI生成力”的产品,看看它是否是“穿新鞋,走老路”。
01
Flowith Neo:无限步骤、无限上下文、无限工具
在Flowith产品官网中,如果点开输入框右上角的Agent Mode,则自动启用 Agent Neo,在此模式下,Neo可以智能调控各种大模型,完成长序列的复杂任务。
在非智能体模式下,Flowith则提供了诸如常规模式、联网搜索、图片/视频生成等“垂类功能模式”。每一个模式里,都集成了数量非常多的市场主流LLM。
Flowith将它们能够提供的所有存货几乎都摆了出来,并分成T1/T2两个阵营,我稍微数了下,一共近30个模型。
它们集成了市场上几乎所有主流的大模型,涵盖了几乎所有模态,例如Claude 3.7 Sonnet、Grok3、GPT Image1、Gemini 2.5 Pro preview、o3、o4 mini、DALL・E 3、Flux、Recraft和Kling等。
相对于Flowith的上一代智能体Oracle,Neo最大的提升在于它将任务搬到了云端执行,智能体嵌套、上下文、工作步骤都得到了大幅的性能和稳定性提升。
这款新晋智能体产品主要有三个亮点:无限步骤、无限上下文和无限工具。
我们通过一系列测试来逐一展示这些特点。
(1)无限步骤
Neo由于将任务的执行搬到了云端,现在的它几乎可以在任务中一直工作,即便用户关闭了网页,它对于用户本身网络环境的依赖已经不再是必需的了。
一个最明显的样本是:它可以帮你订阅几乎大量平台的关键KOL或者是新闻媒体,并调用推理和相关模型撰写报告,发送到你的邮箱。并且用户可以规定发送的频率,Neo几乎会无限制地在云端跑流程,不断地重复工作步骤。
如果想要Neo完成此类任务,可以直接输入一段非常简单的Prompt:
请你帮我找到10家最主流AI新闻媒体,并将它们最新更新的消息做成简报,每两小时更新一次,发送到我的邮箱。
Neo 会以非常快的速度处理用户的Prompt,它此时的第一步就是在工作流程中与用户交互,确认我的电子邮件地址。
Neo制定了一个非常详细的流程图,明确每个步骤的任务,为自己做出了一个清晰的整体视图。
Neo按步骤执行工作,收集所需知识和信息。信息来源十分广泛,并且会不断地检查信息内容是否与用户需求相一致。
以下就是Neo所找到的10家AI新闻信息源:
Neo会从先前确定的10家AI新闻媒体的官方网站分别获取各自最新的3-5篇AI相关新闻报道的详细内容,并使用browser从每个网站上独立抓取信息。
Neo会多线程同时处理10家媒体的信息抓取任务,并将所有信息整合做出一份简报:
第一份结构化的AI行业最新简报顺利地发到了我的邮箱,内容几乎占用了12页的Word文档。
后续,我的邮箱中陆续收到了几份来自Flowith在云端执行定时任务的稿件。
(2)无限上下文
从实际体验来看,Neo 的上下文非常之长,常常能达到数万甚至数十万字的地步。
这种超长的上下文能力使得Neo能够记住之前的对话内容,保持上下文连贯性,避免了频繁重复之前的叙述或信息,从而提升了交互的效率和质量。
在实际应用中,这意味着我们可以与Neo进行长时间、多轮次的深入对话,而无需担心它会“忘记”之前的讨论内容。
比如,我试着让它做了一个全球文科倒闭潮的可视化报道切片,提示词比较简略:
收集2024年至今中国大陆、新加坡、英国、美国、韩国、日本所有大学裁撤文科的情况,并在一张世界地图上进行可视化呈现。
拿到提示词后,Neo 会先在左侧的 workflow 面板里自行规划出一整套清晰的工作流程,然后按步骤一项项执行任务。
考虑到最终生成的内容可能过多导致混乱,它贴心地设置了一个 Files 面板,将所有生成的文件整理归类,便于随时查阅。
不到十分钟,它就收集好了九个地区的数据,并自动整合成了一篇结构完整的报道。内容不仅详实、分析有理,而且自带思辨性,与用户的意图进行了对齐。
Neo设计的交互界面几乎是一步到位,呈现效果也非常流畅自然。
“无限上下文”的Neo究竟能产生多少个文档?这是一个无法给出确切数字的问题。
在这一项任务中,它就累计了如此多的信息内容:
(3)无限工具
Neo的操作流程兼容多种外部工具,并整合了Flowith自推出以来就广受好评的知识花园功能。知识花园其实就是我们一般所说的“知识库”,但Flowith会在你上传知识内容后,以“Seed”作为最小单元识别其中的知识。
为了增强Neo的检索能力,我会外挂知识花园中与AI相关的知识库,以增强Neo的检索能力,其中包含与人工智能相关的丰富信息。
然后输入Prompt:
帮我找到 20 个非常专业的 AI 科技 X(原 Twitter)博主,做成网页。
然后,我又让AI模型自动丰富这些提示词,规定好了颜色显示等等条件。
Neo开始调用外挂工具,进行大量的相关信息搜索:
在Neo实际的工作步骤中,Flowith将所有工作流搬到了“无限画布”中,很直观地显示出了一个“纺锤形”的思考样态。
在进行HTML网页任务的前期,Neo会先进行知识积攒,这也是为何思维流程中体现出“两边细,中间宽”的形态。
经过三个版本的迭代,Neo成功制作了一个HTML网页项目。
在这个网页中,它将奥特曼、杨立坤、吴恩达等一众X上的AI科学家和博主汇集在一起,为每个人贴上了标签,并实现了交互功能。每个名字下方还附有该博主在X上的链接,用户可以一键直接访问。
可以看得出来,Neo非常适合这类“需要调用多种工具并且高度复杂的任务”,它对于大模型的调控和整体流程的把控都非常的严谨。
比如,Neo与其他AI智能体最大的一个区别就是:它会在工作流程中大量地嵌入审查机制,比如在每一个结果产出之前和之后都会进行自我反思。即便在所有项目结束后,也会给出好几份审查报告、项目总结报告等等。
在每一个节点之中,Flowith都允许使用者进行单一节点的微调工具。
在文档文件中,Flowith则允许用户使用文本编辑器,实时手动更改文件内容甚至是代码。无论是在编写程序代码还是修改文档内容方面,Flowith都提供了一个直观且友好的操作界面。
这样将用户也视作参与者的操作,虽然有放权嫌疑,但也能够让后续的效果更好。
Neo能将整个创作流程以可视化流程图的方式展示出来,我可以对其中任意节点“点选修改”“局部重启”,真正实现模块化调用“无限工具”创作的自由调度。
这可能是 Neo 区别于传统 Agent 的关键能力:不是“从头再来”,而是“就地优化”。
02
Flowith,一家在OpenAI o1发布之前就早已深耕Agent赛道的选手
Flowith最初在全网崭露头角的名称还只是“画布式AI创作平台”,但却一直在探索智能体方向,第一代产品Oracle于2024年8月就已发布,甚至早于OpenAI的推理模型o1的发布。这款产品在各个社区都有一定的热度。当时的Flowith凭借Oracle甚至被誉为“让Chatbot式AI成为历史的下一代工具”。
这家初创企业背后的团队也异常年轻,Flowith由倪正民(Derek Nee)团队于2024年正式推出。这位96后CEO在20岁前就曾创立X Academy、项目超过千万人民币ARR的Realm项目,都曾风动一时。据“观察者网”心智观察,Flowith的全体团队都是95后,市场负责人郭梓溢本人则是00后。这家团队在架构体系中几乎将任务导向做到了新高度:每周团队可能会有100个任务,而每个人只需摘取自己最适合的任务。他们在团队构建中抛弃了传统的任务分配机制,转而采用鼓励极致创新的开放式思路。
在这样的团队中孕育出来的Oracle显然也带有创新基因,这款产品最大的特色在于交互范式的创新。它没有沿用传统聊天框+黑箱执行的模式,而是开创性地引入了画布多线程交互理念。Flowith 没有自己训练大模型,而是专注于上层架构和交互创新:通过可视化工作流编排,把LLM的推理能力、搜索工具、插件能力组合起来。
这一理念的背后,其实代表了两种AI使用观念的差异:Manus 等追求的是AI完全自主行动,用户给出指令后AI自主完成一切;而 Flowith 则强调“用户”角色,等同于坦诚了一个事实:现在还不存在通用AI智能体,但是有了用户的参与,Flowith能够表现地更好。
比如,在上面的操作演示中,我们可以清楚地看到Flowith为用户提供了微调和干预流程的能力,确保 AI 输出更精准地满足特定需求。例如,用户可以在 Flowith 画布的特定节点添加自定义数据源,使最终报告的关键信息往往能超越 Manus。
03
与大厂截然不同的思路
百度Q1财报的公众号文章中就把AI智能体放在了很重要的位置,不断地强化自家平台已经接入“几千+MCP组件”,在未来更是会将通用AI智能体的任务类型扩展数十万的水平。然而,Flowith 却走了条不同的路:研发了个“模拟人类大脑思维流程”的AI智能体工作流。
这或许仅是一种噱头,实际上更多地取决于使用者的个人偏好,这也反映了当前智能体市场所呈现的世界参差感:热爱者视之为真爱,可能是通向AGI的必由之路,而不喜欢者则觉得这玩意就是个噱头。
不过,不得不说的是Flowith仍然使用行业主流的LLM,在智能能力上没有显著突破。它的优势在于速度更快、操作更流畅以及更强的反思能力。尽管如此,Flowith还是成功地将智能体产品投入市场,因此建立了独特的竞争优势。
Flowith 所塑造的竞争壁垒主要在于用户社区和创新速度。前一代Oracle自发布以来,到今年Neo推出之前,一直在小众社区中保持了一定的热度,但也受到不少批评,比如多线程工作容易卡死、非云端导致用户过于依赖网络环境。
不过,Neo的上线很大程度上解决了这些问题。
Flowith的另一个潜在壁垒是团队一直想要构造的“社区”。各网络平台上其实一直都有这么一句笑言:少玩产品,多搞社区。像是Flowith很早就搞了个“知识花园”功能模块,每个人跑完自己的工作流程还可以继续分享Recipe到社区里。这就会形成独特的知识共享网络,这会吸引新用户的加入。
总的来说,Manus、Lovart、字节的扣子空间、百度的心响,以及一些将AI智能体应用于自家搜索产品的公司,构成了整个智能体赛道。
但目前来看,与行业热度一起到来的还有些许乱象。
从Manus 在 GAIA 上的综合成功率显著超过了 OpenAI 的 DeepResearch 等系统,刷新了该基准的SOTA性能记录开始,几乎所有大厂全部下场搞智能体。然而,没过多久,这些产品的宣传重点从智能体的能力转向了产品本身的能力,接着又开始宣传MCP工具的接入。
整个行业好像已经从AI能力优先,转化为生态优先。先将产品做出来,抢夺完用户,再煮酒论英雄。像Flowith这样的智能体在整体工作流程中几乎将自己的“肠子”都挖出来,向各位看官证明一下自己吃了几碗粉,仿佛成了一股清流。
前OpenAI 副总裁 Lilian Weng 曾在博文中将智能体的标配总结为:Agent = LLM + Memory + Planning + Tool Use。
而在预训练大模型幻觉率仍居高不下的当今,我们将会看到这样一个局面:再靠纯LLM能力突围已经不再现实,从基础模型上挖掘不到更多的宝藏。各家厂商都在产品侧,以产品经理的思维寻找突破口。
(来源:新浪科技)