新Agent玩起了“无限流”

2025年05月24日,12时33分19秒科技新知阅读 8 views 次

新Agent玩起了“无限流”

Manus的“上帝之手”称号近日被一个新的AI智能体——Flowith旗下的Neo夺走了。这款智能体背后的团队不仅异常年轻，还在社交媒体上宣称在0营销投入的情况下，实现了130万美元的ARR收入。

在GAIA智能体评测标准的三个等级中，Neo不仅超越了Manus，还创下了新的评分记录。其中Level1和Level3更是突破了“整数级”评分。

新Agent玩起了“无限流”

目前的智能体市场可谓是“大风起兮云飞扬”，新玩家不断涌入这一赛道。从传统互联网巨头到专注产品研发的初创团队皆有涉足。

各类产品纷纷打着“AI智能体”的旗号，但正如一些网友所说：许多所谓的智能体，不过是在Manus的框架上又叠加了一层LLM而已，万物皆可套壳。

今天，让我们深入分析下这款标榜自己是“下一代AI生成力”的产品，看看它是否是“穿新鞋，走老路”。

Flowith Neo：无限步骤、无限上下文、无限工具

在Flowith产品官网中，如果点开输入框右上角的Agent Mode，则自动启用 Agent Neo，在此模式下，Neo可以智能调控各种大模型，完成长序列的复杂任务。

新Agent玩起了“无限流”

在非智能体模式下，Flowith则提供了诸如常规模式、联网搜索、图片/视频生成等“垂类功能模式”。每一个模式里，都集成了数量非常多的市场主流LLM。

新Agent玩起了“无限流”

Flowith将它们能够提供的所有存货几乎都摆了出来，并分成T1/T2两个阵营，我稍微数了下，一共近30个模型。

它们集成了市场上几乎所有主流的大模型，涵盖了几乎所有模态，例如Claude 3.7 Sonnet、Grok3、GPT Image1、Gemini 2.5 Pro preview、o3、o4 mini、DALL・E 3、Flux、Recraft和Kling等。

新Agent玩起了“无限流”

相对于Flowith的上一代智能体Oracle，Neo最大的提升在于它将任务搬到了云端执行，智能体嵌套、上下文、工作步骤都得到了大幅的性能和稳定性提升。

新Agent玩起了“无限流”

这款新晋智能体产品主要有三个亮点：无限步骤、无限上下文和无限工具。

我们通过一系列测试来逐一展示这些特点。

（1）无限步骤

Neo由于将任务的执行搬到了云端，现在的它几乎可以在任务中一直工作，即便用户关闭了网页，它对于用户本身网络环境的依赖已经不再是必需的了。

一个最明显的样本是：它可以帮你订阅几乎大量平台的关键KOL或者是新闻媒体，并调用推理和相关模型撰写报告，发送到你的邮箱。并且用户可以规定发送的频率，Neo几乎会无限制地在云端跑流程，不断地重复工作步骤。

如果想要Neo完成此类任务，可以直接输入一段非常简单的Prompt：

请你帮我找到10家最主流AI新闻媒体，并将它们最新更新的消息做成简报，每两小时更新一次，发送到我的邮箱。

新Agent玩起了“无限流”

Neo 会以非常快的速度处理用户的Prompt，它此时的第一步就是在工作流程中与用户交互，确认我的电子邮件地址。

新Agent玩起了“无限流”

Neo制定了一个非常详细的流程图，明确每个步骤的任务，为自己做出了一个清晰的整体视图。

新Agent玩起了“无限流”

Neo按步骤执行工作，收集所需知识和信息。信息来源十分广泛，并且会不断地检查信息内容是否与用户需求相一致。

新Agent玩起了“无限流”

以下就是Neo所找到的10家AI新闻信息源：

新Agent玩起了“无限流”

Neo会从先前确定的10家AI新闻媒体的官方网站分别获取各自最新的3-5篇AI相关新闻报道的详细内容，并使用browser从每个网站上独立抓取信息。

新Agent玩起了“无限流”

Neo会多线程同时处理10家媒体的信息抓取任务，并将所有信息整合做出一份简报：

新Agent玩起了“无限流”

第一份结构化的AI行业最新简报顺利地发到了我的邮箱，内容几乎占用了12页的Word文档。

新Agent玩起了“无限流”

后续，我的邮箱中陆续收到了几份来自Flowith在云端执行定时任务的稿件。

新Agent玩起了“无限流”

（2）无限上下文

从实际体验来看，Neo 的上下文非常之长，常常能达到数万甚至数十万字的地步。

这种超长的上下文能力使得Neo能够记住之前的对话内容，保持上下文连贯性，避免了频繁重复之前的叙述或信息，从而提升了交互的效率和质量。

在实际应用中，这意味着我们可以与Neo进行长时间、多轮次的深入对话，而无需担心它会“忘记”之前的讨论内容。

比如，我试着让它做了一个全球文科倒闭潮的可视化报道切片，提示词比较简略：

收集2024年至今中国大陆、新加坡、英国、美国、韩国、日本所有大学裁撤文科的情况，并在一张世界地图上进行可视化呈现。

拿到提示词后，Neo 会先在左侧的 workflow 面板里自行规划出一整套清晰的工作流程，然后按步骤一项项执行任务。

考虑到最终生成的内容可能过多导致混乱，它贴心地设置了一个 Files 面板，将所有生成的文件整理归类，便于随时查阅。

新Agent玩起了“无限流”

不到十分钟，它就收集好了九个地区的数据，并自动整合成了一篇结构完整的报道。内容不仅详实、分析有理，而且自带思辨性，与用户的意图进行了对齐。

新Agent玩起了“无限流”

Neo设计的交互界面几乎是一步到位，呈现效果也非常流畅自然。

“无限上下文”的Neo究竟能产生多少个文档？这是一个无法给出确切数字的问题。

在这一项任务中，它就累计了如此多的信息内容：

新Agent玩起了“无限流”

（3）无限工具

Neo的操作流程兼容多种外部工具，并整合了Flowith自推出以来就广受好评的知识花园功能。知识花园其实就是我们一般所说的“知识库”，但Flowith会在你上传知识内容后，以“Seed”作为最小单元识别其中的知识。

为了增强Neo的检索能力，我会外挂知识花园中与AI相关的知识库，以增强Neo的检索能力，其中包含与人工智能相关的丰富信息。

然后输入Prompt：

帮我找到 20 个非常专业的 AI 科技 X（原 Twitter）博主，做成网页。

然后，我又让AI模型自动丰富这些提示词，规定好了颜色显示等等条件。

Neo开始调用外挂工具，进行大量的相关信息搜索：

新Agent玩起了“无限流”

在Neo实际的工作步骤中，Flowith将所有工作流搬到了“无限画布”中，很直观地显示出了一个“纺锤形”的思考样态。

在进行HTML网页任务的前期，Neo会先进行知识积攒，这也是为何思维流程中体现出“两边细，中间宽”的形态。

新Agent玩起了“无限流”

经过三个版本的迭代，Neo成功制作了一个HTML网页项目。

在这个网页中，它将奥特曼、杨立坤、吴恩达等一众X上的AI科学家和博主汇集在一起，为每个人贴上了标签，并实现了交互功能。每个名字下方还附有该博主在X上的链接，用户可以一键直接访问。

可以看得出来，Neo非常适合这类“需要调用多种工具并且高度复杂的任务”，它对于大模型的调控和整体流程的把控都非常的严谨。

比如，Neo与其他AI智能体最大的一个区别就是：它会在工作流程中大量地嵌入审查机制，比如在每一个结果产出之前和之后都会进行自我反思。即便在所有项目结束后，也会给出好几份审查报告、项目总结报告等等。

新Agent玩起了“无限流”

在每一个节点之中，Flowith都允许使用者进行单一节点的微调工具。

新Agent玩起了“无限流”

在文档文件中，Flowith则允许用户使用文本编辑器，实时手动更改文件内容甚至是代码。无论是在编写程序代码还是修改文档内容方面，Flowith都提供了一个直观且友好的操作界面。

这样将用户也视作参与者的操作，虽然有放权嫌疑，但也能够让后续的效果更好。

Neo能将整个创作流程以可视化流程图的方式展示出来，我可以对其中任意节点“点选修改”“局部重启”，真正实现模块化调用“无限工具”创作的自由调度。

这可能是 Neo 区别于传统 Agent 的关键能力：不是“从头再来”，而是“就地优化”。

Flowith，一家在OpenAI o1发布之前就早已深耕Agent赛道的选手

Flowith最初在全网崭露头角的名称还只是“画布式AI创作平台”，但却一直在探索智能体方向，第一代产品Oracle于2024年8月就已发布，甚至早于OpenAI的推理模型o1的发布。这款产品在各个社区都有一定的热度。当时的Flowith凭借Oracle甚至被誉为“让Chatbot式AI成为历史的下一代工具”。

这家初创企业背后的团队也异常年轻，Flowith由倪正民（Derek Nee）团队于2024年正式推出。这位96后CEO在20岁前就曾创立X Academy、项目超过千万人民币ARR的Realm项目，都曾风动一时。据“观察者网”心智观察，Flowith的全体团队都是95后，市场负责人郭梓溢本人则是00后。这家团队在架构体系中几乎将任务导向做到了新高度：每周团队可能会有100个任务，而每个人只需摘取自己最适合的任务。他们在团队构建中抛弃了传统的任务分配机制，转而采用鼓励极致创新的开放式思路。

在这样的团队中孕育出来的Oracle显然也带有创新基因，这款产品最大的特色在于交互范式的创新。它没有沿用传统聊天框+黑箱执行的模式，而是开创性地引入了画布多线程交互理念。Flowith 没有自己训练大模型，而是专注于上层架构和交互创新：通过可视化工作流编排，把LLM的推理能力、搜索工具、插件能力组合起来。

这一理念的背后，其实代表了两种AI使用观念的差异：Manus 等追求的是AI完全自主行动，用户给出指令后AI自主完成一切；而 Flowith 则强调“用户”角色，等同于坦诚了一个事实：现在还不存在通用AI智能体，但是有了用户的参与，Flowith能够表现地更好。

比如，在上面的操作演示中，我们可以清楚地看到Flowith为用户提供了微调和干预流程的能力，确保 AI 输出更精准地满足特定需求。例如，用户可以在 Flowith 画布的特定节点添加自定义数据源，使最终报告的关键信息往往能超越 Manus。

与大厂截然不同的思路

百度Q1财报的公众号文章中就把AI智能体放在了很重要的位置，不断地强化自家平台已经接入“几千+MCP组件”，在未来更是会将通用AI智能体的任务类型扩展数十万的水平。然而，Flowith 却走了条不同的路：研发了个“模拟人类大脑思维流程”的AI智能体工作流。

这或许仅是一种噱头，实际上更多地取决于使用者的个人偏好，这也反映了当前智能体市场所呈现的世界参差感：热爱者视之为真爱，可能是通向AGI的必由之路，而不喜欢者则觉得这玩意就是个噱头。

不过，不得不说的是Flowith仍然使用行业主流的LLM，在智能能力上没有显著突破。它的优势在于速度更快、操作更流畅以及更强的反思能力。尽管如此，Flowith还是成功地将智能体产品投入市场，因此建立了独特的竞争优势。

Flowith 所塑造的竞争壁垒主要在于用户社区和创新速度。前一代Oracle自发布以来，到今年Neo推出之前，一直在小众社区中保持了一定的热度，但也受到不少批评，比如多线程工作容易卡死、非云端导致用户过于依赖网络环境。

不过，Neo的上线很大程度上解决了这些问题。

Flowith的另一个潜在壁垒是团队一直想要构造的“社区”。各网络平台上其实一直都有这么一句笑言：少玩产品，多搞社区。像是Flowith很早就搞了个“知识花园”功能模块，每个人跑完自己的工作流程还可以继续分享Recipe到社区里。这就会形成独特的知识共享网络，这会吸引新用户的加入。

总的来说，Manus、Lovart、字节的扣子空间、百度的心响，以及一些将AI智能体应用于自家搜索产品的公司，构成了整个智能体赛道。

但目前来看，与行业热度一起到来的还有些许乱象。

从Manus 在 GAIA 上的综合成功率显著超过了 OpenAI 的 DeepResearch 等系统，刷新了该基准的SOTA性能记录开始，几乎所有大厂全部下场搞智能体。然而，没过多久，这些产品的宣传重点从智能体的能力转向了产品本身的能力，接着又开始宣传MCP工具的接入。

整个行业好像已经从AI能力优先，转化为生态优先。先将产品做出来，抢夺完用户，再煮酒论英雄。像Flowith这样的智能体在整体工作流程中几乎将自己的“肠子”都挖出来，向各位看官证明一下自己吃了几碗粉，仿佛成了一股清流。

前OpenAI 副总裁 Lilian Weng 曾在博文中将智能体的标配总结为:Agent = LLM + Memory + Planning + Tool Use。

而在预训练大模型幻觉率仍居高不下的当今，我们将会看到这样一个局面：再靠纯LLM能力突围已经不再现实，从基础模型上挖掘不到更多的宝藏。各家厂商都在产品侧，以产品经理的思维寻找突破口。

(来源：新浪科技)

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

关联资讯:

用户登录