V
主页
Agent-S:像人一样使用计算机的开源agent框架,通过Agent-Computer接口实现与计算机的自动交互,解决计算机任务自动化中的三个关键挑战
发布人
Agent-S:像人一样使用计算机的开源agent框架,通过Agent-Computer接口实现与计算机的自动交互,解决计算机任务自动化中的三个关键挑战
打开封面
下载高清视频
观看高清视频
视频下载器
Agent-E :自动执行用户计算机操作的智能体Agent,现阶段实现了浏览器web操作自动化,广泛适用于游戏打金、撸毛自动化、网页端测试自动化、电商选品等
MultiON:替代人完成网页所有操作的AI Agent,替代行政秘书、招聘专员等,也为网游打金者、网赚工作室、撸羊毛的人等带去福音,实现ai打金、ai撸羊毛
Zion:5分钟上线企业级AI应用,比coze、dify更强大,首个将AI Agent、前端、后端、数据库完美整合的AI应用构建平台,一键发布为saas或小程序
XAgent:比autogpt更可控、比metagpt更具扩展性的框架,提出一种的外循环规划任务、内循环执行subtask的新机制,实现自主、可控的完美平衡
AppAgent:腾讯发布替代按键精灵的智能体Agent, 彻底将人从手机工作解放出来,自然语言指挥手机完成各种复杂操作,可用于APP测试用例构建,广告方式变现
AgentScope:阿里发布开源可视化构建workflow的agent开源框架,可视化实现多体agent的构建
DB-GPT:基于大模型实现用自然语言与各种数据库交互,解决各种BI数据分析场景、公司业绩分析、知识库管理、agent管理、多模型管理、提示词管理等
OpenAgents:可商用的数据分析agent、插件agent、web agent,实现了数据分析、插件自动调用、网页自动化(自动购物)
Pezzo:prompt提示词领域的github,可实现prompt提示词的设计版本管理、发布、轻松集成到应用及agent
ProAgent:清华发布实现各种场景WorkFlow自动生成的Agent,首次将Agent和RPA完美结合,连使用Zapier/n8n创建工作流都可让机器干了
phidata:国外爆火的Agent-ui框架,基于它可快速构建Muti-Agents,且可将构建的Agents快速在ui界面中测试,从而满足客户poc展示需求
大模型应用选择对比:1、知识库对比:dify、fastgpt;2、agent构建器选择:flowise、langflow、bisheng 3、召回率
AutoGen Studio:微软发布可视化创建agent的新框架,可快速创建企业私有化GPTs市场商店
AgentUniverse:蚂蚁发布多体Agent构建工厂的开源框架,可实现法律咨询Agent、事件解读Agent、行业分析Agent、财报生成Agent等
General-agent:Agent框架挑战及解决方案(general-agent作者李辰)
AgentK:自我进化的 AGI 系统,由多个相互协作的agent组成,这些agent可以根据需求不断创建新的agent和tools,以扩展自身能力并完成指定任
Prompt flow:微软发布可视化Agent的构建工具,可实现agent的工作流sop可视化,从测试、可视化流程、运行到部署一站式实现
OmniParser:微软发布截屏解析器, 可识别任何截屏中的可交互图标,理解屏幕中各个元素的含义,从而可准确地将预期动作与屏幕上的相应区域关联操作
Agents:定制基于SOP+大模型的单体agent、多体agent等,可实现销售agent、研发agent、电商agent等,你也可以快速实现metagpt
OS-Copilot:面向个人电脑的AI Agent 2.0,可自定义电脑各种软件操作、应用内部操作接入大模型,从而实现DIY各种桌面软件的RPA流程
ModelScope-Agent:第一个支持微调的国产agent开源框架且侧重API调用,由阿里魔塔社区开源,继微软的autogen之后第二个重磅agent框架
AgentGPT:从0-1构建、部署、管理智能AI Agents市场,各种agent模版(自助发邮件、品牌分析、市场营销等)一键生成特定任务的agent
【2】agents:5分钟快速实现一个公司业务agent替代销售、研发等,融合销售(研发)sop+多体agent,在界面上即可完成agent的定制
Hyperwriteai:个人浏览器AI助手,比Multon更轻大,解放双手实现所有网页操作的AI自动化,其开源项目可语音操控终端电脑,实现AI自动化操作电脑
【3】Agents:小白也能一句话生成定制agent所需的SOP描述,至此sop+多个智能体+env完全智能化,agent的定制门槛再次砸到地上
DeepSeek-R1-Lite:中国版的o1来了,复制了o1的推理scaling law,其在数学、代码及复杂推理任务上媲美 o1-preview,未来将开源
Recurrent-LLM:交互式式创建小说、剧本、论文、公文等,采用基于段落语言的RNN的方式,突破了大模型本身受制于上下文窗口无法生成长内容的限制
Claude DEV:0门槛使用AI程序员,完全不懂编程的小白也可以体验AI程序员的魔力了,基于claude 3.5实现自动生成代码、调试、运行
Skyvern:基于大模型和浏览器实现网页类工作流自动化,自动完成网页的各种检索、浏览和填写,可实现采购自动化、自媒体平台回复自动化、网页客服自动化等各种工作流
Mobile-Agent:阿里推出的替代移动测试人员的AI Agent,也为各种移动打金工作室、各种流量工作室提供了新神器,比如自动小红书种草、tiktok点赞
提示词、RAG、微调哪个会让大模型表现更好?1、实践中如何选择微调、rag、提示词工程 2、提示词工程使用方式 3、RAG VS 微调 4、rag评估框架
Knowledge Table:使用AI从非结构化数据提取关键信息结构化,实现从合同、公司年度报告或收益报表中提取关键信息入库结构化,非常有商用场景
cline:AI全栈程序员变AI研发团队,现支持Claude Computer Use,可实时预览代码、自动修复代码、自主地浏览网页、自主网页上测试、自主修复
LiveKit Agent+ OpenAI Realtime:AI实时语音GPT-4o开源实现,本运行OpenAi的Realtime API,可实现AI外呼
openV0:替代UI岗位的生成式UI组件工具,v0.dev的开源版,AI创建、迭代前端组件、页面等
OpenBB-LlmAgent:AI金融分析师智能体agent来了,基于openbb和openai实现,可访问openbb的所有数据、调用openbb的命令
MetaGPT:替代初级软件外包公司的AI Agent(chatgpt和软件研发sop),根据老板的需求输出产品文档、架构设计、任务列表、代码的AI助理
LangGPT:一句话创建高质量提示词prompt模版,1、人人都可以成为提示词专家,2、结合pezzo解决构建AI Agent提示词模版难及版本管理问题
Autogen:微软推出专门针对多agent构建复杂代理的llm开发框架,比langchain更简洁方便,5行代码即可构建多agent且可以进行函数调用
AgentVerse:【1个人+大量agent】的未来公司形态成为现实,可快速实现公司所有岗位被AI Agent接管,快速创建基于大模型的多角色AI代理agen