V
主页
MemGPT:突破llama的4k限制,针对多轮对话、长文档等场景处理表现较好,采用操作系统的内存管理机制,从根上解决大模型context限制的解决方案
发布人
MemGPT:突破llama的4k限制,针对多轮对话、长文档等场景处理表现较好,采用操作系统的内存管理机制,从根上解决大模型context限制的解决方案 github:https://github.com/cpacker/MemGPT
打开封面
下载高清视频
观看高清视频
视频下载器
Streaming-llm:多轮对话的救星来了,无需微调即可帮助大模型能够流畅地处理无限轮对话、无限上下文文本,有效的缓解多轮对话优先的遗忘问题
Tora:微软、清华联合发布最强开源数学大模型,在竞赛数学MATH上准确率首次突破50%,采用工具集成+大模型微调出数学推理语言模型
llm大模型商业落地中的坑有哪些?1、大模型微调、AI Agent、知识库、提示词的场景有哪些?2、成本多大?3、实现难度门槛如何?
bitnet.cpp 推理,速度超越 llama.cpp,内存最高降低 16 倍 | 附 BitNet b1.58 模型安装演示
RAGFlow:采用OCR和深度文档理解结合的新一代 RAG 引擎,具备深度文档理解、引用来源等能力,大大提升知识库RAG的召回率降低幻觉
MPT-30b:最适合企业本地化部署且免费可商用的开源大模型框架,性能超过gpt3、成本性价比最高,代码能力仅次于wizardcoder
Seed-TTS:字节推出接近人类语音水平的通用语音生成模型,生成的语音与人类语音几乎没有区别,在虚拟助手、有声读物、视频配音等场景有巨大潜力
PandasAI:轻松使用自然语言对话数据(CSV、XLSX、PostgreSQL、MySQL、Snowflake 等),大大降低了数据分析工程师门槛
提示词、RAG、微调哪个会让大模型表现更好?1、实践中如何选择微调、rag、提示词工程 2、提示词工程使用方式 3、RAG VS 微调 4、rag评估框架
llama2:基于llama-2和LocalGPT实现100%本地化的知识库,与本地文档安全对话
Chatglm3-6b:清华发布国产大模型原生支持工具函数调用、执行代码、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景的agent能力、多模态能力
OpenAI-o1首次将大模型行业从原先卷参数带到了卷推理时间,o1具备了自我进化能力,是通用人工智能AGI的起点,大大有利于小模型和推理场景
llama3.1-405B:首个接近头部闭源大模型的开源大模型,meta发布千亿参数的大模型,模型原生具备工具使用能力、多语言能力等,在很多测评指标上超越gpt
description-generator:基于Llama 3.2 Vision的电商项目,根据商品图片生成多语言产品描述,为电商产品描述提供了一种AI解决方案
清华Chatglm2-6b:操作本地化部署注意事项,目前最强的开源中英文大模型,相比初代chatglm6b具有更强多轮对话能力、更长的内容处理能力
LangGPT:一句话创建高质量提示词prompt模版,1、人人都可以成为提示词专家,2、结合pezzo解决构建AI Agent提示词模版难及版本管理问题
mem0:个性化记忆层解决多轮会话幻觉问题,持续改进用户的会话体验,高质量的捕捉用户的个人兴趣点或者意图,让个性AI导师、虚拟陪伴、个性化客服等成为了可能
AIOS:新一代LLM Agent操作系统发布,开启大模型的windows时代,为提升agent构建和运行效率提供了基础,未来构建Agent会像构建软件一样容易
groq:支持mistral-8*7b和Llama-70b的API云端调用,全面兼容openai,推理速度如闪电
Llama Tutor:个性化构建AI老师,推理采用最新的llama3.1驱动,垂直AI搜索的教育领域应用案例
Quivr-创建第二大脑调用chatgpt+向量数据库,存储各种文档、视频、网页等非结构化数据,应答各种场景
Fabric:使用人工智能增强人类能力的开源框架,涵盖了51个常用生活工作场景高效辅助,大大地提升工作生活效率,同时可拓展更多的场景定制自己的AICopilot
MaPa:一句文本描述生成3D图像,可DIY编辑3D图像,可广泛用于家修设计、游戏设计、元宇宙等各种3D场景
【包学包会】不需要高配置!6分钟教会你使用Ollama在本机运行部署llama3.1 || 大模型本地部署、LLM、
ProAgent:清华发布实现各种场景WorkFlow自动生成的Agent,首次将Agent和RPA完美结合,连使用Zapier/n8n创建工作流都可让机器干了
Langchain+LLaVA+LLaMA2+GPT4ALL:如何用langchain处理半结构化文档,处理图表、图片内容的嵌入及增强检索,实现多模态检索增强
SWE-agent:将大模型转变为软件工程师Agent,可以修复 GitHub 项目中的错误和问题,SWE-agent解决了12.29%的SWE-bench问题
在摩尔线程原生驱动上进行Llama.cpp的推理(没有使用vulkan)
Knowledge Table:使用AI从非结构化数据提取关键信息结构化,实现从合同、公司年度报告或收益报表中提取关键信息入库结构化,非常有商用场景
GLM-4-Long:智谱AI BigModel开放平台推出100万上下⽂的模型,提升长文本对话能力、RAG召回率等,基于该模型实操构建简单的AI搜索用例
Narrates :采用gpt4-vsion、elevenlabs实现实时直播解说,可适用于任何需要画面解读的实时转播场景,替代实况足球解说员、nba篮球解说员
AppAgent:腾讯发布替代按键精灵的智能体Agent, 彻底将人从手机工作解放出来,自然语言指挥手机完成各种复杂操作,可用于APP测试用例构建,广告方式变现
Code Llama:Meta发布开源AI代码编程大模对标github的copilot,为自动化编程agent提供了新的内芯(附codellama安装使用教程)
Claude 3.5 Sonnet:超越chatgpt-4o成为全球最先进的大语言模型,实测替代程序员、替代研究员,达到研究生水平推理能力、本科的编程和知识能力
llamacoder:基于llama3.1-405b实现的Claude Artifacts,一个描述即可使用AI生成应用程序,支持应用代码生成及预览、图表生成
LangGraph:超越autogen的agent框架,采用graph构建方式实现对工具或函数的多层复杂的精细化的控制,结合langsmith追踪调试生产部署
langchain:帮助企业0门槛利用各种大模型来训练企业私有数据,定制企业专属AI模型和私有chatgpt的三个解决方案 #langchain #企业专属ai
一键本地搭建大模型+知识库,1700多种开源大模型随意部罢!不挑环境、不挑配
AgentSims:定制化评估大语言模型llm任务处理能力的开源沙盒,辅助判断llm是否具备构建特定任务agent的条件?
promptbench:微软发布评估大型语言模型LLMs性能的框架,可评测不同数据集、不同提示词、不同任务等在不同大模型下的表现,可用于llm应用基座选择场景