V
主页
京东 11.11 红包
TGI加载香港中文大学开源可商用LLM 推理速度大幅提升 #小工蚁 #phoenix
发布人
TGI加载香港中文大学开源可商用LLM 推理速度大幅提升 #小工蚁 #phoenix
打开封面
下载高清视频
观看高清视频
视频下载器
TGI让Huggingface Transformer推理速度提升10倍,本地演示 #小工蚁 #huggingface
Flash-Decoding长上下文LLM推理速度提8倍 #小工蚁
Huggingface开源新框架Candle让大模型运行在各种设备上 #小工蚁 #huggingface
StreamingLLM算法让推理速度 提升22倍,支持400万Token输出
清华智谱开源视觉大模型 CogVLM,可免费商用
用GPTQ算法量化大型模型 大幅减少GPU使用并提高准确率
DeepSpeed-FastGen比vLLM推理性能快2倍,SplitFuse策略 #小工蚁
投机采样创新:多头美杜莎让推理速度提升2倍 #小工蚁
多模态Embedding开源模型 Visualized BGE #小工蚁
近期开源VLM大模型介绍 #小工蚁
LLM推理过程中自动缓存KV Cache功能 #小工蚁
传统推荐算法遇强敌:LLM微调后的表现如何?中科大和谷歌为你解答!#小工蚁 #llm #推荐系统
上海人工智能实验室开源LLM书生·浦语,可免费商用
AutoLabel:自动标注,比人快100倍,准确度和人一样!#小工蚁 #大语言模型
如何提高垂直领域RAG准确率? #小工蚁
多GPU推理加速Qwen-72B开源大模型 #小工蚁
[法线估计] StableNormal:香港中文大学(深圳)、阿里、西湖大学的二阶段法线估计器,有效解决了扩散模型做法线估计'锐利但不稳定'的问题,TOG接收
谷歌开源时间序列大模型 直接使用不需要训练 #小工蚁
商汤开源Piccolo2大模型有啥亮点?#小工蚁
如何将LLM输出文本转为结构化数据? #小工蚁 #langchain
定制ChatGPT应用低代码平台langflow开源可商用 #小工蚁 #chatgpt #langchain #langflow
如何测试大模型推理加速?通义千问和百川2模型测试对比 #小工蚁
开源最强VLM Molmo #小工蚁
使用LangSmith可视化分析Langchain开发LLM应用 #小工蚁
微调开源模型具备Function Call讲解和演示 #小工蚁
OCR-2.0开源小模型实现OCR端到端应用 #小工蚁 #pdf转markdown
小工蚁开源大模型解决方案 快速部署,轻松满足定制需求
LLaMA-Omni开源语言对话大模型,超低延时 #小工蚁
Qwen1.5系列6个模型如何选择? AWQ还是GPTQ?#小工蚁
伯克利大学开源vLLM项目 让LLM推理效率提升24倍
开源实时数据流可视化 #小工蚁
LightLLM轻量级高性能推理框架 和vLLM哪个更强?
ColossalAI助力大模型加速训练,LLaMA2训练提升195% #小工蚁 #colossalai
IRCoT多次推理检索RAG算法 #小工蚁
Meta开源Llama2代,可免费商用大语言模型。地主又放粮啦!#小工蚁 #llama
从 SAM 到 FastSAM:中科院团队成功实现通用视觉模型速度革命
港大、港中文发编制?港硕含金量再升级!
开源Text Embedding加速推理 比HF性能提升3~4倍
中国企业LLM应用场景有哪些? #小工蚁
PyTorch原生优化Llama2推理加速,性能提升近10倍 #小工蚁