TGI加载香港中文大学开源可商用LLM 推理速度大幅提升 #小工蚁 #phoenix - 视频下载 Video Downloader

京东 11.11 红包

TGI加载香港中文大学开源可商用LLM 推理速度大幅提升 #小工蚁 #phoenix

发布人

TGI加载香港中文大学开源可商用LLM 推理速度大幅提升 #小工蚁 #phoenix

打开封面下载高清视频观看高清视频视频下载器

TGI让Huggingface Transformer推理速度提升10倍，本地演示 #小工蚁 #huggingface

Flash-Decoding长上下文LLM推理速度提8倍 #小工蚁

Huggingface开源新框架Candle让大模型运行在各种设备上 #小工蚁 #huggingface

StreamingLLM算法让推理速度提升22倍，支持400万Token输出

清华智谱开源视觉大模型 CogVLM，可免费商用

用GPTQ算法量化大型模型大幅减少GPU使用并提高准确率

DeepSpeed-FastGen比vLLM推理性能快2倍，SplitFuse策略 #小工蚁

投机采样创新：多头美杜莎让推理速度提升2倍 #小工蚁

多模态Embedding开源模型 Visualized BGE #小工蚁

近期开源VLM大模型介绍 #小工蚁

LLM推理过程中自动缓存KV Cache功能 #小工蚁

传统推荐算法遇强敌：LLM微调后的表现如何？中科大和谷歌为你解答！#小工蚁 #llm #推荐系统

上海人工智能实验室开源LLM书生·浦语，可免费商用

AutoLabel：自动标注，比人快100倍，准确度和人一样！#小工蚁 #大语言模型

如何提高垂直领域RAG准确率？ #小工蚁

多GPU推理加速Qwen-72B开源大模型 #小工蚁

[法线估计] StableNormal：香港中文大学（深圳）、阿里、西湖大学的二阶段法线估计器，有效解决了扩散模型做法线估计'锐利但不稳定'的问题，TOG接收

谷歌开源时间序列大模型直接使用不需要训练 #小工蚁

商汤开源Piccolo2大模型有啥亮点？#小工蚁

如何将LLM输出文本转为结构化数据？ #小工蚁 #langchain

定制ChatGPT应用低代码平台langflow开源可商用 #小工蚁 #chatgpt #langchain #langflow

如何测试大模型推理加速？通义千问和百川2模型测试对比 #小工蚁

开源最强VLM Molmo #小工蚁

使用LangSmith可视化分析Langchain开发LLM应用 #小工蚁

微调开源模型具备Function Call讲解和演示 #小工蚁

OCR-2.0开源小模型实现OCR端到端应用 #小工蚁 #pdf转markdown

小工蚁开源大模型解决方案快速部署，轻松满足定制需求

LLaMA-Omni开源语言对话大模型，超低延时 #小工蚁

Qwen1.5系列6个模型如何选择？ AWQ还是GPTQ？#小工蚁

伯克利大学开源vLLM项目让LLM推理效率提升24倍

开源实时数据流可视化 #小工蚁

LightLLM轻量级高性能推理框架和vLLM哪个更强？

ColossalAI助力大模型加速训练，LLaMA2训练提升195% #小工蚁 #colossalai

IRCoT多次推理检索RAG算法 #小工蚁

Meta开源Llama2代，可免费商用大语言模型。地主又放粮啦！#小工蚁 #llama

从 SAM 到 FastSAM：中科院团队成功实现通用视觉模型速度革命

港大、港中文发编制？港硕含金量再升级！

开源Text Embedding加速推理比HF性能提升3～4倍

中国企业LLM应用场景有哪些？ #小工蚁

PyTorch原生优化Llama2推理加速，性能提升近10倍 #小工蚁