V
主页
开源Text to Speech Streaming接口实现 #小工蚁 #xtts
发布人
开源Text to Speech Streaming接口实现 #小工蚁 #xtts
打开封面
下载高清视频
观看高清视频
视频下载器
【免费TTS】MultiTTS 安卓APP(Win电脑部署),可以提供API接口、用于听书等服务,提供在线搜集的语音包
AutoLabel:自动标注,比人快100倍,准确度和人一样!#小工蚁 #大语言模型
【AI音色克隆】阿里巴巴CosyVoice V3.0最新整合包,一键克隆音色,解压即用,无需配置环境!| CosyVoice | 音色克隆 | AI | 整合包
如何提高垂直领域RAG准确率? #小工蚁
xTTS开源文字转声音模型,支持16种语言,支持声音克隆
自适应RAG算法和实现
阿里发布Text2SQL最新实践开源模型准确度超GPT4
OCR-2.0开源小模型实现OCR端到端应用 #小工蚁 #pdf转markdown
M3E中文文本嵌入模型:替代OpenAI text-embedding-ada-002的最佳选择
DeepSpeed-FastGen比vLLM推理性能快2倍,SplitFuse策略 #小工蚁
LangGraph Autogen CrewAI 哪个Agent框架更好?#小工蚁
LightRAG一种简单高效的RAG新方法 #小工蚁
仿人脑海马体HippoRAG智能问答准确度提升 20% #小工蚁
使用LangChain实现Tool Calling #小工蚁
几百次大模型LoRA和QLoRA 微调实践的经验分享
RAGChecker开源RAG诊断框架
如何将LLM输出文本转为结构化数据? #小工蚁 #langchain
清华智谱开源视觉大模型 CogVLM,可免费商用
MaskGCT:支持多国语言生成、效果非常不错的TTS,其在生成的语音质量、克隆相似度、清晰度等方面优于当前最先进的 TTS,人人都可克隆多国语言
清华发布SmartMoE一种高效训练专家模型网络算法 #小工蚁 #清华 #MoE
PDF转Markdown 6个开源项目如何选择? #小工蚁
HippoRAG中仿人脑海马体PPR算法实现 #小工蚁
大模型微调训练实践 准确度10%提升至90%
Text2SQL Llama 7B模型微调DuckDB-NSQL-7B #小工蚁
抱抱脸开源SmolLM2 小模型运行在各种终端设备上
Fish Speech开源TTS支持中英日3种语言 #小工蚁
如何创建RAG应用更加智能? Self-RAG代码实现 #小工蚁
多模态RAG检索增强生成2种实现方式 #小工蚁
firecrawl基于LLM开源爬虫项目 #小工蚁
Qwen2.5-Coder写代码大模型技术报告解读 #小工蚁
TTS Server朗读接口失效解决
谷歌开源时间序列大模型 直接使用不需要训练 #小工蚁
多GPU推理加速Qwen-72B开源大模型 #小工蚁
Huggingface开源新框架Candle让大模型运行在各种设备上 #小工蚁 #huggingface
抱抱脸开源小模型SmolLM和训练数据集 #小工蚁
构建多模态RAG应用实践 #小工蚁
开源AI生成声音和音乐大模型AudioLDM2 #小工蚁
Vanna开源Text to SQL项目
RAFT:微调你的LLM使其在垂直领域的RAG中表现更好 #小工蚁
谷歌发现RAG缩放定律 释放LLM长上下文潜力 提升RAG准确率 #小工蚁