V
主页
京东 11.11 红包
微软发布42亿参数多模态小模型Phi-3-vision,并开放所有Phi3系列模型的权重下载
发布人
微软近日在其Build 2024开发者大会上正式对外发布了Phi-3系列AI模型,这一系列包括Phi-3-mini、Phi-3-small和Phi-3-medium三种不同规模的模型。其中,Phi-3-mini已经被集成到Azure AI平台中,此次推出的还包括一款名为Phi-3-vision的多模态小模型,该模型具备42亿参数,主要用于通用视觉推理任务以及图表和图形的解析。
打开封面
下载高清视频
观看高清视频
视频下载器
微软推出小模型Phi-3,量化后可直接再IPhone中运行
苹果发布大语言模型DCLM-7B,不仅开放了代码和权重,连训练流程和数据集也一起开放了
苹果发布全新视觉模型4M-21,单模型可以处理21种模态任务
Stable Diffusion 3 Medium 权重下周三开放下载
微软发布Phi-3.5 最大上下文窗口128K,还包含一个MoE混合专家模型
法国AI实验室Kyutai发布GPT-4o的开源平替音频多模态模型Moshi
【大模型LLM】Meta最新发布的Llama3.2来了!Llama3.2的八点重要信息总结,支持多模态,手机也能用!
免费商用!混元文生图大模型全面开源,不仅包括训练的全部过程和文档,附带的插件还可以使用一张图生成定制的专属的模型
Mistral发布1230 亿参数大语言模型Large2 123B,性能媲美Llama 405B 参数量少三分之二
马斯克 xAI 发布 Grok-2 测试版,包含2个版本模型,性能与行业前沿模型相媲美
马斯克说Grok 2测试版即将在8月发布,并且年底发布Grok 3
马斯克透露,新的大语言模型Grok-2将在8月发布
超越GPT-4o!Allen AI重磅发布Molmo:最强多模态AI模型!碾压Llama 3.2!
4050亿参数版Llama3将是一个多模
北大、北邮和快手开源视频生成模型Pyramid Flow,生成5秒高质量视频只要1分钟,最后附CogVideoX-Fun的简单效果对比
Civitai因版权问题封禁SD3模型,ComfyUI作者已经从Stability 离职,创建新团队专心更新ComfyUI
MOFA-Video:可以为图片中的物体添加运动效果,还可以通过简单的箭头指示来控制物体的运动方向
谷歌图片生成模型Imagen 3现已向全球所有Gemini用户开放,但免费用户不能生成人像
Luma AI 推出革命性AI视频生成模型 Dream Machine,可以生成流畅的电影级效果,对标Sora并且已经公开测试
PPT开源的新高度,阿里发布视频生成框架Tora,只开源了一个markdown首页
阿里开源FunAudioLLM:SenseVoice语言识别和CosyVoic语音克隆均已开源
StabilityAI推出StableAudio2.0音乐生成模型,比Suno还长1分钟
Runway新模型Gen-3 Alpha效果炸裂,创始人要做出比 Sora 更好的文生视频模型的承诺兑现,目前已经接受付费使用申请
9年来,Windows10发布至今有什么变化?
比LoRA快50倍的微调方法,LISA使用一张显卡就可以超越全参调优
毕业论文终于有救了!这绝对是B站最全的【多模态+大模型+知识图谱】教程,轻松搞定大小论文创新点!!人工智能/深度学习/机器学习
LivePortrait:让照片人物表情动起来的开源图生视频模型,不使用SD,10秒钟就能生成人物表情动画
Python 3.13正式版发布:去除全局解释器锁(GIL)和新的交互式解释器(REPL)
Stability AI修改协议Stable Diffusion 3 Medium可以免费商业化应用
Mistral推出最强编程语言模型,22B的规模能大幅领先同类模型,并且支持80多种语言,但是不能商用
【最佳版本】微软官宣 Windows 11 24H2 LTSC 正式发布:纯净精简 无臃肿软件!ISO 镜像免费下载!
AniTalker,一个新的口型说话视频生成框架
Meta发布基于大语言模型的编译器LLM Compiler,不仅可以编译成汇编代码,还可以进行反编译
微软 Office 2024版 正式发布,安装+激活教程来了!(附安装包下载),一键安装word、excel、PPT、visio、project2024正式版永
AI对口型肖像视频生成框架 Hallo,不仅效果好,动作丰富质量高,还是完全开源的
EAGLE: 英伟达推出高分辨率多模态AI模型,新型视觉Token可处理1024像素的大图片
Pixtral 12B: Mistral推出的首款多模态AI模型
Magic Insert:轻松拖放,实现图像间的风格无缝融合
吴恩达《多模态Llama3.2|Introducing Multimodal Llama 3.2》中英字幕(deepseek翻译
WPS 到底有没有抄袭Word - 1985年微软Microsoft Word 1.0 /Apple Macintosh/麦金塔电脑