V
主页
全球首个基于大语言模型的自动驾驶语言控制模型(CAVG),今我以语驭风车!
发布人
得益于大型语言模型(LLMs)的快速发展,与自动驾驶汽车进行语言交流已经变得可行,来自澳门大学智慧城市物联网国家重点实验室须成忠教授、李振宁助理教授团队联合重庆大学,吉林大学科研团队提出了首个基于大语言模型的自动驾驶自然语言控制模型(CAVG)。该研究使用了大语言模型(GPT-4)作为乘客的语意情感分析,捕捉自然语言命令中的细腻情感内容,同时结合跨模态注意力机制,让自动驾驶车辆识别乘客的语意目的,进而定位到对应的交通道路区域,改变了传统乘客和自动驾驶汽车交互的方式。
打开封面
下载高清视频
观看高清视频
视频下载器
【Grok-Beta 】马斯克为庆祝特朗普当选 宣布【几乎免费的大语言模型API】每月赠送25美金算力金 适用于最新发布的大语言模型Grok-Beta 快来注册
免费无限使用大语言模型,国内主流AI智能助手汇总
一款比Whisper更快的模型 | 基于Java实现的实时一句话语音识别 | 实时语音识别 | 超低延迟实时语音识别
比亚迪秦体验开源 openpilot 辅助驾驶
AlphaFold 3 模型架构
Tesla FSD V13前瞻!
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
mixly图形化单片机编程 89 基于天问block制作一个语音识别项目
ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP
Groq支持的自动检测语音输入AI对话应用,中文对话效率翻倍 | Whisper+LLM +VAD
CVPR 2024 | LiDAR Diffusion 首个可以根据多模态条件生成逼真 的激光雷达场景方法,加速107倍
NeurIPS'24预讲会|大语言模型12篇工作:多智能体协作、端到端信息检索、高效微调架构、不确定性感知规划等
ICRA 2024|Lightning NeRF:速度提升10倍!为自动驾驶场景而生
美团 | FocusBEV:自标定与时间融合策略提升单目BEV分割性能
端到端,技术战还是口水仗?
XNGP真实智驾周记 | 迄今最强版本5.4.0
重新定义自动驾驶的动态视觉?谷歌提出几何优先的动态场景方法MonST3R
真的超容易“搞深度学习神经网络到底怎么改代码的啊?”复旦博士教我用一本书搞定!
【双语】特斯拉FSD V13,为迈向无监督自动驾驶做准备
👋Arc浏览器的告别与新起点丨终章丨完结丨新产品ing
ECCV'24 | 无图定位新突破!从低精地图到使用全景-BEV联合检索网络进行跨视图图像地理定位。
【开源】48集 语音识别语音唤醒程序讲解 #ESP32 #嵌入式开发 #编程
#1024程序员节 【开源】esp32的ai语音唤醒和语音识别 #开源 #ESP32
LLM智能应用开发 L9:大语言模型解析 VI 数据集处理, 微调 [2024南京大学计算机学院选修课]
Agent+RAG大模型落地应用实践经验分享(超级干货)
通义千问没理我,之后我们的聊天记录消失了
记一次给研究生训练实时语音识别大模型的经历
STM32智能语音台灯
30公里5次接管,华为智驾ADS 3.1什么水平?
练完这些项目,天下没有再难倒你的大模型!
【墙裂推荐】25分钟搞定qwen大模型本地部署+微调法律大模型(只需5G内存)
【虚幻引擎】AI数字人选择发音人+ 情感风格 +流式语音合成 + 语音标点停顿
浙大、上海人工智能实验室等即将开源PGSR: 平面3DGS提升表面几何,超越 2DGS、GOF,实现渲染新高度
你敢信,自动驾驶最大的隐患不是路况,而是人为干预!
小米su7max全国NOA智驾,三分钟不到差点撞墙,太危险了!
StreamPETR—作分享:稀疏向量化表征长时序建模
ICLR'24|GLiDE:通过反事 实扰动将语言计划植入演示,MIT让机器人掌握"常识",自主完成复杂家务
小鹏网约车,不敢用智驾?
华为要上智驾险,这个 3.1 版本都不够他赔。