V
主页
Gemini 1.5 Pro 的长上下文窗口如何帮助机器人导航?🤖
发布人
Gemini 1.5 Pro 的长上下文窗口如何帮助机器人导航?🤖 有限的上下文长度使得许多 AI 模型在记忆环境时面临挑战。Google 的 DeepMind 机器人依靠 Gemini 1.5 Pro 的 100 万 Token 上下文窗口长度,可以利用人类指令、视频导览和常识推理成功地在 9000 多平方英尺空间内导航。 在这个视频中,实验人员带着机器人在真实世界的特定区域进行了导览,突出了需要记住的关键地点,例如“Lewis的桌子”或“临时桌面区域”。然后,要求机器人带实验人员找到这些地点。 来源:https://x.com/GoogleDeepMind/status/1811401356827082796
打开封面
下载高清视频
观看高清视频
视频下载器
扎克伯格更担心某些我们不信任的人掌握了超级 AI,有了优秀的开源 AI 反而可以帮助引领标准,确保一个更公平、更均衡的竞争环境,达到平衡
Rabbit R1:几乎无法评测
马云:人工智能和机器人无法控制人类
OpenAI 与大都会博物馆合作,借助 AI 唤醒“睡美人”
一起学多 AI 智能体系统(双语字幕)- 3. 什么是 AI 智能体
亲身体验 Google Gemini:与多模态人工智能互动
Google I/O Project Astra 的两段演示视频
2 分钟解释什么是生成式 AI(双语字幕)
WWDC24 - 分析堆内存 (双语字幕)
我们得聊聊 Rabbit R1 这款设备...
一起学多 AI 智能体系统(双语字幕)- 6. 实战:搭建一个多智能体客户支持系统
Jim Fan:在开放世界中的通用智能体
一起学多 AI 智能体系统(双语字幕)- 4. 实战:构建一个多智能系统来帮你写作
一起学多 AI 智能体系统(双语字幕)- 1. 介绍
合成数据能否解锁 AI 的递归自我进化?— 马克·扎克伯格
让 OpenAI o1 写一个贪吃蛇的网页游戏,这不算什么,但是后面让它在网格中添加障碍物,并且连在一起是 A I 两个字母,这确实有了一点智能的样子了
借助 AI 技术帮助中风患者通过数字分身“说话”,更自然地更高效地与人交流
看 GPT-4o 如何充当面试官帮助模拟面试,不仅能提出靠谱的意见,比如要举实际的例子,要和职位相关
Google 前 CEO 埃里克·施密特近期在斯坦福 CS323 课堂上的访谈(二)
如何让 GitHub Copilot 更好的帮你完成编码任务
Google Project Astra 演示:陪你一起看 Google I/O 直播并为你解说
OpenAI o1 解决逻辑智力题
Mistral 入门指南 —— 介绍
WWDC24:SF Symbols 6的新亮点(双语字幕)
一款新的 AI 穿戴设备,Limitless
测试第三根拇指
从商业思维到AI实施:利用Semantic Kernel构建插件之路1 —— 介绍
WWDC24 - 通过UX写作为你的应用增添个性(双语字幕)
比尔·盖茨表示人工智能通过抵消排放所带来的收益,将足以覆盖其自身的成本。
国外科学家脑洞大开,发明生物混合机器人,拥有杏鲍菇大脑
Anthropic 首席执行官 Dario Amodei 谈人工智能技术竞赛: 我们不受制于某家公司
一分钟学 AI 之 —— 什么是向量搜索
Sam:我们究竟是创造了一个工具还是一个生物?
Geoffrey Hinton 对 AI 未来的见解(双语字幕)
苹果汽车项目终止的背后原因
生成式 AI 入门教程 2 - 什么是生成式 AI - 原理和指南
WWDC24 - 设计应用意图 (App Intents) 以提升系统体验(双语字幕)
机器狗和人工智能--这就是电动车工厂的未来吗?
面向所有人的生成式 AI 入门课程 8 - 生成式 AI 应用 - 大语言模型的能力与局限
WWDC24 - App Intents 的新功能