V
主页
AstroLLaMA: 专业领域的天文学基础模型
发布人
论文简述:本论文介绍了AstroLLaMA,这是一个从LLaMA-2进行微调的70亿参数的语言模型,使用超过30万篇来自arXiv的天文学摘要进行训练。与通用语言模型相比,AstroLLaMA在生成高质量的摘要和对天文学文献中相关信息的理解方面显示出明显的改进。本论文的贡献在于提供了一个领域特定的模型,具有广泛的微调潜力,并旨在促进天文学研究,包括自动论文摘要和会话代理开发。 论文链接:https://arxiv.org/pdf/2309.06126
打开封面
下载高清视频
观看高清视频
视频下载器
【李宏毅】2024年公认最好的【LLM大模型】教程!大模型入门到进阶,一套全解决!2024生成式人工智慧-附带课件代码
2024最强 AI 集合!12个领域,47款AI工具,每一个都变态又好用!打工人必备!【建议收藏】
《天文学上的旷世之争》第四课时高二9班
【2024.6.22直播】社科领域的研究方法与实操指南
多模态基础模型研究综述
【真题详解】2024CNAO天文奥赛全国决赛-[选择题9]
《天文学上的旷世之争》第一课时高二12班
【LLM前沿】Agent智能体框架的优缺点是什么?大模型驱动的群体智能,AutoGPT/大模型/计算机视觉/人工智能
博士生最重要的事情是培养你的学术研究能力!而不是作出原创性学术贡献……
开源指令生成:用开源代码提升代码生成模型性能
基于个性化教学原理的关闭源LLMs模型蒸馏方法
博士生在读博期间常犯的六个错误以及如何培养自己的学术研究能力
大型语言模型如何从网络上的信息中辨别真假?
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits
BitNet: Scaling 1-bit Transformers for Large Language Models
大规模语言模型的Transformer架构及其批处理技术
多模态协同学习模型
【AI Drive】ACL 2021:利用对比学习增强预训练语言模型的实体与实体间关系理解
【MaxQDA实操案例】用情境分析法,实战编码一份质性资料!
Sorted LLaMA: 动态推理解锁大型语言模型中间层潜力
Paper Reading Group基于知识增强的语言表示模型
语言模型在数学问题求解中的学习和纠错能力研究
“我要这样”:结合大型语言模型与约束编程实现交互式决策支持
层次规划组合基础模型研究
多模态模型的规模化:预训练和指导调整
基于语言、任务和指标的人工智能模型的一致性分析
多模态模型对齐与强化学习从人类反馈优化
融合像素与潜在扩散模型的文本到视频生成方法
生成高质量的长视频:SEINE视频扩散模型
大规模语言模型在科学中的应用:P vs. NP问题的研究
基于语言引导的3D场景理解与推理
CVPR 2024 — 神经网络学到的东西原来和人类大脑差不多?哪些预训练模型才是真·人工智能?这篇文章都能回答,脑洞太大了!
基于语言模型的在线纠错和知识检索系统DROC在机器人任务泛化中的应用
The FinBen: An Holistic Financial Benchmark for Large Language Models
多语言大型语言模型训练数据集CulturaX
DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Langu
How Do Large Language Models Capture the Ever-changing World Knowledge? A Review
Memory Augmented Language Models through Mixture of Word Experts
More Agents Is All You Need
Linear Transformers with Learnable Kernel Functions are Better In-Context Models