V
主页
预训练的优势和劣势有哪些?
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
大模型预训练和微调的区别是什么?
预训练模型的准确度有多高?
有没有已经预训练好的大语言模型可供使用?
预训练和直接训练的区别是什么?
BERT为什么会选择Transformer作为基础架构呢
生成类预训练模型存在哪些潜在的问题和限制?
多任务学习中各loss权重应该如何设计呢?
预训练和微调分别有什么作用?
语言生成类预训练模型的工作流程是怎么样的?
GPT等大模型会让我们实现通用人工智能吗
如何有效地处理大模型训练中的梯度爆炸或者是梯度消失等数值稳定性问题?
思维链技术在处理复杂语义理解任务时的应用场景和方法有哪些
生成类模型是否不需要融入外部知识而使用Prompt就行?不像Encoder那样需要显示的融合知识?
为何相同的模型在不同测试集上表现迥异?
如何利用硬件加速来提高移动设备上的机器翻译性能
SFT和RLHF的区别是什么?
机器翻译技术在移动智能设备上有哪些应用场景?
小牛翻译离线翻译SDK,让您的智能设备随处可用
分布式训练中的通信机制问题
多目标优化和多任务学习的区别是什么?
大模型在处理复杂韩语长句时有哪些优劣?
NLP中词向量的预训练是什么意识?有什么作用?
在多任务学习的框架下,如何选择和设计合适的学习任务?
模型剪枝算法是如何实现的
NiuTrans Talk第四期
面向移动智能设备的机器翻译技术与应用
术语词典功能该如何使用
7·15小牛翻译宠粉特惠来袭~专治各种翻译疑难杂症!
哪种情况下适合使用硬件加速来提高模型推断的速度?
神经网络都是Encoder-Decoder架构吗?
ChatGPT在处理语言时如何处理语言之间的翻译
多语言机器翻译的技术与应用
小牛翻译推出国产计算机适配方案
分布式训练中不同硬件架构会对性能产生怎样的影响?
生成式大语言模型系列直播-第三期《预训练基础:编码模型》
上下文学习在大语言模型中的作用是什么?
小牛办公本,高效办公的必备助手
2022小牛翻译论坛
仅用60行Numpy代码就实现了GPT,连OpenAI首席科学家Karpathy都点赞了!
直播回顾|黄国平博士与交互式机器翻译