V
主页
【卢菁老师说】从面试官的角度看大模型岗位的技术要求和准备方向
发布人
大模型来自面试的一些体会和分享 最近开始集中校招提前批和人才计划面试,偶尔也穿插着社招的面试,根据目前的简历和面试情况,跟大家汇报一下一线大模型技术方向的人才风向标。 1.有大模型方向论文的硕博很少,大部分论文还是在模型架构排列组合,屎上雕花。 这个无可厚非,每一次技术革新都意味代价,大家搞论文也不一定是为了影响力这么远大的目标,很多时候是为了混口饭吃。 在本来就价值不大的领域方向上,进行了过度网络结构优化,最后取得几个点的提升,这类典型的比较水的工作太多了,现在已经无法吸引面试官眼球了。 首先这部分工作有两个问题,第一是真的没有太大的作用了,可能还比不过zeroshot直接来解决这些的水平,另外,往往有更简单的方法其实明明也可以做的很好,但就是做的花里胡哨。 在大模型时代,大力出奇迹和朴素简单有用都是有价值的,唯一没太大用处的就是稀奇古怪的方法组合起来,解决了一个不太经常出现的问题。 2.有大模型训练经验简历的很少,有65B以上大模型全量训练的更少,预训练的经验就像捡到了宝。 这个更无可厚非,毕竟整个行业大家都买不到卡了,大部分人手中的卡可能还是32GB的V100,也还没有多少张。 大部分人的简历还是围绕大模型做一些边角工作,或者注定天花板不是很高的方法,比如lora,ptuning等。 7B全量微调的起步的8张40GB的A100,这个储备也不是那么好弄了现在。65B全量微调的起步得上百张卡了。 预训练更别提了,简单算下,8张A100 每天可以过个位数GB数据,假设要跑GB数据的话,几个月就没了。 另外做大模型训练的更像是一个团队的工程活,每个人负责拧一个螺丝。有完整的从0起步的经验也是各家的香饽饽,简历已经在猎头那一端被抢爆了。 3.模型评测方面经验很稀缺。 模型评测算是大模型目前的黑科技了,谁能做的又快又准又好,就能和同行显著拉开差距。 但是模型评测本来就有很大的坑,属于很不好拿收益的方向。 模型评测主要是指怎么评价一个模型的好坏,不仅困难,而且十分重要,绝对是一个核心的科技,这现在也是除了oepnai各家没怎么搞定的一个问题。 这个问题很关键,是因为基座大模型的训练耗时耗力,如果不能想出很好的提早检验方式的话,做实验的速度会慢特别多,所有的时间成本都可以折合成算力上。 所以你做实验慢了,相当于比别人少了GPU,足够触目惊心吧。 4.大模型选型上一定要紧跟行业主流认知 有些同学弄了一些偏门模型的经验,然后信誓旦旦的给了一些结论,显得十分不靠谱的。 主流认知就是llama系列微调潜力最好,中文zeroshot推理chagtlm/llama变种等都可以,微调chatglm其实效果一般。 但是还有一些简历还是在选型上没有充分紧跟开源社区,有一些跟主流认知的偏差的地方,这样就没办法在一个层次上互相交流沟通,显得面试在鸡对鸭讲。 5.成功落地的场景稀少,目前都在探索阶段 从现在的简历来看,整个行业的进展还是比较慢的,尤其是在落地领域。 大多数的大模型项目还是抱着试试看或者玩玩的心态,另外或者是demo的状态,或多或少总会遇到各种坑无法落地。 比如幻觉问题很严重,风控问题解决不了,资源消耗覆盖不住,推断延迟太大影响体验等等。 这里面每一个问题都可以展开讲一堆,是实际落地问题里面必然会碰到的问题。 整个行业的简历很少碰到有人完整的从0起步,一点点解决了这些棘手的问题并正了八经落地的,当然这个要求可能太高了,也就离创业成功不远了。 6.大模型需求依然很旺盛,优秀简历很抢手 目前除了一些知名的垂直的初创公司做大模型基建基座外,还有很多优秀的AIGC应用公司在具体的应用方向上发力。 另外,大公司在这方向上也来势汹汹,手快的组很快申请到了计算资源,例如很多以前跟搜索,交互,NLP相关的部门,都在摩拳擦掌准备分一杯羹梗。 大公司的项目有更明显的玩票特点,相对更不靠谱一点,这也和大公司本身有比较强的拖底效应有关,创业公司搞不出来就干黄了,大公司搞不出来就当练手了,至少还摸了一把,蹭了新鲜。 目前几乎每个大厂都有10+个以上的达模型jd,候选人投递的时候一定要仔细考察,分辨是玩票性质还是做的比较扎实。 7.大模型八股文的频率高吗? 如果简历比较扎实的话,有相对较为丰富的大模型经验,其实基本上是不会问八股文的,因为一个小时的时间,交流一点一线搞大模型的经验和心得都来不及,根本没有时间问八股文。 如果简历比较虚,或者没有相关经验,但是过往经历ok,准备往这个方向转的话,还是会着重考察潜力和基础的。潜力就是对应一些考察思维的题目,基础对应着一些八股文。
打开封面
下载高清视频
观看高清视频
视频下载器
【卢菁老师说】Agent就是一场彻头彻尾的AI泡沫
转岗大模型:心态调整和面试准备
大模型技术栈全览
大模型求职第二期:岗位的选择和准备
微调和嵌入哪个好?该怎么选?一个视频搞清楚!
大模型算法,看了n份简历后我的建议是
面试大模型岗反反复复,无非就是这些问题,保姆级大模型面试八股文(附答案)offer拿到手软,背完稳了
背下来,算法工程师面试就稳了!2024最全大模型与深度学习算法面试题库整理,大模型时代,算法工程师必备面试秘籍!
【卢菁老师说】大模型的技术壁垒是什么
大模型入门:GPT及面试题讲解
医疗大语言模型DoctorGPT开源,人人都有自己专属医生了!
AI市场到底怎么样,大模型相关岗位分析
转行大模型算法简历怎么改?|算法简历点评
能刷掉80%候选人的一道大模型面试题!
李飞飞表示:大语言模型并非AI大模型未来发展方向
面试官:如何解决大模型的badcase?
【卢菁老师说】到底什么是大模型
20240419大模型面试讲解
【大模型】个人学习大模型技术需要什么样的电脑配置?
【最稳面试宝典】2024 NLP算法岗位 复习流程及面试题汇总 来给您送福利了!-人工智能/自然语言处理/机器学习/AI算法
【人工智能】NLP工程师面经分享·内推 (小象学院)
【科普】如何感性的理解AI大模型是什么
一线AI创业者告诉你,大模型不能做什么?
【手撕LLM面试题系列】大模型推理优化
校招大模型算法岗,如何选择方向 + 准备?
大语言模型面试和研究干货方向分享
【卢菁老师说】大模型的命门是什么
从零开始学习大语言模型(一)
字节AIGC产品经理真题面试|224秒全程高能
大模型时代,相关工作岗位需要掌握什么技能?北大博士从零解读多模态与大模型(人工智能/深度学习)
LLM面试_为什么常用Decoder Only结构
给一个应届硕士做一场nlp算法岗模拟面试,面完觉得这个同学还有很长路要走啊
你知道AI训练师这个职业吗? AI训练师这个新职业具体是做什么的?需要具备哪些技能才好找工作?
【算法工程师各领域详解】2024算法岗就业前景和最佳就业方向,想入门算法岗的一定不要错过,让你少走好几年弯路!-人工智能、机器学习、深度学习
六年工作经验AI算法工程师吐血整理!AI算法岗最强面试文档分享,大厂面经、简历模板、竞赛资源、实战项目全都有!
原来大模型还可以这么训练?干得漂亮!
湖南小伙成为马斯克x.ai公司联合创始人 #人工智能 #马斯克 #ai #微软 #湖南
我有一些很变态但能帮你通过AI面试的技巧
大模型算法工程师如何准备面试,大模型岗位面试总结 大模型LLM微调经验总结 卢菁博士老学员大模型面试经验分享
【卢菁老师说】大模型翻车的本质原因探讨