智谱多模态大模型算法岗,面试效率贼快!!!
是时候准备面试和实习了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。。最近一星球小伙伴跟我聊天,拿到了智谱多模态算法岗 Offer。整个面试过程非常快,两轮技术面加上一轮HR面,三周拿到Offer,效率非常快。今天我给大家梳理出来这家公司的薪资结构、工
是时候准备面试和实习了。
不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。
最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。
喜欢本文记得收藏、关注、点赞。

最近一星球小伙伴跟我聊天,拿到了智谱多模态算法岗 Offer。整个面试过程非常快,两轮技术面加上一轮HR面,三周拿到Offer,效率非常快。
今天我给大家梳理出来这家公司的薪资结构、工作强度等信息,顺便分享这位小伙伴的技术面经。
岗位信息
岗位:质谱-AI院-多模态算法工程师
工作地点:北京海淀区
薪资情况
-
月薪 × 16 薪(12个月固定 + 4个月年终);
-
股票/期权(3~4年归属,资深/博士标配);
-
福利:六险一金、餐补、算力资源;
工作1~3 年:
-
Base:40~60K /月 × 16 薪
-
年终奖:2~4 个月
工作3~5 年资深(带队/核心项目/顶会一作):
-
总包 100~150 万
-
Base:60~90K / 月 × 16 薪
-
绩效奖金 + 期权
工作强度
智谱在多模态领域有CogView、CogVideo、GLM-Image 等行业标杆项目,公司节奏偏快,强度中等偏上。
日常 11 点到,晚上 10 点左右走,周末偶尔需要加班。
论文投稿、版本发布期间会有冲刺,会比较累。
不搞无效加班,看成果和产出,技术氛围很强,薪资和成长都在行业第一梯队。
一面
-
自我介绍
-
你认为你最有代表性的一个项目是什么?解决了什么核心问题?
-
你这个项目生成模型是什么?属于哪一类(Diffusion / Autoregressive / GAN)?为什么这么选?
-
项目中的核心技术难点是什么?你是如何解决的?
-
模型效果是如何评估的?用到了哪些指标?
-
你是否做过模型对齐?如何提升生成质量?
-
如何解决文本和图像语义对齐问题?
-
训练数据是如何构建的?有没有做数据清洗或 filtering?
-
你训练模型时遇到过 OOM 吗?怎么解决?
-
你是否做过分布式训练?用的什么框架(DeepSpeed / Megatron)?
-
Megatron / DeepSpeed 的核心优化点是什么?ZeRO 1/2/3 区别?
-
文生图服务如何做到低延迟?如何设计一个高并发生成服务?
-
diffusion model 的基本原理、DDPM 和 DDIM 的区别
-
CLIP 的训练目标是什么?为什么有效?BLIP / Flamingo / GPT-4V 这类模型的核心结构是什么?cross-attention 在多模态中的作用
-
如何优化 diffusion 推理速度?(减少 step / distillation)
-
你最近关注的多模态论文有哪些?
-
代码题:给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那两个整数,并返回它们的数组下标。要求:时间复杂度需优于 O(n2),空间复杂度可接受 O(n)。
二面
-
请介绍你做过的一个最有价值的多模态生成项目
-
你项目中的模型整体架构是怎样的?
-
条件控制(text/image/layout)是如何注入模型的?
-
训练过程中 loss 不收敛的常见原因有哪些?你遇到过哪种?
-
你如何做 batch size scaling?是否用过 gradient accumulation?
-
数据分布不均(长尾问题)如何影响生成模型?
-
多模态数据(图文对)如何构建高质量数据集?
-
数据去重(dedup)为什么重要?如何实现?
-
弱监督 / 伪标签 在你项目中的作用?
-
生成结果模糊/崩坏,你如何定位问题?
-
如何判断是数据问题还是模型问题?
-
训练过程中 loss 正常但生成很差,可能原因?
-
diffusion 中 ε-prediction、v-prediction 区别
-
为什么 v-prediction 在大模型中更稳定?
-
为什么 transformer 适合做多模态生成?attention 计算复杂度如何优化?flash attention 原理
-
视频生成相比图像生成最大的难点是什么?
-
代码题:给你一个链表,每 k 个节点一组进行翻转,请你返回翻转后的链表。k 是一个正整数,它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍,那么请将最后剩余的节点保持原有顺序。要求:仅使用常量额外空间,即空间复杂度为 O(1)
更多推荐


所有评论(0)