是时候准备面试和实习了。

不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。

最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。

喜欢本文记得收藏、关注、点赞

在这里插入图片描述


最近一星球小伙伴跟我聊天,拿到了智谱多模态算法岗 Offer。整个面试过程非常快,两轮技术面加上一轮HR面,三周拿到Offer,效率非常快。

今天我给大家梳理出来这家公司的薪资结构、工作强度等信息,顺便分享这位小伙伴的技术面经。

岗位信息

岗位:质谱-AI院-多模态算法工程师

工作地点:北京海淀区

薪资情况

  • 月薪 × 16 薪(12个月固定 + 4个月年终);

  • 股票/期权(3~4年归属,资深/博士标配);

  • 福利:六险一金、餐补、算力资源;

工作1~3 年:

  • Base:40~60K /月 × 16 薪

  • 年终奖:2~4 个月

工作3~5 年资深(带队/核心项目/顶会一作):

  • 总包 100~150 万

  • Base:60~90K / 月 × 16 薪

  • 绩效奖金 + 期权

工作强度

智谱在多模态领域有CogView、CogVideo、GLM-Image 等行业标杆项目,公司节奏偏快,强度中等偏上。

日常 11 点到,晚上 10 点左右走,周末偶尔需要加班。

论文投稿、版本发布期间会有冲刺,会比较累。

不搞无效加班,看成果和产出,技术氛围很强,薪资和成长都在行业第一梯队。

一面

  1. 自我介绍

  2. 你认为你最有代表性的一个项目是什么?解决了什么核心问题?

  3. 你这个项目生成模型是什么?属于哪一类(Diffusion / Autoregressive / GAN)?为什么这么选?

  4. 项目中的核心技术难点是什么?你是如何解决的?

  5. 模型效果是如何评估的?用到了哪些指标?

  6. 你是否做过模型对齐?如何提升生成质量?

  7. 如何解决文本和图像语义对齐问题?

  8. 训练数据是如何构建的?有没有做数据清洗或 filtering?

  9. 你训练模型时遇到过 OOM 吗?怎么解决?

  10. 你是否做过分布式训练?用的什么框架(DeepSpeed / Megatron)?

  11. Megatron / DeepSpeed 的核心优化点是什么?ZeRO 1/2/3 区别?

  12. 文生图服务如何做到低延迟?如何设计一个高并发生成服务?

  13. diffusion model 的基本原理、DDPM 和 DDIM 的区别

  14. CLIP 的训练目标是什么?为什么有效?BLIP / Flamingo / GPT-4V 这类模型的核心结构是什么?cross-attention 在多模态中的作用

  15. 如何优化 diffusion 推理速度?(减少 step / distillation)

  16. 你最近关注的多模态论文有哪些?

  17. 代码题:给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那两个整数,并返回它们的数组下标。要求:时间复杂度需优于 O(n2),空间复杂度可接受 O(n)。

二面

  1. 请介绍你做过的一个最有价值的多模态生成项目

  2. 你项目中的模型整体架构是怎样的?

  3. 条件控制(text/image/layout)是如何注入模型的?

  4. 训练过程中 loss 不收敛的常见原因有哪些?你遇到过哪种?

  5. 你如何做 batch size scaling?是否用过 gradient accumulation?

  6. 数据分布不均(长尾问题)如何影响生成模型?

  7. 多模态数据(图文对)如何构建高质量数据集?

  8. 数据去重(dedup)为什么重要?如何实现?

  9. 弱监督 / 伪标签 在你项目中的作用?

  10. 生成结果模糊/崩坏,你如何定位问题?

  11. 如何判断是数据问题还是模型问题?

  12. 训练过程中 loss 正常但生成很差,可能原因?

  13. diffusion 中 ε-prediction、v-prediction 区别

  14. 为什么 v-prediction 在大模型中更稳定?

  15. 为什么 transformer 适合做多模态生成?attention 计算复杂度如何优化?flash attention 原理

  16. 视频生成相比图像生成最大的难点是什么?

  17. 代码题:给你一个链表,每 k 个节点一组进行翻转,请你返回翻转后的链表。k 是一个正整数,它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍,那么请将最后剩余的节点保持原有顺序。要求:仅使用常量额外空间,即空间复杂度为 O(1)

Logo

电影级数字人,免显卡端渲染SDK,十行代码即可调用,工业级demo免费开源下载!

更多推荐