LLM(机器学习)职位面试(2024年秋季)——流程回顾 [译]
这是我在 2024 年秋季面试以 ML/LLM 研究科学家/工程师为主要方向的职位时的经历分享。
导览
这篇文章分为两部分:
- 求职流程机制(包括背景、申请方式和行业信息),继续向下阅读即可。
- 准备资料与常见面试问题总览,见:LLM (ML) Job Interviews - Resources](https://mimansajaiswal.github.io/posts/llm-ml-job-interviews-resources/)
免责声明
- 最后更新:2024 年 12 月 24 日
- 本文仅是我个人的经验分享,供参考之用。由于 LLM 领域日新月异,具体信息可能很快失效,但其大体思路仍有参考价值。
- 通常我不会用 LLM 重写我的个人文章,但这次为了精炼和保持更专业的口吻,我结合了 Claude 3.5 Sonnet 和 GPT-4o 等模型对其进行大量编辑(而非生成)。
- 每个人的背景和情况不同,不保证我的流程对所有人都适用。
我发现网上有不少关于学术教职求职的信息或 Slack 群组分享,但很少看到关于工业界招聘,尤其是研究类岗位(如研究科学家/研究工程师)的具体面试经历。虽然研究方向和行业形态不断演进,但面试流程本身变化并不算特别大;无论是薪资结构、岗位责任还是面试环节,不同企业和团队都会有所差异。如果大家能在面试前就能获取一些更公开、可借鉴的信息,也许能更好地准备。
读者互动
“点击展开”以阅读由 Claude 生成的简短(<450字)总结,可帮你节省时间和 API 代币。相信我,我用了一个很有效的 Prompt。 面试流程与阶段 - 初创公司(Startups):面试流程通常不太规范,往往因公司所处阶段而异。你可能要经历 5-6 轮面试,包括 Leetcode 类型的代码挑战、ML 编程、ML 基础考核及文化契合度面试。有的公司还要求现场面试、多日工作试用或详尽汇报。角色通常比较宽泛。 - 独角兽公司(Unicorns,如 Anthropic、OpenAI、Scale AI 等):整体结构较清晰,但每家仍有自身差别。一般会有编码面试(不一定是纯 Leetcode),ML 设计、LLM 讨论及演示环节。通常面试轮数很多,若申请多个团队,也可能把多轮合并。 - 大型科技公司(Big Tech,如 Meta、Amazon、Apple、Google、Microsoft 等):流程更成熟且复杂,通常持续 1.5 到 2.5 个月。需准备 Leetcode 风格的编码面试、ML 系统设计、LLM 研究设计、汇报展示以及行为面试。面试既考查通用基础,也包含针对岗位的技术深度考核。
常见面试组成部分 1. 编程挑战:用数据结构与算法解决问题,Leetcode 练习必不可少。 2. ML 系统与设计面试:考察对机器学习概念、系统架构及解决方案设计能力。 3. 汇报展示:展示以往研究或项目,评估专业能力与沟通技巧。 4. 行为面试:评估团队契合度及思考方式。
公司类型差异 - 初创公司:流程往往更加灵活多变,偏好可多面手的人才。 - 独角兽:注重前沿技术与专业技能匹配,更倾向尖端研究或极具市场潜力的项目。 - 大厂:流程成熟、考核全面,既包含技术,也重视软技能和文化契合。
时间轴 从开始面试到收到结果通常需要几周至几个月,遇到节假日或招聘旺季可能延迟。若拿到多个 offer,通常只有约一周的接受窗口,需要迅速决策或协调延长期。规划各家面试流程、并行管理多方进度也相当重要。
实际建议 - 充分准备:编码与系统设计要反复练习、熟悉常考点。 - 真实表达:如实介绍自己经验,不要夸大。 - 把握简历:优化 ATS 友好的简历,并通过人脉获得内推可能带来帮助。 - 高效安排:管理好投递节奏和面试日程,学习总结并适当调整准备策略。 - 跟进行业:多关注 ML/LLM 的最新进展与应用方向,以展示自身竞争力。 - 自我调适:面对连续面试要注意休息,维持正常的工作与生活节奏,发挥最佳表现。
我的诉求
- 欢迎有相似经历或想分享面试过程的朋友与我交流,比较我们各自的经历、提供补充信息。
- 如果你也有面向不同公司的面试流程或来自各种背景(不同的发表记录、专业方向或资历层次)的经历,希望能得到你们的补充。
我不想要什么
- “你很蠢”之类的人身攻击;或对我选择的职业风险、LLM 时代到底要不要抓住机会、对比谁拿到更高薪等言论。
- 关于“某人的 tech 职场成功/失败”“GitHub 贡献度”或类似社会/政治话题。
求职背景
我于 2024 年 10 月左右开始寻找新工作,一是出于个人与职业规划的调整,二是希望在 LLM 领域拥有更多沉淀与成果。
关于我:如果你没看过我的公开简历,以下是简要概况。
- 近年我在 LLM 上发表过一些论文,过去也在语音处理和基于编码器(Bert 时代)的 NLP 方面有多篇发表。
- 我自己维护了一个博客,主要写案例研究和消融分析,而不是对常识性概念的重复讲解,并在一些主流 ML 会议的研讨会上投稿/录用。
- 我有一年全职(叠加一年独立研究)以及大约一年的实习经验,研究方向非常明确。
- 我还有一些尚未公开的工作,主要通过面试时的演示或邮件解释——因为我的当前发表记录无法完整代表我在 LLM 评测和 RAG(检索增强生成)中的相关经验。
- 在整个找工作的过程里,我常感到对“主动找人”颇为犹豫,担心自己简历不够完美。然而最终我发现,不主动联系其实更不理想;当我真的去联系时,大多数人都很乐意提供帮助。
职业偏好
- 想做面向更广泛人群的 LLM 项目,包括通用型应用或推动模型本身的研究/工程。对那种非常特定于客户定制的问题不太感兴趣,我更喜欢有一定“通用/长期影响力”的课题。
- 我对纯“AI 工程”或“LLM 工程”岗位兴趣有限(文中后面会讲原因),主要想找“产品驱动或好奇心驱动的研究工程/研究科学家”角色,不太介意公司规模大小。
- 我更希望团队内能有过 ML/LLM 研究经验的伙伴,便于在工作中一起头脑风暴、讨论复杂问题,而不是只有自己闷头干活。
- 我想在主要目标即团队研究项目中投入 3~6 个月甚至更长时间,能进行充分实验,而不是一味快节奏上线,避免只把研究工作碎片化或临时补丁式地并入产品。
- 我注重工作与生活平衡。理想的工作要能让我在业余时间继续做一些个人感兴趣的 AI 小实验、写博客,以及照顾我的猫。
- 我现居西雅图,与伴侣同住,因此不太愿意搬家,除非有非常契合我职业目标和个人情况的机会。
- 对个人价值观也有一定考量。例如对“AI 安全/安全研究”感兴趣的团队若侧重与我理念不符的方向,我就不会优先考虑。一些公司与我个人理念不合,也会影响我的决定。
- 我需要 H1B COE 和尽快启动绿卡流程,否则基本无从考虑。
求职流程
准备背景
我自己学东西的方式比较“边做边学”,包括研究也是如此。面试时往往会感觉紧张,特别是考到我意想不到的方向。我没有特别充分的面试经验,身边同辈在 PhD 毕业后大多早于两三年进入行业,当时整体招聘环境和面试要求都不同。所以当下能给我参考的“前人经验”并不多,尤其我又比较少主动问人,所以我只好在实践中摸索着调整,直到逐步清晰各公司真实的考察重点。
初步投递
我首先搜集与自身职业偏好契合的公司,通过 LinkedIn、Twitter 等查找岗位,部分也通过内部推荐(referral)。初创公司通常可通过在 LinkedIn 联系创始人;传统大公司可联系招聘者或经理;再加上常规的公司官网入口。从流程上看,我给许多公司都投过简历,有的也联系了 HR 或团队主管。
准备材料
追踪(Tracking) 我用 Notion 做了一个简单的代办列表来追踪投递进展,分为:
- “Applied/In Process”(已投/处理中)
- “Waiting”(在等结果)
- “Rejected/Offered”(已拒/拿到offer)。
虽然只是一页简单的记录,但好处是可以把公司信息、截图下来的职位描述等都集中放在一起,方便复习面试要点。还可以防止误重复投递到被拒的同一岗位(有些招聘系统会允许重复申请)。最终我只在真正排定面试后才把具体日程加到日历里。
回答招聘问卷 在正式申请里往往会遇到类似的问题(如“你为何适合此岗位?”“请简要介绍你自己”之类),我没有使用 AI 生成答案,而是自己口述,然后用 AI 检查语法或拼写错误,但不会让其代写内容。
- 因为很多公司会多次问到这些问题,也便于我后续面试时更熟练地阐述。
- 我会把自己写过的问答保存到 Notion,以便今后碰到相似问题时参考。
简历 我的简历在我个人主页可看到(LaTeX 排版)。我最大的痛点是多栏布局被 ATS 扫描器解析得一团糟,导致关键信息可能被漏掉。若重来一次,我会花时间做一份更友好的简历(例如用 Typst)以适配 ATS,毕竟手动一次次改格式非常麻烦。我打算之后找个时间专门整理好一套通用模板分享,也建议大家平时把 LinkedIn 也填好,以便快速自动填写繁琐的网申。
短简介(Short Blurb) 给自己写一小段三五行的“自我介绍”很有用。刚开始的几周我改过很多次,最后才定稿。不过我依然倾向于话比较多(就像这篇博文一样),如果能再更精简一些会更好。当我给经理或招聘方写消息时,会在正文中简短介绍自己、说明为何适合这个岗位,然后附上这段概要介绍与简历。以下是我最后定稿的(英文)简短介绍——示例供参考:
(此处省略英文 Blurb,仅保留中文概念性的表述)“我的工作主要聚焦 LLM 的三个方向:合成数据生成与筛选、LLM Orchestration/Agent、以及健壮且可落地的评估与基准测试……”(后续详细展开) 汇报展示(Presentation) 令我意外的是,在不是纯研究 Scientist 岗位的面试中(例如 MLE、研究工程师、应用科学家)也被要求做 40 分钟左右的汇报演示,并留 15 分钟问答——其实属于“带深度的技术陈述”。由于我很多 LLM 相关成果尚未发表,所以我花了些功夫把零碎的研究点拼接成一个连贯故事。可惜这些未发表内容无法公开分享 PPT;但对读者来说,如果你正好在读博或做完一段研究项目,应该可以用论文答辩或研讨会的材料改一改来面试。要注意时长控制,最好 40 分钟左右,包含相关数据图与结果分析。
其他材料 除了上面提到的,我只为微软的某个特定岗位写过一份研究计划书(research proposal)。大部分公司不需要这类文档。而 Cover Letter(求职信)我也都没写,主要时间来不及,且很多公司也不强制。
安排面试
我当时排得非常紧张,每天几乎要面六个小时,持续了 12 周。不过这并不一定适合所有人。如果你时间不充裕,没必要排得那么满,但我想尽快在实战中总结经验。
- 招聘方一般会问你未来两周的可选面试日期;有时如果你有多个机会并行推进,必须学会管理时间,以免错过时机。
- 大厂的流程往往更漫长(1.5 - 2.5个月),初创公司可能短一些,但也可能灵活度较大。
- 以下这张截图(英文原文中)显示了我 10 月份的日历,大量一小时区块都被各种面试占据。
行业信息
如果你对行业内公司面试形态有所了解,可以跳过这部分。我自己在摸索中学到不少东西,想分享给同样处于困惑期的人。
免责声明:
- 我并不是学术大牛,没有高引用量的顶会论文,也没有大佬内推。因此我的经历更多是面对“普通中高水平”候选人的流程,也许对顶尖背景或内部强推者不适用。
- 各公司面试薪资和等级因人而异,这里只分享我的实际体验以及一些行业普遍现象。
- 我确实拿到一些 Offer,但并非惊天的高薪,也不算“人人都抢”的明星候选人,因此更接近普通背景求职者的情况。
初创公司(Startups)
初创公司面试流程 初创公司通常流程不够统一,取决于它们的融资轮次和团队规模。有的要求线下面试(甚至多日),有的还要求多天“试工”之类;也见过要提供大量参考人信息(references)等。
- 大部分公司会安排 5~6 轮面试,包含通用编码(Leetcode)+ ML 编码 + ML 理论 + 文化契合度。
- 也存在公司一上来就告诉你“我们每周工作 6~7 天、每天 12 小时”之类,我一般就不考虑了。
- 还有一些公司职位名称写着“AI Research Scientist”或“AI Research Engineer”,但内部其实更多是“把现有研究工程化”或“根据客户定制”,而非真正产出新的研究论文或方法。如果你在意做“研究型”还是“工程实现型”,务必要仔细确认。
举个例子:Galileo 曾给我发过一封邮件,说他们关闭了 “Senior ML Research Scientist” 职位,改招 “Senior Applied AI Researcher”,并明确强调新职位更偏“面向产品和大规模上线”,这是我比较欣赏的坦诚,虽然命名方式依旧可能让人混淆。
我在初创公司面试中的一些例子 - 好的体验:[Offer]Salient:面试流程简洁,需求明确,团队对研究与产品定位也讲得很清楚。Resolve AI:面试官包括 HR 都非常友好,内容侧重真实工作案例,编码环节则考察 ML 设计思路。Haize:虽然个人不太能接受他们的工作强度,但公司确有在做真正的研究。Descript:只有一轮面试,但聚焦具体需求,很直接。Contextual AI:ML 编码题是复现论文核心想法,有完备的题目描述,我觉得这种形式很好,尽管我没通过。Sierra AI:创始团队里有人参与过 GPT 等重量级论文;他们的流程:一次 HM 沟通、一次 30 分钟汇报 + 15 分钟 Q&A、1 小时研究面试、2 小时 ML 编码(含训练模型/实验)、以及跟创始人的 1v1 面谈。我只做完了初步轮次,后因他们坚持要线下现场面试而作罢。 - 不太好的体验:有些公司主动在 LinkedIn 上联系我,面了三轮就杳无音信;也有投完简历后经历两三轮又消失不见。有家公司要我做一场“云端调用大模型”的限时测试,却不提供 API key,得我自己掏钱?还有公司安排了四轮面试+四天作业+两小时汇报,最终却以“经验不足”为由拒绝,明明从简历就知道我工作年限…有的面试官明显在面试时就不想录用你,全程只是在解释为什么你不合适。有家说我“沟通风格不符”,在面试结束 5 分钟后就拒了我,也不给反馈。也有 HM(Hiring Manager)聊完觉得我不合适,但又把我转到另一个团队,结果那边也是一轮完就拒,还不解释。
初创公司如何拿内推 初创公司在 LinkedIn 和 Twitter 上常会发招聘贴;如果你能直接联系到创始人或团队领导,是最快速的渠道。有时也会有外部猎头发布较笼统的职位描述,这些往往对应的是小规模公司或处于种子期/隐形(stealth)状态的创业团队。
初创公司 Offer 与工作政策 - 总部通常在纽约或旧金山,多数不支持远程或异地。 - Base 薪一般在 15 万~25 万美元间,配合 0.2%~0.5% 的期权。 - 绝大部分提供医疗保险,但 401k 有些有配套、有些则没有;“无限 PTO”听起来好,但很多忙碌的初创公司实际并不会让你随便休。 - 搬迁补贴也因公司而异。
独角兽公司(Unicorns)
我在这次找工作期间,和三家独角兽公司有过面试往来:Anthropic(其实是 2024 年 4 月开始的)、OpenAI 和 Scale(Figma 在 2023 年秋面试过一次,没过)。此外没怎么接触别的独角兽。
独角兽公司的面试流程 - Anthropic:我当时面了 3 轮 OOP 编程,接着是一个虚拟“现场面试”,包含 7 轮子面试:ML 编码、LLM 考察、ML 理论和文化契合等;虽然很累,但面试官都很专业。 - OpenAI:我投了 Research Scientist/Research Engineer,第一关就是数学+LLM 编码,并没有先来一个纯通用的代码面试。我第一次被拒后,他们说可以转投另一个“MLE”岗(在旧金山),但需再做一轮筛选再加 4-5 轮面试。我没继续。 - Scale:初筛后面了两轮,若通过还要再进行最终面试。面试官都挺友善且问题很贴近实际。 - 这三家奇怪的是,很多题并不是传统 Leetcode;OpenAI 甚至允许你查资料(不能用 LLM 工具)。 - 他们有时会把同一人引向多个团队并行面试,如 Anthropic 若多团队感兴趣,会统一拉进一整套多轮面试中。
具体见闻 - 优点题目设计更偏实际应用,整体氛围较专业;Anthropic 的面试尤其让我印象很好。OpenAI 在拒掉 RS/RE 后,依然会积极帮你对接其他岗位。Scale AI 的面试官在 ML 编码环节非常耐心。 - 不足Anthropic 面试轮数较多,前后拉了好几个月,确实蛮折腾。Scale 有时回复较慢,曾经两三周无消息,后来我又催了一次才继续。OpenAI 多数岗位仍要求在旧金山办公,虽然他们在西雅图也有点人,但正式 headcount 很少。
独角兽公司的内推 - Anthropic、OpenAI 都是我在官网直接投递,然后非常认真地填写了各种问答。Scale 则是外部猎头联系到我。 - 若有内部熟人或导师同事认识人选,可以帮忙推,一般能更快得到回应。
独角兽公司 Offer 与工作政策 我没拿到这三家最终 Offer,薪资不清楚。网上能搜到一些区间信息。
- Anthropic 和 Scale 在西雅图有一定团队,但 OpenAI 基本集中在旧金山。
- 他们一般都有 401k match 和医疗保险,“无限 PTO” 也常见,但实际休假如何则要看文化。
大公司(Big Tech)
我面试或沟通过的大公司包括:Meta(LLama 团队)、Amazon(Alexa LLM 及 Ads)、Apple(AIML 事业部不同团队、以及一个合同岗)、Google(Gemini)、Tencent、ServiceNow、Microsoft(Bing、Office、MSR)、PayPal、Tiktok(今年 7 月时)、Netflix(Content & Studio)等。我没顾上投 Adobe、Huawei、LG、Samsung、Bloomberg、Sony 等,但这些也有不错的 ML/LLM 团队。
大厂面试流程概况 各家流程互不相同,而且同家公司内部也会对候选人有不同要求。
- 单一面试循环:一些公司(如 Google、Meta、Amazon、PayPal、Tencent)只让你并行面试一个团队;若想再面另一个团队,可能会额外插一两轮或被系统限制。
- 多重并行:Apple 允许你同时面多个团队,但只会给你一个最终 Offer;微软允许你并行多岗,Meta 也可以面完之后再看能不能挪到相近团队。
- 整个流程通常要 1.5~2.5 个月,还有节假日和会议季(如 NeurIPS)会拖延。
- 大体而言,你肯定会碰到 Leetcode 编程、ML/LLM 相关系统设计、研究讨论、展示汇报、行为面试等组合。
下面是我一些更具体的流程总结:
简要版(由 GPT4o 生成)Meta:经内推面试,不确定是 RS 还是 RE 岗。流程:HM 沟通 → 演示汇报 → 3 轮 ML 设计(含 LLM 面向)→ 1 轮通用编码(Leetcode 两题)→ 1 轮行为面试。Amazon:初步筛选 → 编码面试 → 演示汇报 → 六轮技术面试(ML 设计、LLM 原理、系统设计),并结合 Leadership 原则考察。Apple:可能分不同团队;如 Team 3:两轮筛选(HM 聊天 & ML 编码)后四轮现场(行为、ML、编码、DS&A);Team 1:多达 12 轮,包括面试官/经理/总监等层层深入;有的团队需做演示。Google:跳过初步筛选,但要做人格问卷;正式环节含一场汇报 + 5 轮面试(2 Leetcode、2 研究、1 行为)。Tencent:初步筛选后,要求做汇报 + 六次一对一面谈(ML 理论、研究深度、数学统计、Leetcode 等)。Microsoft:Team 1 走一个流程(5 轮面试,含 3 轮 Leetcode),Team 2 另一个流程(4 轮更偏 ML),MSR AI 某团队需要做 Demo 原型、然后 5 轮专业面试。PayPal:初步两轮过滤,再三轮面试(编码、ML 讨论、行为面试)。Netflix:HM 首聊后通常还有过滤环节,再四轮面试(编码、ML、行为等),我因时间原因没继续。 我在大厂面试的详细经历 - Meta[Offer]:我先跟 HM 聊,再做了 45 分钟的研究演示,然后有 3 轮 ML 设计(其中一轮和我领域高度相关,另两轮是通用 LLM 设计),以及一轮通用 Leetcode(两道题)+ 一轮行为面试。可惜面试结束时,该团队满编,后来招聘方试图帮我挪去同一部门的另一个团队。 - Amazon[Offer]:先是一个筛选面谈,然后是一轮代码面试,之后要做研究汇报,有 6 轮技术加领导力面试,涵盖 ML 宽度与深度,LLM 原理和系统设计,没考 ML 编码,但数据结构考察挺多。 - Apple:Team 1[Offer]:我面了整整 12 轮!包含:招聘方初筛,HM 初筛,ML 基础+编码过滤,研究汇报,5 轮加面(ML 深度、ML 宽度、编码、ML 编码、系统设计),之后又和 HM 复盘,接着跟二级经理、LLM 专家和部门总监都谈了一圈…虽然团队非常有趣,但他们想让我去湾区办公。Team 2:只进行了一轮 Leetcode,没过。Team 3:HM 聊天 + 团队访谈(ML 编程)→ 4 轮现场面试(行为、ML 理论、ML 编码、数据结构),最后没给 Offer。合同岗:做了 4 轮技术访谈(其中一轮 ML 编码),团队不错,可惜合同工在薪资和签证方面都不够有吸引力。 - Google:因为时机问题跳过了初步面试,但要先做了一个奇怪的个性测评问卷,然后是 1 场研究汇报 + 5 轮面试(2 Leetcode、2 研究、1 行为),其中没有 ML 编码部分。 - Tencent:筛选 → 演示 → 6 轮一对一,涵盖研究深度、数学统计、Leetcode 等。 - Microsoft:Team 1:HM 筛选 + 5 轮面试(含 3 轮 Leetcode),偶尔插入一些 ML 讨论。Team 2:HM 筛选 + 4 轮偏 ML 的面试,只有一轮编码。MSR AI Team 2:包括 1 轮 HM 谈话,接着一场面试“秀 Demo”以及 5 轮深度问答,包含研究演示和 OOP 编程,最后我被拒,感觉自己表现挺好还是蛮可惜。MSR AI Team 1:只面了 HM,一直到 2 个月后才得知拒信。 - PayPal[Offer]:两轮初步筛选,再 3 轮面试(编码、ML、行为),最后给了 Offer,但岗位在旧金山,不含搬家支持。 - Tiktok:今年 7 月面试了 1 次 HR + 2 次编码/ML + 1 次 HM LLM/系统设计,我没通过。 - Netflix:只做了 HM 首轮沟通,后续因安排冲突没继续。
大厂的正反面体验 - 优点面试官大多专业且已看过你的简历;气氛较和谐,也不会太刁难。题目虽有些 Leetcode 偏难,但大部分问题更贴合实际;有的面试官还会在你卡住时给提示。Microsoft Team 2、MSR AI Team 2 这两个团队给我的面试体验都不错,很尊重我的特长点。 - 不足我有被“放鸽子”三次,一次还在全程面了六七轮后,就再无消息。有一支 Apple 团队面到 12 轮,有点耗时过长。部分 Offer 给我的“考虑时限”只有 7 天,需要和对方谈延期。Google 这边改过两次面试时间,Microsoft Team 1 也会在流程中突然改我面试顺序或岗位归属。Amazon 最初跟我谈的是 Alexa LLM 表达情感方向,结果中途把我转去做广告业务,导致后面的面试问题很多跟 LLM 不相关。
大厂内推 - Meta:我最初八个月前就自己投了简历,无果。后来通过一个引用我论文的朋友联系到团队,再拿到内部推荐,才开始正式面。 - Amazon:本想面 Alexa LLM,但中途被莫名转到广告组。我很不甘心,就找了内推和其他 HR 反映,最后他们破例给我安排另一轮面试。 - Apple:我有两次是被熟人内推,结果石沉大海;反倒是没内推的岗位给了我机会。我被一个团队拒后,AIML 那边又联系说有另一支团队(Measurement)对我感兴趣。有个合同岗也是我在 LinkedIn 主动找到负责人。 - Google:先是学术熟人内推投了三个岗位没消息,后来通过导师以前的实验室同僚认识了做 Gemini 的员工,才算有了新进展。 - Microsoft:投了很多岗位,有的带内推,有的没带。反而是我私下在 Twitter 联系到的一个招聘经理更快给我安排面试。 - Netflix:网上申请后无回音,后来索性跟一个内部朋友聊了,他给了我一个 referral link 才收到回复。
大厂 Offer 与工作政策 - 多数大厂在西雅图、湾区、纽约等都有分部,但是否能异地办公得看团队意愿。 - 我实际拿到的几个大厂 Offer,结合 4 年总包(Base + RSU + 签字费 + 刷新包 + Bonus),大概在 35 万~43 万美元/年区间;Amazon 算法有点不一样,他们前两年给较高签字费,然后第三第四年期权才开始充分兑现;Meta 没有 Cliff,RSU 提前分批发,Apple 跟 Microsoft 还多一个 ESPP 购买计划。 - 许多团队并不真正允许远程,Amazon 官方说要全员回办公室,但执行细节不一。Meta、Apple 要求一周至少三天到岗。Netflix、部分 Microsoft 团队会更灵活一些。 - 福利方面:除常规医疗,401k,Meta 也不再是“0 员工自付”了,一些项目还需要共付。我自己也还在研究各家健康保险、宠物保险、育儿福利等。
事后感悟与小贴士
我会不断补充,以下是一些印象比较深的点:
- 主动联系:不必等论文都发了才去找人聊。我当时把很多未发表的想法放到博客里,供给招聘方参考。一般大家都很友好。
- 演示时长:最好控制在 40 分钟左右。我第一次做 45 分钟,最后发现装设备和回答问题会拖时间,弄得我手忙脚乱。
- 时间规划:尽量让各家公司在差不多时间进入 Offer 阶段,这样更方便对比与谈判,也减少多次延迟签约的麻烦。
- 诚实陈述技能范围:我并不熟悉 RLHF/RLAIF、大规模模型预训练,只做过 SFT/LoRA 等,我会直接说清楚。有些面试官很乐意帮你引导到你擅长的地方。
- 面试风格:如果遇到考“Constrained Decoding”等没做过的细分点,我就坦白自己只了解基本思路,没亲手实现过。
- 设计思路:系统设计面试时,先从最常见的传统方案说起,再逐渐扩展到新方法。
- 行为面试:熟悉 STAR(情景-任务-行动-结果)结构,并准备若干示例。
- 克服紧张:我面了数百小时也依旧紧张,建议多跟面试官沟通自己的想法、及时提问。卡壳时可以花几分钟静默整理或者请求提示。
- 学会倾听:当面试官出题不明确时,多问澄清问题。我以前会急着往下做。
- 记录与复习:我会把问题全部记在 Notion,事后上网或用 LLM 复盘,下次面试前再看。
- 管理邮箱:给面试相关邮件加专门标签或文件夹,不要像我一样最后邮件搜索一团乱。
- 保持信息更新:多关注最新文献,但不必只谈最前沿,也可先说基础发展,再说近几年衍生方向。
- 个人网站:哪怕只是篇快速的自我介绍,也能让对方更快了解你。Google Scholar 同理。
- 小细节:关掉所有会自动播放的视频或游戏声音的网页,别在面试中尴尬地播出声音。
写在最后
面试结果并非你能完全控制,有时候团队 HC(headcount)会突然取消,有时节日会拖延流程。但只要你准备充分,基本功扎实,再加上一点运气,大多能找到心仪的机会。至于我个人的备考方法,见: LLM (ML) Job Interviews - Resources](https://mimansajaiswal.github.io/posts/llm-ml-job-interviews-resources/)。
更多信息
如果你也想分享自己的面试经历,欢迎联系我们,我会整理到我的博客里,让更多人借鉴。希望避免新人因为不好意思开口求助而走许多弯路。
- Kyunghyun Cho在其博文中提到近期对研究生在 AI 行业求职的不安和焦虑感,令我感同身受:“对很多人而言,行业突然要求他们在大模型及其产品化上拿出实打实的成果。这与他们原本的学术工作或兴趣点并不完全契合,而适合他们的岗位也在快速减少。”参考:Kyunghyun 的博客如果你想做 LLM 产品化,或许机会不少;但若想坚持传统或纯学术研究,就会相对艰难。Peter Sobot 也评论说:“很多拿到 Offer 的研究员会发现自己其实在做落地产品,而不是做研究,会比较沮丧。”Chris Olah 则强调:“如果你要去产业界,就要想清楚,你是否喜欢团队作战/聚焦某些特定方向?你想加入哪些‘押注’?”
- Gowthami在推文中提到实习转正:“有些公司实习生转正比例很低,你要评估清楚是否会浪费宝贵毕业季机会,去一个最后仍需二次面试且竞争同样激烈的实习。”
- Nathan Lambert在文章和续篇中分享了其在 2022-2023 年从博士毕业到 AI 行业的求职体会。
- Yuan Meng关于 MLE 面试与职业路径的思考,见其博客1和博客2。
- Abhradeep Guha从面试官视角对比学术教职和工业研究岗,见此文。文中提到很多工业实验室也要求基础编程通关,否则即使研究很强也难通过。
(完)