LLM（机器学习）职位面试（2024年秋季）——流程回顾 [译]

原文：LLM (ML) Job Interviews (Fall 2024) - Process

这是我在 2024 年秋季面试以 ML/LLM 研究科学家/工程师为主要方向的职位时的经历分享。

导览

这篇文章分为两部分：

求职流程机制（包括背景、申请方式和行业信息），继续向下阅读即可。
准备资料与常见面试问题总览，见：LLM (ML) Job Interviews - Resources](https://mimansajaiswal.github.io/posts/llm-ml-job-interviews-resources/)

免责声明

最后更新：2024 年 12 月 24 日
本文仅是我个人的经验分享，供参考之用。由于 LLM 领域日新月异，具体信息可能很快失效，但其大体思路仍有参考价值。
通常我不会用 LLM 重写我的个人文章，但这次为了精炼和保持更专业的口吻，我结合了 Claude 3.5 Sonnet 和 GPT-4o 等模型对其进行大量编辑（而非生成）。
每个人的背景和情况不同，不保证我的流程对所有人都适用。

我发现网上有不少关于学术教职求职的信息或 Slack 群组分享，但很少看到关于工业界招聘，尤其是研究类岗位（如研究科学家/研究工程师）的具体面试经历。虽然研究方向和行业形态不断演进，但面试流程本身变化并不算特别大；无论是薪资结构、岗位责任还是面试环节，不同企业和团队都会有所差异。如果大家能在面试前就能获取一些更公开、可借鉴的信息，也许能更好地准备。

读者互动

“点击展开”以阅读由 Claude 生成的简短（<450字）总结，可帮你节省时间和 API 代币。相信我，我用了一个很有效的 Prompt。面试流程与阶段 - 初创公司（Startups）：面试流程通常不太规范，往往因公司所处阶段而异。你可能要经历 5-6 轮面试，包括 Leetcode 类型的代码挑战、ML 编程、ML 基础考核及文化契合度面试。有的公司还要求现场面试、多日工作试用或详尽汇报。角色通常比较宽泛。 - 独角兽公司（Unicorns，如 Anthropic、OpenAI、Scale AI 等）：整体结构较清晰，但每家仍有自身差别。一般会有编码面试（不一定是纯 Leetcode），ML 设计、LLM 讨论及演示环节。通常面试轮数很多，若申请多个团队，也可能把多轮合并。 - 大型科技公司（Big Tech，如 Meta、Amazon、Apple、Google、Microsoft 等）：流程更成熟且复杂，通常持续 1.5 到 2.5 个月。需准备 Leetcode 风格的编码面试、ML 系统设计、LLM 研究设计、汇报展示以及行为面试。面试既考查通用基础，也包含针对岗位的技术深度考核。

常见面试组成部分 1. 编程挑战：用数据结构与算法解决问题，Leetcode 练习必不可少。 2. ML 系统与设计面试：考察对机器学习概念、系统架构及解决方案设计能力。 3. 汇报展示：展示以往研究或项目，评估专业能力与沟通技巧。 4. 行为面试：评估团队契合度及思考方式。

公司类型差异 - 初创公司：流程往往更加灵活多变，偏好可多面手的人才。 - 独角兽：注重前沿技术与专业技能匹配，更倾向尖端研究或极具市场潜力的项目。 - 大厂：流程成熟、考核全面，既包含技术，也重视软技能和文化契合。

时间轴从开始面试到收到结果通常需要几周至几个月，遇到节假日或招聘旺季可能延迟。若拿到多个 offer，通常只有约一周的接受窗口，需要迅速决策或协调延长期。规划各家面试流程、并行管理多方进度也相当重要。

实际建议 - 充分准备：编码与系统设计要反复练习、熟悉常考点。 - 真实表达：如实介绍自己经验，不要夸大。 - 把握简历：优化 ATS 友好的简历，并通过人脉获得内推可能带来帮助。 - 高效安排：管理好投递节奏和面试日程，学习总结并适当调整准备策略。 - 跟进行业：多关注 ML/LLM 的最新进展与应用方向，以展示自身竞争力。 - 自我调适：面对连续面试要注意休息，维持正常的工作与生活节奏，发挥最佳表现。

我的诉求

欢迎有相似经历或想分享面试过程的朋友与我交流，比较我们各自的经历、提供补充信息。
如果你也有面向不同公司的面试流程或来自各种背景（不同的发表记录、专业方向或资历层次）的经历，希望能得到你们的补充。

我不想要什么

“你很蠢”之类的人身攻击；或对我选择的职业风险、LLM 时代到底要不要抓住机会、对比谁拿到更高薪等言论。
关于“某人的 tech 职场成功/失败”“GitHub 贡献度”或类似社会/政治话题。

求职背景

我于 2024 年 10 月左右开始寻找新工作，一是出于个人与职业规划的调整，二是希望在 LLM 领域拥有更多沉淀与成果。

关于我：如果你没看过我的公开简历，以下是简要概况。

近年我在 LLM 上发表过一些论文，过去也在语音处理和基于编码器（Bert 时代）的 NLP 方面有多篇发表。
我自己维护了一个博客，主要写案例研究和消融分析，而不是对常识性概念的重复讲解，并在一些主流 ML 会议的研讨会上投稿/录用。
我有一年全职（叠加一年独立研究）以及大约一年的实习经验，研究方向非常明确。
我还有一些尚未公开的工作，主要通过面试时的演示或邮件解释——因为我的当前发表记录无法完整代表我在 LLM 评测和 RAG（检索增强生成）中的相关经验。
在整个找工作的过程里，我常感到对“主动找人”颇为犹豫，担心自己简历不够完美。然而最终我发现，不主动联系其实更不理想；当我真的去联系时，大多数人都很乐意提供帮助。

职业偏好

想做面向更广泛人群的 LLM 项目，包括通用型应用或推动模型本身的研究/工程。对那种非常特定于客户定制的问题不太感兴趣，我更喜欢有一定“通用/长期影响力”的课题。
我对纯“AI 工程”或“LLM 工程”岗位兴趣有限（文中后面会讲原因），主要想找“产品驱动或好奇心驱动的研究工程/研究科学家”角色，不太介意公司规模大小。
我更希望团队内能有过 ML/LLM 研究经验的伙伴，便于在工作中一起头脑风暴、讨论复杂问题，而不是只有自己闷头干活。
我想在主要目标即团队研究项目中投入 3~6 个月甚至更长时间，能进行充分实验，而不是一味快节奏上线，避免只把研究工作碎片化或临时补丁式地并入产品。
我注重工作与生活平衡。理想的工作要能让我在业余时间继续做一些个人感兴趣的 AI 小实验、写博客，以及照顾我的猫。
我现居西雅图，与伴侣同住，因此不太愿意搬家，除非有非常契合我职业目标和个人情况的机会。
对个人价值观也有一定考量。例如对“AI 安全/安全研究”感兴趣的团队若侧重与我理念不符的方向，我就不会优先考虑。一些公司与我个人理念不合，也会影响我的决定。
我需要 H1B COE 和尽快启动绿卡流程，否则基本无从考虑。

求职流程

准备背景

我自己学东西的方式比较“边做边学”，包括研究也是如此。面试时往往会感觉紧张，特别是考到我意想不到的方向。我没有特别充分的面试经验，身边同辈在 PhD 毕业后大多早于两三年进入行业，当时整体招聘环境和面试要求都不同。所以当下能给我参考的“前人经验”并不多，尤其我又比较少主动问人，所以我只好在实践中摸索着调整，直到逐步清晰各公司真实的考察重点。

初步投递

我首先搜集与自身职业偏好契合的公司，通过 LinkedIn、Twitter 等查找岗位，部分也通过内部推荐（referral）。初创公司通常可通过在 LinkedIn 联系创始人；传统大公司可联系招聘者或经理；再加上常规的公司官网入口。从流程上看，我给许多公司都投过简历，有的也联系了 HR 或团队主管。

准备材料

追踪（Tracking）我用 Notion 做了一个简单的代办列表来追踪投递进展，分为：

“Applied/In Process”（已投/处理中）
“Waiting”（在等结果）
“Rejected/Offered”（已拒/拿到offer）。

虽然只是一页简单的记录，但好处是可以把公司信息、截图下来的职位描述等都集中放在一起，方便复习面试要点。还可以防止误重复投递到被拒的同一岗位（有些招聘系统会允许重复申请）。最终我只在真正排定面试后才把具体日程加到日历里。

回答招聘问卷在正式申请里往往会遇到类似的问题（如“你为何适合此岗位？”“请简要介绍你自己”之类），我没有使用 AI 生成答案，而是自己口述，然后用 AI 检查语法或拼写错误，但不会让其代写内容。

因为很多公司会多次问到这些问题，也便于我后续面试时更熟练地阐述。
我会把自己写过的问答保存到 Notion，以便今后碰到相似问题时参考。

简历我的简历在我个人主页可看到（LaTeX 排版）。我最大的痛点是多栏布局被 ATS 扫描器解析得一团糟，导致关键信息可能被漏掉。若重来一次，我会花时间做一份更友好的简历（例如用 Typst）以适配 ATS，毕竟手动一次次改格式非常麻烦。我打算之后找个时间专门整理好一套通用模板分享，也建议大家平时把 LinkedIn 也填好，以便快速自动填写繁琐的网申。

短简介（Short Blurb）给自己写一小段三五行的“自我介绍”很有用。刚开始的几周我改过很多次，最后才定稿。不过我依然倾向于话比较多（就像这篇博文一样），如果能再更精简一些会更好。当我给经理或招聘方写消息时，会在正文中简短介绍自己、说明为何适合这个岗位，然后附上这段概要介绍与简历。以下是我最后定稿的（英文）简短介绍——示例供参考：

（此处省略英文 Blurb，仅保留中文概念性的表述）“我的工作主要聚焦 LLM 的三个方向：合成数据生成与筛选、LLM Orchestration/Agent、以及健壮且可落地的评估与基准测试……”（后续详细展开）汇报展示（Presentation）令我意外的是，在不是纯研究 Scientist 岗位的面试中（例如 MLE、研究工程师、应用科学家）也被要求做 40 分钟左右的汇报演示，并留 15 分钟问答——其实属于“带深度的技术陈述”。由于我很多 LLM 相关成果尚未发表，所以我花了些功夫把零碎的研究点拼接成一个连贯故事。可惜这些未发表内容无法公开分享 PPT；但对读者来说，如果你正好在读博或做完一段研究项目，应该可以用论文答辩或研讨会的材料改一改来面试。要注意时长控制，最好 40 分钟左右，包含相关数据图与结果分析。

其他材料除了上面提到的，我只为微软的某个特定岗位写过一份研究计划书（research proposal）。大部分公司不需要这类文档。而 Cover Letter（求职信）我也都没写，主要时间来不及，且很多公司也不强制。

安排面试

我当时排得非常紧张，每天几乎要面六个小时，持续了 12 周。不过这并不一定适合所有人。如果你时间不充裕，没必要排得那么满，但我想尽快在实战中总结经验。

招聘方一般会问你未来两周的可选面试日期；有时如果你有多个机会并行推进，必须学会管理时间，以免错过时机。
大厂的流程往往更漫长（1.5 - 2.5个月），初创公司可能短一些，但也可能灵活度较大。
以下这张截图（英文原文中）显示了我 10 月份的日历，大量一小时区块都被各种面试占据。

行业信息

如果你对行业内公司面试形态有所了解，可以跳过这部分。我自己在摸索中学到不少东西，想分享给同样处于困惑期的人。

免责声明：

我并不是学术大牛，没有高引用量的顶会论文，也没有大佬内推。因此我的经历更多是面对“普通中高水平”候选人的流程，也许对顶尖背景或内部强推者不适用。
各公司面试薪资和等级因人而异，这里只分享我的实际体验以及一些行业普遍现象。
我确实拿到一些 Offer，但并非惊天的高薪，也不算“人人都抢”的明星候选人，因此更接近普通背景求职者的情况。

初创公司（Startups）

初创公司面试流程初创公司通常流程不够统一，取决于它们的融资轮次和团队规模。有的要求线下面试（甚至多日），有的还要求多天“试工”之类；也见过要提供大量参考人信息（references）等。

大部分公司会安排 5~6 轮面试，包含通用编码（Leetcode）+ ML 编码 + ML 理论 + 文化契合度。
也存在公司一上来就告诉你“我们每周工作 6~7 天、每天 12 小时”之类，我一般就不考虑了。
还有一些公司职位名称写着“AI Research Scientist”或“AI Research Engineer”，但内部其实更多是“把现有研究工程化”或“根据客户定制”，而非真正产出新的研究论文或方法。如果你在意做“研究型”还是“工程实现型”，务必要仔细确认。

举个例子：Galileo 曾给我发过一封邮件，说他们关闭了 “Senior ML Research Scientist” 职位，改招 “Senior Applied AI Researcher”，并明确强调新职位更偏“面向产品和大规模上线”，这是我比较欣赏的坦诚，虽然命名方式依旧可能让人混淆。

我在初创公司面试中的一些例子 - 好的体验：[Offer]Salient：面试流程简洁，需求明确，团队对研究与产品定位也讲得很清楚。Resolve AI：面试官包括 HR 都非常友好，内容侧重真实工作案例，编码环节则考察 ML 设计思路。Haize：虽然个人不太能接受他们的工作强度，但公司确有在做真正的研究。Descript：只有一轮面试，但聚焦具体需求，很直接。Contextual AI：ML 编码题是复现论文核心想法，有完备的题目描述，我觉得这种形式很好，尽管我没通过。Sierra AI：创始团队里有人参与过 GPT 等重量级论文；他们的流程：一次 HM 沟通、一次 30 分钟汇报 + 15 分钟 Q&A、1 小时研究面试、2 小时 ML 编码（含训练模型/实验）、以及跟创始人的 1v1 面谈。我只做完了初步轮次，后因他们坚持要线下现场面试而作罢。 - 不太好的体验：有些公司主动在 LinkedIn 上联系我，面了三轮就杳无音信；也有投完简历后经历两三轮又消失不见。有家公司要我做一场“云端调用大模型”的限时测试，却不提供 API key，得我自己掏钱？还有公司安排了四轮面试+四天作业+两小时汇报，最终却以“经验不足”为由拒绝，明明从简历就知道我工作年限…有的面试官明显在面试时就不想录用你，全程只是在解释为什么你不合适。有家说我“沟通风格不符”，在面试结束 5 分钟后就拒了我，也不给反馈。也有 HM（Hiring Manager）聊完觉得我不合适，但又把我转到另一个团队，结果那边也是一轮完就拒，还不解释。

初创公司如何拿内推初创公司在 LinkedIn 和 Twitter 上常会发招聘贴；如果你能直接联系到创始人或团队领导，是最快速的渠道。有时也会有外部猎头发布较笼统的职位描述，这些往往对应的是小规模公司或处于种子期/隐形（stealth）状态的创业团队。

初创公司 Offer 与工作政策 - 总部通常在纽约或旧金山，多数不支持远程或异地。 - Base 薪一般在 15 万～25 万美元间，配合 0.2%～0.5% 的期权。 - 绝大部分提供医疗保险，但 401k 有些有配套、有些则没有；“无限 PTO”听起来好，但很多忙碌的初创公司实际并不会让你随便休。 - 搬迁补贴也因公司而异。

独角兽公司（Unicorns）

我在这次找工作期间，和三家独角兽公司有过面试往来：Anthropic（其实是 2024 年 4 月开始的）、OpenAI 和 Scale（Figma 在 2023 年秋面试过一次，没过）。此外没怎么接触别的独角兽。

独角兽公司的面试流程 - Anthropic：我当时面了 3 轮 OOP 编程，接着是一个虚拟“现场面试”，包含 7 轮子面试：ML 编码、LLM 考察、ML 理论和文化契合等；虽然很累，但面试官都很专业。 - OpenAI：我投了 Research Scientist/Research Engineer，第一关就是数学+LLM 编码，并没有先来一个纯通用的代码面试。我第一次被拒后，他们说可以转投另一个“MLE”岗（在旧金山），但需再做一轮筛选再加 4-5 轮面试。我没继续。 - Scale：初筛后面了两轮，若通过还要再进行最终面试。面试官都挺友善且问题很贴近实际。 - 这三家奇怪的是，很多题并不是传统 Leetcode；OpenAI 甚至允许你查资料（不能用 LLM 工具）。 - 他们有时会把同一人引向多个团队并行面试，如 Anthropic 若多团队感兴趣，会统一拉进一整套多轮面试中。

具体见闻 - 优点题目设计更偏实际应用，整体氛围较专业；Anthropic 的面试尤其让我印象很好。OpenAI 在拒掉 RS/RE 后，依然会积极帮你对接其他岗位。Scale AI 的面试官在 ML 编码环节非常耐心。 - 不足Anthropic 面试轮数较多，前后拉了好几个月，确实蛮折腾。Scale 有时回复较慢，曾经两三周无消息，后来我又催了一次才继续。OpenAI 多数岗位仍要求在旧金山办公，虽然他们在西雅图也有点人，但正式 headcount 很少。

独角兽公司的内推 - Anthropic、OpenAI 都是我在官网直接投递，然后非常认真地填写了各种问答。Scale 则是外部猎头联系到我。 - 若有内部熟人或导师同事认识人选，可以帮忙推，一般能更快得到回应。

独角兽公司 Offer 与工作政策我没拿到这三家最终 Offer，薪资不清楚。网上能搜到一些区间信息。

Anthropic 和 Scale 在西雅图有一定团队，但 OpenAI 基本集中在旧金山。
他们一般都有 401k match 和医疗保险，“无限 PTO” 也常见，但实际休假如何则要看文化。

大公司（Big Tech）

我面试或沟通过的大公司包括：Meta（LLama 团队）、Amazon（Alexa LLM 及 Ads）、Apple（AIML 事业部不同团队、以及一个合同岗）、Google（Gemini）、Tencent、ServiceNow、Microsoft（Bing、Office、MSR）、PayPal、Tiktok（今年 7 月时）、Netflix（Content & Studio）等。我没顾上投 Adobe、Huawei、LG、Samsung、Bloomberg、Sony 等，但这些也有不错的 ML/LLM 团队。

大厂面试流程概况各家流程互不相同，而且同家公司内部也会对候选人有不同要求。

单一面试循环：一些公司（如 Google、Meta、Amazon、PayPal、Tencent）只让你并行面试一个团队；若想再面另一个团队，可能会额外插一两轮或被系统限制。
多重并行：Apple 允许你同时面多个团队，但只会给你一个最终 Offer；微软允许你并行多岗，Meta 也可以面完之后再看能不能挪到相近团队。
整个流程通常要 1.5~2.5 个月，还有节假日和会议季（如 NeurIPS）会拖延。
大体而言，你肯定会碰到 Leetcode 编程、ML/LLM 相关系统设计、研究讨论、展示汇报、行为面试等组合。

下面是我一些更具体的流程总结：

简要版（由 GPT4o 生成）Meta：经内推面试，不确定是 RS 还是 RE 岗。流程：HM 沟通 → 演示汇报 → 3 轮 ML 设计（含 LLM 面向）→ 1 轮通用编码（Leetcode 两题）→ 1 轮行为面试。Amazon：初步筛选 → 编码面试 → 演示汇报 → 六轮技术面试（ML 设计、LLM 原理、系统设计），并结合 Leadership 原则考察。Apple：可能分不同团队；如 Team 3：两轮筛选（HM 聊天 & ML 编码）后四轮现场（行为、ML、编码、DS&A）；Team 1：多达 12 轮，包括面试官/经理/总监等层层深入；有的团队需做演示。Google：跳过初步筛选，但要做人格问卷；正式环节含一场汇报 + 5 轮面试（2 Leetcode、2 研究、1 行为）。Tencent：初步筛选后，要求做汇报 + 六次一对一面谈（ML 理论、研究深度、数学统计、Leetcode 等）。Microsoft：Team 1 走一个流程（5 轮面试，含 3 轮 Leetcode），Team 2 另一个流程（4 轮更偏 ML），MSR AI 某团队需要做 Demo 原型、然后 5 轮专业面试。PayPal：初步两轮过滤，再三轮面试（编码、ML 讨论、行为面试）。Netflix：HM 首聊后通常还有过滤环节，再四轮面试（编码、ML、行为等），我因时间原因没继续。我在大厂面试的详细经历 - Meta[Offer]：我先跟 HM 聊，再做了 45 分钟的研究演示，然后有 3 轮 ML 设计（其中一轮和我领域高度相关，另两轮是通用 LLM 设计），以及一轮通用 Leetcode（两道题）+ 一轮行为面试。可惜面试结束时，该团队满编，后来招聘方试图帮我挪去同一部门的另一个团队。 - Amazon[Offer]：先是一个筛选面谈，然后是一轮代码面试，之后要做研究汇报，有 6 轮技术加领导力面试，涵盖 ML 宽度与深度，LLM 原理和系统设计，没考 ML 编码，但数据结构考察挺多。 - Apple：Team 1[Offer]：我面了整整 12 轮！包含：招聘方初筛，HM 初筛，ML 基础+编码过滤，研究汇报，5 轮加面（ML 深度、ML 宽度、编码、ML 编码、系统设计），之后又和 HM 复盘，接着跟二级经理、LLM 专家和部门总监都谈了一圈…虽然团队非常有趣，但他们想让我去湾区办公。Team 2：只进行了一轮 Leetcode，没过。Team 3：HM 聊天 + 团队访谈（ML 编程）→ 4 轮现场面试（行为、ML 理论、ML 编码、数据结构），最后没给 Offer。合同岗：做了 4 轮技术访谈（其中一轮 ML 编码），团队不错，可惜合同工在薪资和签证方面都不够有吸引力。 - Google：因为时机问题跳过了初步面试，但要先做了一个奇怪的个性测评问卷，然后是 1 场研究汇报 + 5 轮面试（2 Leetcode、2 研究、1 行为），其中没有 ML 编码部分。 - Tencent：筛选 → 演示 → 6 轮一对一，涵盖研究深度、数学统计、Leetcode 等。 - Microsoft：Team 1：HM 筛选 + 5 轮面试（含 3 轮 Leetcode），偶尔插入一些 ML 讨论。Team 2：HM 筛选 + 4 轮偏 ML 的面试，只有一轮编码。MSR AI Team 2：包括 1 轮 HM 谈话，接着一场面试“秀 Demo”以及 5 轮深度问答，包含研究演示和 OOP 编程，最后我被拒，感觉自己表现挺好还是蛮可惜。MSR AI Team 1：只面了 HM，一直到 2 个月后才得知拒信。 - PayPal[Offer]：两轮初步筛选，再 3 轮面试（编码、ML、行为），最后给了 Offer，但岗位在旧金山，不含搬家支持。 - Tiktok：今年 7 月面试了 1 次 HR + 2 次编码/ML + 1 次 HM LLM/系统设计，我没通过。 - Netflix：只做了 HM 首轮沟通，后续因安排冲突没继续。

大厂的正反面体验 - 优点面试官大多专业且已看过你的简历；气氛较和谐，也不会太刁难。题目虽有些 Leetcode 偏难，但大部分问题更贴合实际；有的面试官还会在你卡住时给提示。Microsoft Team 2、MSR AI Team 2 这两个团队给我的面试体验都不错，很尊重我的特长点。 - 不足我有被“放鸽子”三次，一次还在全程面了六七轮后，就再无消息。有一支 Apple 团队面到 12 轮，有点耗时过长。部分 Offer 给我的“考虑时限”只有 7 天，需要和对方谈延期。Google 这边改过两次面试时间，Microsoft Team 1 也会在流程中突然改我面试顺序或岗位归属。Amazon 最初跟我谈的是 Alexa LLM 表达情感方向，结果中途把我转去做广告业务，导致后面的面试问题很多跟 LLM 不相关。

大厂内推 - Meta：我最初八个月前就自己投了简历，无果。后来通过一个引用我论文的朋友联系到团队，再拿到内部推荐，才开始正式面。 - Amazon：本想面 Alexa LLM，但中途被莫名转到广告组。我很不甘心，就找了内推和其他 HR 反映，最后他们破例给我安排另一轮面试。 - Apple：我有两次是被熟人内推，结果石沉大海；反倒是没内推的岗位给了我机会。我被一个团队拒后，AIML 那边又联系说有另一支团队（Measurement）对我感兴趣。有个合同岗也是我在 LinkedIn 主动找到负责人。 - Google：先是学术熟人内推投了三个岗位没消息，后来通过导师以前的实验室同僚认识了做 Gemini 的员工，才算有了新进展。 - Microsoft：投了很多岗位，有的带内推，有的没带。反而是我私下在 Twitter 联系到的一个招聘经理更快给我安排面试。 - Netflix：网上申请后无回音，后来索性跟一个内部朋友聊了，他给了我一个 referral link 才收到回复。

大厂 Offer 与工作政策 - 多数大厂在西雅图、湾区、纽约等都有分部，但是否能异地办公得看团队意愿。 - 我实际拿到的几个大厂 Offer，结合 4 年总包（Base + RSU + 签字费 + 刷新包 + Bonus），大概在 35 万～43 万美元/年区间；Amazon 算法有点不一样，他们前两年给较高签字费，然后第三第四年期权才开始充分兑现；Meta 没有 Cliff，RSU 提前分批发，Apple 跟 Microsoft 还多一个 ESPP 购买计划。 - 许多团队并不真正允许远程，Amazon 官方说要全员回办公室，但执行细节不一。Meta、Apple 要求一周至少三天到岗。Netflix、部分 Microsoft 团队会更灵活一些。 - 福利方面：除常规医疗，401k，Meta 也不再是“0 员工自付”了，一些项目还需要共付。我自己也还在研究各家健康保险、宠物保险、育儿福利等。

事后感悟与小贴士

我会不断补充，以下是一些印象比较深的点：

主动联系：不必等论文都发了才去找人聊。我当时把很多未发表的想法放到博客里，供给招聘方参考。一般大家都很友好。
演示时长：最好控制在 40 分钟左右。我第一次做 45 分钟，最后发现装设备和回答问题会拖时间，弄得我手忙脚乱。
时间规划：尽量让各家公司在差不多时间进入 Offer 阶段，这样更方便对比与谈判，也减少多次延迟签约的麻烦。
诚实陈述技能范围：我并不熟悉 RLHF/RLAIF、大规模模型预训练，只做过 SFT/LoRA 等，我会直接说清楚。有些面试官很乐意帮你引导到你擅长的地方。
面试风格：如果遇到考“Constrained Decoding”等没做过的细分点，我就坦白自己只了解基本思路，没亲手实现过。
设计思路：系统设计面试时，先从最常见的传统方案说起，再逐渐扩展到新方法。
行为面试：熟悉 STAR（情景-任务-行动-结果）结构，并准备若干示例。
克服紧张：我面了数百小时也依旧紧张，建议多跟面试官沟通自己的想法、及时提问。卡壳时可以花几分钟静默整理或者请求提示。
学会倾听：当面试官出题不明确时，多问澄清问题。我以前会急着往下做。
记录与复习：我会把问题全部记在 Notion，事后上网或用 LLM 复盘，下次面试前再看。
管理邮箱：给面试相关邮件加专门标签或文件夹，不要像我一样最后邮件搜索一团乱。
保持信息更新：多关注最新文献，但不必只谈最前沿，也可先说基础发展，再说近几年衍生方向。
个人网站：哪怕只是篇快速的自我介绍，也能让对方更快了解你。Google Scholar 同理。
小细节：关掉所有会自动播放的视频或游戏声音的网页，别在面试中尴尬地播出声音。

写在最后

面试结果并非你能完全控制，有时候团队 HC（headcount）会突然取消，有时节日会拖延流程。但只要你准备充分，基本功扎实，再加上一点运气，大多能找到心仪的机会。至于我个人的备考方法，见： LLM (ML) Job Interviews - Resources](https://mimansajaiswal.github.io/posts/llm-ml-job-interviews-resources/)。

2024年秋季LLM（机器学习）职位面试流程回顾 [译]