⽂章有点⻓,请耐⼼看完,绝对有收获!不想听我BB直接进⼊⾯试分享:
- 准备过程 蚂蚁⾦服⾯试分享 拼多多⾯试分享 字节跳动⾯试分享 最后总结个人所得(供大家参考学习)
当时我⾃⼰也准备出去看看机会,顺便看看⾃⼰的实⼒。当时我其实挺纠结的,⼀⽅⾯现在部⻔也正需要我,还是可以有⼀番作为的,另⼀⽅⾯觉得近⼀年来进步缓慢,没有以前⻜速进步的成就感了,⽽且业务和技术偏于稳定,加上⾃⼰也属于那种⽐较懒散的⼈,⻣⼦⾥还是希望能够突破现状,持续在技术上有所精进
那么问题来了,⽬标是啥?就我⽽⾔,短期⽬标是深⼊研究某⼀项技术,⽐如最近在研究mysql,那么深⼊研究⼀定要动⼿实践并且有所产出,这就够了么?还需要我们能够举⼀反三,结合实际开发场景想⼀想⽇常开发要注意什么,这中间有没有什么坑?可以看出,要进步真的不是⼀件简单的事,这种反⼈类的⾏为需要我们克服⾃我的弱点,逐渐形成习惯。真正⽜逼的⼈,从不觉得认真学习是⼀件多么难的事,因为这已经形成了他的习惯,就喝早上起床刷⽛洗脸那么⾃然简单。
扯了那么多,开始进⼊正题,先后进⾏了蚂蚁、拼多多和字节跳动的⾯试。
逆⻛⽽⾏!从考研失败到收获到⾃⼰满意的Offer,分享⼀下⾃⼰的经历!
蚂蚁⾦服
- ⼀⾯ ⼆⾯ 三⾯ 四⾯ ⼩结
蚂蚁一面
⼀⾯就做了⼀道算法题,要求两⼩时内完成,给了⻓度为N的有重复元素的数组,要求输出第10⼤的数。典型的TopK问题,快排算法搞定。算法题要注意的是合法性校验、边界条件以及异常的处理。另外,如果要写测试⽤例,⼀定要保证测试覆盖场景尽可能全。加上平时刷刷算法题,这种考核应该没问题的。
蚂蚁二面
- ⾃我介绍下呗 开源项⽬贡献过代码么?(Dubbo提过⼀个打印accesslog的bug算么) ⽬前在部⻔做什么,业务简单介绍下,内部有哪些系统,作⽤和交互过程说下 Dubbo踩过哪些坑,分别是怎么解决的?(说了异常处理时业务异常捕获的问题,⾃定义了⼀个异常拦截器) 开始进⼊正题,说下你对线程安全的理解(多线程访问同⼀个对象,如果不需要考虑额外的同步,调⽤对象的⾏为就可以获得正确的结果就是线程安全) 事务有哪些特性?(ACID) 怎么理解原⼦性?(同⼀个事务下,多个操作要么成功要么失败,不存在部分成功或者部分失败的情况) 乐观锁和悲观锁的区别?(悲观锁假定会发⽣冲突,访问的时候都要先获得锁,保证同⼀个时刻只有线程获得锁,读读也会阻塞;乐观锁假设不会发⽣冲突,只有在提交操作的时候检查是否有冲突)这两种锁在Java和MySQL分别是怎么实现的?(Java乐观锁通过CAS实现,悲观锁通过synchronize实现。mysql乐观锁通过MVCC,也就是版本实现,悲观锁可以通过select… forupdate加上排它锁) HashMap为什么不是线程安全的?(多线程操作⽆并发控制,顺便说了在扩容的时候多线程访问时会造成死锁,会形成⼀个环,不过扩容时多线程操作形成环的问题再JDK1.8已经解决,但多线程下使⽤HashMap还会有⼀些其他问题⽐如数据丢失,所以多线程下不应该使⽤HashMap,⽽应该使⽤ConcurrentHashMap)怎么让HashMap变得线程安全?(Collections的synchronize⽅法包装⼀个线程安全的Map,或者直接⽤ConcurrentHashMap)两者的区别是什么?(前者直接在put和get⽅法加了synchronize同步,后者采⽤了分段锁以及CAS⽀持更⾼的并发) jdk1.8对ConcurrentHashMap做了哪些优化?(插⼊的时候如果数组元素使⽤了红⿊树,取消了分段锁设计,synchronize替代了Lock锁)为什么这样优化?(避免冲突严重时链表多⻓,提⾼查询效率,时间复杂度从O(N)提⾼到O(logN)) redis主从机制了解么?怎么实现的? 有过GC调优的经历么?(有点虚,答得不是很好) 有什么想问的么?
蚂蚁三面
- 简单⾃我介绍下 监控系统怎么做的,分为哪些模块,模块之间怎么交互的?⽤的什么数据库?(MySQL)使⽤什么存储引擎,为什么使⽤InnnoDB?(⽀持事务、聚簇索引、MVCC) 订单表有做拆分么,怎么拆的?(垂直拆分和⽔平拆分) ⽔平拆分后查询过程描述下 如果落到某个分⽚的数据很⼤怎么办?(按照某种规则,⽐如哈希取模、range,将单张表拆分为多张表) 哈希取模会有什么问题么?(有的,数据分布不均,扩容缩容相对复杂 ) 分库分表后怎么解决读写压⼒?(⼀主多从、多主多从) 拆分后主键怎么保证位置?(UUID、Snowflake算法) Snowflake⽣成的ID是全局递增唯⼀么?(不是,只是全局唯⼀,单机递增) 怎么实现全局递增的唯⼀ID?(讲了TDDL的⼀次取⼀批ID,然后再本地慢慢分配的做法) Mysql的索引结构说下(说了B+树,B+树可以对叶⼦结点顺序查找,因为叶⼦结点存放了数据结点且有序) 主键索引和普通索引的区别(主键索引的叶⼦结点存放了整⾏记录,普通索引的叶⼦结点存放了主键ID,查询的时候需要做⼀次回表查询)⼀定要回表查询么?(不⼀定,当查询的字段刚好是索引的字段或者索引的⼀部分,就可以不⽤回表,这也是索引覆盖的原理) 你们系统⽬前的瓶颈在哪⾥? 你打算怎么优化?简要说下你的优化思路 有什么想问我么?
蚂蚁四面
- 介绍下⾃⼰ 为什么要做逆向? 怎么理解微服务? 服务治理怎么实现的?(说了限流、压测、监控等模块的实现) 这个不是中间件做的事么,为什么你们部⻔做?(当时没有单独的中间件团队,微服务刚搞不久,需要进⾏监控和性能优化) 说说Spring的⽣命周期吧 说说GC的过程(说了young gc和full gc的触发条件和回收过程以及对象创建的过程) CMS GC有什么问题?(并发清除算法,浮动垃圾,短暂停顿) 怎么避免产⽣浮动垃圾?(记得有个VM参数设置可以让扫描新⽣代之前进⾏⼀次young gc,但是因为gc是虚拟机⾃动调度的,所以不保证⼀定执⾏。但是还有参数可以让虚拟机强制执⾏⼀次young gc) 强制young gc会有什么问题?(STW停顿时间变⻓) 知道G1么?(了解⼀点 ) 回收过程是怎么样的?(young gc、并发阶段、混合阶段、full gc,说了Remember Set) 你提到的Remember Set底层是怎么实现的? 有什么想问的么?
⼩结
蚂蚁⾯试⽐较重视基础,所以Java那些基本功⼀定要扎实。蚂蚁的⼯作环境还是挺赞的,因为我⾯的是稳定性保障部⻔,还有许多单独的⼩组,什么三年1班,很有⻘春的感觉。⾯试官基本⽔平都⽐较⾼,基本都P7以上,除了基础还问了不少架构设计⽅⾯的问题,收获还是挺⼤的。
拼多多
- ⾯试前 ⼀⾯ ⼆⾯ 三⾯ ⼩结
⾯试前
拼多多一面:
- Java中的HashMap、TreeMap解释下?(TreeMap红⿊树,有序,HashMap⽆序,数组+链表) TreeMap查询写⼊的时间复杂度多少?(O(logN)) HashMap多线程有什么问题?(线程安全,死锁)怎么解决?( jdk1.8⽤了synchronize + CAS,扩容的时候通过CAS检查是否有修改,是则重试)重试会有什么问题么?(CAS(Compare And Swap)是⽐和交换,不会导致线程阻塞,但是因为重试是通过⾃旋实现的,所以仍然会占⽤CPU时间,还有ABA的问题)怎么解决?(超时,限定⾃旋的次数,ABA可以通过原理变量AtomicStampedReference解决,原理利⽤版本号进⾏⽐)超过重试次数如果仍然失败怎么办?(synchronize互斥锁) CAS和synchronize有什么区别?都⽤synchronize不⾏么?(CAS是乐观锁,不需要阻塞,硬件级别实现的原⼦性;synchronize会阻塞,JVM级别实现的原⼦性。使⽤场景不同,线程冲突严重时CAS会造成CPU压⼒过⼤,导致吞吐量下降,synchronize的原理是先⾃旋然后阻塞,线程冲突严重仍然有向滔的吞吐量,因为线程都被阻塞了,不会占有CPU ) 如果要保证线程安全怎么办?(ConcurrentHashMap) ConcurrentHashMap怎么实现线程安全的?(分段锁) get需要加锁么,为什么?(不⽤,volatile关键字) volatile的作⽤是什么?(保证内存可⻅性) 底层怎么实现的?(说了主内存和⼯作内存,读写内存屏障,happen-before,并在纸上画了线程交互图) 在多核CPU下,可⻅性怎么保证?(思考了⼀会,总线嗅探技术) 聊想聊,系统之间是怎么交互的? 系统并发多少,怎么优化? 给我⼀张纸,画了⼀个九⽅格,都填了数字,给⼀个MN矩阵,从1开始逆时针打印这MN个数,要求时间复杂度尽可能低(内⼼OS:之前貌似碰到过这题,最优解是怎么实现来着)思考中。。。 可以先说下你的思路(想起来了,说了什么时候要变换⽅向的条件,向右、向下、向左、向上,依此循环) 有什么想问我的?
拼多多二面:
- ⾃我介绍下 ⼿上还有其他offer么?(拿了蚂蚁的offer) 部⻔组织结构是怎样的?(这轮不是技术⾯么,不过还是⽼⽼实实说了) 系统有哪些模块,每个模块⽤了哪些技术,数据怎么流转的?(⾯试官有点秃顶,⼀看级别就很⾼)给了我⼀张纸,我在上⾯简单画了下系统之间的流转情况 链路追踪的信息是怎么传递的?(RpcContext的attachment,说了Span的结构:parentSpanId +curSpanId) SpanId怎么保证唯⼀性?(UUID,说了下内部的定制改动) RpcContext是在什么维度传递的?(线程) Dubbo的远程调⽤怎么实现的?(讲了读取配置、拼装url、创建Invoker、服务导出、服务注册以 及消费者通过动态代理、filter、获取Invoker列表、负载均衡等过程(哗啦啦讲了10多分钟),我可以喝⼝⽔么 Spring的单例是怎么实现的?(单例注册表) 为什么要单独实现⼀个服务治理框架?(说了下内部刚搞微服务不久,主要对服务进⾏⼀些监控和性能优化) 谁主导的?内部还在使⽤么? 你向有想过怎么做成通航么? 有什么想问的么?
拼多多三面:
⼆⾯⽼⼤⾯完后就直接HR⾯了,主要问了些职业发展、是否有其他offer、以及⼊职意向等问题,顺便说了下公司的福利待遇等,都⽐较常规啦。不过要说的是⼿上有其他offer或者⼤⼚经历会有⼀定加分
拼多多的⾯试流程就简单许多,毕竟是⼀个成⽴四年多的公司。⾯试难度中规中矩,只要基础扎实应该不是问题。但不得不说⼯作强度很⼤,开始⾯试前HR就提前和我确认能否接受这样强度的⼯作,想来的⽼铁还是要做好准备
字节跳动
- ⾯试前 ⼀⾯ ⼆⾯ ⼩结
⾯试前
头条的⾯试是三家⾥最专业的,每次⾯试前有专⻔的HR和你约时间,确定OK后再进⾏⾯试。每次都是通过视频⾯试,因为都是之前都是电话⾯或现场⾯,所以视频⾯试还是有点不⾃然。也有⼈觉得视频⾯试体验很赞,当然萝⼘⻘菜各有所爱。最坑的⼆⾯的时候对⽅⾯试官的⽹络⽼是掉线,最后很冤枉的挂了(当然有⼀些点答得不好也是原因之⼀)。所以还是有点遗憾的。
字节一面:
- 先⾃我介绍下 聊项目,逆向系统是什么意思 聊项目,逆向系统用了哪些技术 线程池的线程数怎么确定? 如果是IO操作为主怎么确定? 如果计算型操作⼜怎么确定? Redis熟悉么,了解哪些数据结构?(说了zset) zset底层怎么实现的?(跳表) 跳表的查询过程是怎么样的,查询和插⼊的时间复杂度?(说了先从第⼀层查找,不满⾜就下沉到第⼆层找,因为每⼀层都是有序的,写⼊和插⼊的时间复杂度都是O(logN)) 红⿊树了解么,时间复杂度?(说了是N叉平衡树,O(logN)) 既然两个数据结构时间复杂度都是O(logN),zset为什么不⽤红⿊树(跳表实现简单,踩坑成本低,红⿊树每次插⼊都要通过旋转以维持平衡,实现复杂) 点了点头,说下Dubbo的原理?(说了服务注册与发布以及消费者调⽤的过程)踩过什么坑没有?(说了dubbo异常处理的和打印accesslog的问题) CAS了解么?(说了CAS的实现)还了解其他同步机制么?(说了synchronize以及两者的区别,⼀个乐观锁,⼀个悲观锁) 那我们做⼀道题吧,数组A,2*n个元素,n个奇数、n个偶数,设计⼀个算法,使得数组奇数下标位置放置的都是奇数,偶数下标位置放置的都是偶数 先说下你的思路(从0下标开始遍历,如果是奇数下标判断该元素是否奇数,是则跳过,否则从该位置寻找下⼀个奇数) 下⼀个奇数?怎么找?(有点懵逼,思考中。。) 有思路么?(仍然是先遍历⼀次数组,并对下标进⾏判断,如果下标属性和该位置元素不匹配从当前下标的下⼀个遍历数组元素,然后替换) 你这样时间复杂度有点⾼,如果要求O(N)要怎么做(思考⼀会,答道“定义两个指针,分别从下标0和1开始遍历,遇⻅奇数位是是偶数和偶数位是奇数就停下,交换内容”) 时间差不多了,先到这吧。你有什么想问我的?
字节二面:
- ⾯试官和蔼很多,你先介绍下⾃⼰吧 你对服务治理怎么理解的? 项⽬中的限流怎么实现的?(Guava ratelimiter,令牌桶算法) 具体怎么实现的?(要点是固定速率且令牌数有限) 如果突然很多线程同时请求令牌,有什么问题?(导致很多请求积压,线程阻塞) 怎么解决呢?(可以把积压的请求放到消息队列,然后异步处理) 如果不⽤消息队列怎么解决?(说了RateLimiter预消费的策略) 分布式追踪的上下⽂是怎么存储和传递的?(ThreadLocal + spanId,当前节点的spanId作为下个节点的⽗spanId) Dubbo的RpcContext是怎么传递的?(ThreadLocal)主线程的ThreadLocal怎么传递到线程池?(说了先在主线程通过ThreadLocal的get⽅法拿到上下⽂信息,在线程池创建新的ThreadLocal并把之前获取的上下⽂信息设置到ThreadLocal中。这⾥要注意的线程池创建的ThreadLocal要在finally中⼿动remove,不然会有内存泄漏的问题) 你说的内存泄漏具体是怎么产⽣的?(说了ThreadLocal的结构,主要分两种场景:主线程仍然对ThreadLocal有引⽤和主线程不存在对ThreadLocal的引⽤。第⼀种场景因为主线程仍然在运⾏,所以还是有对ThreadLocal的引⽤,那么ThreadLocal变量的引⽤和value是不会被回收的。第⼆种场景虽然主线程不存在对ThreadLocal的引⽤,且该引⽤是弱 引⽤,所以会在gc的时候被回收,但是对⽤的value不是弱引⽤,不会被内存回收,仍然会造成内存泄漏) 线程池的线程是不是必须⼿动remove才可以回收value?(是的,因为线程池的核⼼线程是⼀直存在的,如果不清理,那么核⼼线程的threadLocals变量会⼀直持有ThreadLocal变量) 那你说的内存泄漏是指主线程还是线程池?(主线程 ) 可是主线程不是都退出了,引⽤的对象不应该会主动回收么?(⾯试官和内存泄漏杠上了),沉默了⼀会。。。 那你说下SpringMVC不同⽤户登录的信息怎么保证线程安全的?(刚才解释的有点懵逼,⼀下没反应过来,居然回答成锁了。⼤脑有点晕了,此时已经⼀个⼩时过去了,感觉情况不妙。。。) 这个直接⽤ThreadLocal不就可以么,你⻅过SpringMVC有锁实现的代码么?(有点晕菜。。。)我们聊聊mysql吧,说下索引结构(说了B+树) 为什么使⽤B+树?( 说了查询效率⾼,O(logN),可以充分利⽤磁盘预读的特性,多叉树,深度⼩,叶⼦结点有序且存储数据) 什么是索引覆盖?(忘记了。。。 ) Java为什么要设计双亲委派模型? 什么时候需要⾃定义类加载器? 我们做⼀道题吧,⼿写⼀个对象池 有什么想问我的么?(感觉我很多点都没答好,是不是挂了(结果真的是) )
⼩结
头条的⾯试确实很专业,每次⾯试官会提前给你发⼀个视频链接,然后准点开始⾯试,⽽且考察的点都⽐较全。
⾯试官都有⼀个特点,会抓住⼀个值得深⼊的点或者你没说清楚的点深⼊下去直到你把这个点讲清楚,不然⾯试官会觉得你并没有真正理解。⼆⾯⾯试官给了我⼀点建议,研究技术的时候⼀定要去研究产⽣的背景,弄明⽩在什么场景解决什么特定的问题,其实很多技术内部都是相通的。很诚恳,还是很感谢这位⾯试官⼤⼤。
最后总结个人所得(供大家参考学习)
从开始⾯试到头条⾯完⼤概⼀个多⽉的时间,真的有点身⼼俱疲的感觉。最后拿到了拼多多、蚂蚁的offer,还是蛮幸运的。头条的⾯试对我帮助很⼤,再次感谢⾯试官对我的诚恳建议,以及拼多多的HR对我的啰嗦的问题详细解答。
这⾥要说的是⾯试前要做好两件事:简历和⾃我介绍,简历要好好回顾下⾃⼰做的⼀些项⽬,然后挑⼏个亮点项⽬。⾃我介绍基本每轮⾯试都有,所以最好提前⾃⼰练习下,想好要讲哪些东⻄,分别怎么讲。此外,简历提到的技术⼀定是⾃⼰深⼊研究过的,没有深⼊研究也最好找点资料预热下,不打⽆准备的仗。
Java进阶核心整理:
性能调优(Java性能调优实战:Java编程性能调优+多线程性能调优+JVM性能监测及调优+设计模式调优+数据库性能调优+实战演练)
Spring全家桶进阶学习的笔记
缓存数据库(主要是MySQL+Redis+MongDB)分布式&微服务(整理的笔记如下)
- 比如基础部分:
- 中级部分:
高级部分(消息队列+Redis缓存+分库分表+读写分离+分布式系统+高可用+微服务架构
关于算法
字节必备算法,所以对于算法这一块,咱们还是得往死里刷刷刷,最好的是刷《算法刷题LeetCode中文版》以及左程云大神的《程序员代码面试指南 IT名企算法与数据结构题目最优解(近200道)》
内容包含:线性表、字符串、栈和队列、树、排序、查找、暴力枚举法、广度优先搜索、深度优先搜索、分治法、贪心法、动态规划、图
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/tech/pnotes/290316.html