一次阿里 P8 的问答交谈之旅！

问：请教一个问题，在局域网内对一台灰度机器进行压测，如果带宽被打满后，压测的效果也就到瓶颈了，那么问题来了，怎么判断这台灰度机器的带宽是否被打满？

我：有几个工具都可以看 iftop（神器）、dstat、sar 都可以看。

我们常说的网速是按照 bit 计算的，所以计算流量时注意单位，一般一个千兆网卡，其读或者写达到 10M/8 byte 时，网卡就已经被打满了。

问：请问 Java 有什么方法可以优雅地 hook 一个第三方库的静态方法吗？

我：可以使用 btrace 及相关的衍生工具。

问：对于在 Java 中使用 JNI 您是怎么看的？

我：现在的软件开发已经不是以前那种一门语言扛到底的时代了，软件开发倾向细分工，用最合适的工具做最合适的事。

问：OSGI 前路在何方？模块化、热替换的概念前几年一直炒的火热。最近了解了一下，一直想不明白，会有多少人真的敢在生产环境直接做模块的替换，特别是在现在自动化运维比较丰富的情况下，直接整个应用重新部署的工作量越来越小，真的有必要花这么多精力做这个事情？另外，Spring 已经在最新版本去掉 OSGI，以后该何去何从呢？

答：以前做过一些 OSGI 规范实现的事情，看到这个问题不由得兴奋了。单纯从应用角度来说，个人不建议引入 OSGI 技术，因为这个技术带来的优势远远小于付出的代价。但是，OSGI 作为 Java 世界事实上的标准，在后续的 Java 9 中有很强的指导意义，深入学习 OSGI 可以更方便的学习 Java 9 的模块化。

另外，OSGI 可以说是 classloader 体系的集大成者，有志于学习 Java classloader 实战的同学，OSGI 是一个必修课。夸张一点说，理解了 OSGI 的整套技术体系，日后再碰到 classloader 相关问题时会感觉有些爽。

问：如果我写了一个小插件（类似 fastjson ）这种工具类。怎么去判断它性能是不是满足要求呢？看内存堆占用的空间或者还是其它的参考量？谢谢。

答：每个组件都有其关注的核心目标，如果是一个客户端库，需要考量的点是每次方法调用的执行时间（越高越好）、使用时内存占用（越低越好）和因为本组件引起的GC数（越少越好）。

问：线上 CPU 很高、内存占用很少，有能快速查找到原因的方法吗？

答：给一个代码，在 Linux 下保存成 .sh 文件直接执行即可。

#!/bin/shts=$(date +"%s")jvmPid=$1defaultLines=100defaultTop=20threadStackLines=${2:-$defaultLines}topThreads=${3:-$defaultTop}jvmCapture=$(top -b -n1 | grep java )threadsTopCapture=$(top -b -n1 -H | grep java )jstackOutput=$(echo "$(jstack $jvmPid )" )topOutput=$(echo "$(echo "$threadsTopCapture" | head -n $topThreads | perl -pe 's//e/[?.*?[/@-~] ?//g' | awk '{gsub(/^ +/,"");print}' | awk '{gsub(/ +|[+-]/," ");print}' | cut -d " " -f 1,9 )/n ")echo "*************************************************************************************************************"uptimeecho "Analyzing top $topThreads threads"echo "*************************************************************************************************************"printf %s "$topOutput" | while IFS= read  linedo   pid=$(echo $line | cut -d " " -f 1)   hexapid=$(printf "%x" $pid)   cpu=$(echo $line | cut -d " " -f 2)   echo -n $cpu"% [$pid] "    echo "$jstackOutput" | grep "tid.*0x$hexapid " -A $threadStackLines | sed -n -e '/0x'$hexapid'/,/tid/ p' | head -n -1   echo "/n"doneecho "/n"

代码的意思，打印出 JVM 的所有线程以及按照 CPU 占比排序。

问：为什么 Java 8 重写了 ConcurrentHashMap？基于什么的考虑？优化了什么特性？

答：为了获得更好的性能，1.8 的 ConcurrentHashMap 在原来的基础上性能做了改进：

table 每个元素作为一个桶，锁的粒度更细，用 synchronized 关键字锁住 table[i]。
加入红黑树，当链表的数量超过8并且当前 capacity 大于 64 时候，将链表转为红黑树，时间复杂度 O(N)→O(logN)，并且红黑树中利用读写锁保证添加修复和删除修复时候的线程安全。

另外，关于 ConcurrentHashMap 在 1.8 中，除了做了扩容时的优化以外，也去除了分段锁，原因是分段锁的在扩充并发度以及整个 map 容量扩展时需要锁住所有的段。所以，1.8 中对 ConcurrentHashMap 做了更细粒度的优化，只在 put、resize 以及扩容是加锁，来做优化。

问：如果用微服务思想开发，Dubbo 和 Spring cloud 那个更好。

答：Dubbo 和 Spring cloud 不是一个层面上，如果要做微服务设计，必然会有系统间交互，RPC 是系统间交互的一种，服务治理也是微服务的一个必需子集，但是微服务还包括其它的东西。而 Spring Cloud 是微服务的一种实现，其包含的功能要多于 Dubbo。

问：异地跨数据中心的情况下，常用的分布式协议和系统还能正常工作吗？如何进行改造实现跨数据中心较高网络延时下，消息能快速传递？

答：分布式协议其实本身就是为了应对多数据中心，因为 CAP 中的 P 更多的出现在多数据中心交互中。关于 2 个数据中心的数据传递基本的思路有2个：一是建设优质的专线，二是变交互数据传输为批量数据传输。

问：现在的垃圾收集都是分代回收，那么在回收新生代的时候是要同时扫描老年代吗？是全表还是有一种策略，比如 G1 的 Remembered set，这个 set 只是记录了一种引用关系；那其它的分代回收，比如 CMS 和 ParNew 组合时只能是回收新生代的时候扫描老年代吗？那这样效率不就是降低了不少吗？

答：对于老年代指向新生代的引用，JVM 提供了一种叫 card table 的数据结构，所以每次并不需要全量遍历老年代，只需要遍历 card table 就行了。

问：Java 为啥不能继承多个父类，这么设计有啥优点，写程序时遇到需要多继承了该怎么解决？

答：多重继承一般会引入很多麻烦，比如类关系复杂、层级过长等，一般语言中都是使用受限制的多重继承。对比多种语言来看，Java 是 implement 多个接口，这种可以认为是继承规范（定义），然后会用组合模式来完成类似多重继承。Python 是 mixin 继承模式，是代码继承（有一定要求），详细对比建议 Google 或者知乎了解下 mixin、MRO Python，多重继承这几个关键词。

问：线上定位内存 JVM 内存溢出，除了打印堆栈拿出来分析，还有没有其它的方式？

答：导出 JVM dump 文件，在本地使用 Eclipse 插件 MAT 分析，可视化的分析最方便、直观、有效。

问：ThreadLocal 在使用上有什么需要注意的？在高并发请求的环境下性能如何？会有什么问题？

答：注意事项，使用结束以后进行 remove 操作，避免 ThreadLocal 对象越来越大。高并发的场景，由于 ThreadLocal 内部使用 HashMap 的原理，key = currentThread，因为 HashMap 是非线程安全的，一定要注意 hashmap.resize 的时候，可能会导致某几个 CPU 100% 的问题，进而导致应用出现资源耗尽等不可预知的问题。

问：假设现在有一个工作了三年的 Java 工程师，想做到技术专家你认为应该具备什么样的能力？

答：编码实践，例如坚持在 GitHub 上写一些为了应用技术而应用的 example。读他人代码，各种开源框架的源码。多读书，多看 Importnew、InfoQ、www.xttblog.com 之类的文章，多问，看到相似点时回过去看看自己做的是否还有改进的空间。

问：克隆对象时，为什么要在对象中重写一个 public 类型的 clone() 方法呢？Object 类中有一个 protected 类型的 clone() 方法，但是要克隆的对象是 Object 类的子类啊，在不同包下并存在继承关系的条件下应该可以访问 Object 的 protected 方法啊？

答：首先 Java 的 clone 是设计模式中原型模式的一个典型应用，克隆分浅拷贝和深拷贝，二者的区别自行搜索。Object.clone() 是浅拷贝，一般复杂对象的 clone 最好使用深拷贝，所以需要重写 clone 方法。

问：JVM（基于JDK 1.8）在执行垃圾回收的时候，对于堆区年轻代内存区域回收较频繁，请问如何更好的控制 JVM 执行回收的节奏？另外，如果合理地控制好年轻代和年老代的占比以及年轻代里面的 eden 区和两个幸存区的占比，能很好的达到垃圾回收效果，请问下，如何合理的控制堆区的年老代和年轻代的内存分配占比？还有如何更好地控制年轻代中，eden 区和两个幸存区的占比？

答：年轻代大小选择。

响应时间优先的应用：尽可能设置大，直到接近系统的最低响应时间限制（根据实际情况选择）。在此种情况下，年轻代收集发生的频率也是最小的。同时，减少到达年老代的对象。
吞吐量优先的应用：尽可能设置大，可能到达 Gbit 的程度。因为对响应时间没有要求，垃圾收集可以并行进行，一般适合 8 CPU 以上的应用。

年老代大小选择。响应时间优先的应用：年老代使用并发收集器，所以其大小需要小心设置，一般要考虑并发会话率和会话持续时间等一些参数。如果堆设置小了，可以会造成内存碎片、高回收频率以及应用暂停而使用传统的标记清除方式；如果堆大了，则需要较长的收集时间。最优化的方案，一般需要参考以下数据获得：

并发垃圾收集信息
持久代并发收集次数
传统 GC 信息
花在年轻代和年老代回收上的时间比例

减少年轻代和年老代花费的时间，一般会提高应用的效率。

问：如何避开泛型类型擦除带来的限制？

答：个人觉得换个不会泛型擦除的语言，如 C#，要不换其他弱类型语言或者 Kotlin 这种，可以编译期推导出类型的语言。Java 的话只能开发时多注意了。

public static void main(String[] args) {   List<Integer> intList = new ArrayList<>();   intList.add(1);   try {       Method method = intList.getClass().getDeclaredMethod("add", Object.class);       try {           method.invoke(intList, "string1");           method.invoke(intList, 0.5f);       } catch (IllegalAccessException e) {           e.printStackTrace();       } catch (InvocationTargetException e) {           e.printStackTrace();       }   } catch (NoSuchMethodException e) {       e.printStackTrace();   }   for (Object i : intList) {       System.out.println(i.toString());   }}

问：JVM 如何进阶，目前周志明的《深入理解 JVM》第2版看了两遍，能够根据目录口述书中大部分内容，还需要了解哪些知识？

答：周志明的书只能算是 JVM 的入门书籍。接下来你应该去读一读《Java 虚拟机规范》，周志明的书很多内容是从里面来的，但是规范本身比较详细，注意读英文原版。

其次去读一下 Oralce 的文档：《Hotspot Memory Management white paper》, 《Java Platform, Standard Edition HotSpot Virtual Machine Garbage Collection Tuning Guide》。

现在你需要进一步修炼关于内存管理的部分，阅读比如《垃圾回收算法与实现》，如果这本读完还不满足，那么阅读《自动内存管理艺术——垃圾回收算法手册》。到了这一步，理论你已经掌握得很好了，是时候把 Hotspot 源码 download 下来编译好之后断点调试玩玩了，这个时候我要推荐你今年阿里人刚出的《揭秘Java虚拟机》，不过阅读这本书之前你要是愿意先读完《深入理解计算机系统》效果更好。

问：如何更好的使用多线程？

答：① 高并发、任务执行时间短的业务，线程池线程数可以设置为CPU核数+1，减少线程上下文的切换。
② 并发不高、任务执行时间长的业务要区分开看：　　

假如是业务时间长集中在 I/O 操作上，也就是 I/O 密集型的任务，因为 I/O 操作并不占用 CPU，所以不要让所有的 CPU 闲下来，可以加大线程池中的线程数目，让 CPU 处理更多的业务。　　
假如是业务时间长集中在计算操作上，也就是计算密集型任务，这个就没办法了，和①一样吧，线程池中的线程数设置得少一些，减少线程上下文的切换。

③ 并发高、业务执行时间长，解决这种类型任务的关键不在于线程池而在于整体架构的设计，看看这些业务里面某些数据是否能做缓存是第一步，增加服务器是第二步，至于线程池的设置，设置参考 ②。
最后，业务执行时间长的问题，也可能需要分析一下，看看能不能使用中间件对任务进行拆分和解耦。

问：请问 Java 阻塞锁中偏向锁转为轻量级锁的具体条件么？我在网上搜索到的和书上看到的大多是一笔略过了。

答：

升级的代码可以在 biasedLock.cpp（openjdk1.8）里的：

if (highest_lock != NULL) {    // Fix up highest lock to contain displaced header and point    // object at it    highest_lock->set_displaced_header(unbiased_prototype);    // Reset object header to point to displaced mark    obj->set_mark(markOopDesc::encode(highest_lock));    assert(!obj->mark()->has_bias_pattern(), "illegal mark state: stack lock used bias bit");    if (TraceBiasedLocking && (Verbose || !is_bulk)) {      tty->print_cr("  Revoked bias of currently-locked object");    }  }

附上（我理解的）偏向锁升级的流程图：

问：在实际运用中如何清晰明了地观察 JVM 的运用过程？

答：图形工具 JProfiler、JConsole、Java VisualVM，命令jps、jstack、jmap、jhat、jstat。

问：数据库更新时候会有失败情况，一般修复数据需要怎么操作？

答：补偿和重试。

问：使用 Spring data JPA 时，是直接序列化 entity，还是再写一个 dto，存入 ID 加上一些冗余的用户信息来的好，各有什么优缺点？

答：企业设计模式中有一个 Active Record，具体内容忘的差不多了。

其他一些产品和管理方面的非技术问题本文略过！

一次阿里 P8 的问答交谈之旅！

： » 一次阿里 P8 的问答交谈之旅！

原创文章，作者：Maggie-Hunter，如若转载，请注明出处：https://blog.ytso.com/252226.html

一次阿里 P8 的问答交谈之旅！

相关推荐

发表回复