1.hashCode 原理
2.原创|如果懂了HashMap这两点,源码面试就没问题了
3.南京群顶科技java实习面经
4.一文搞懂 == 、面试equals和hashCode
5.Java面试问题:HashMap的源码底层原理
hashCode 原理
关于 hashCode的原理,网上普遍的面试说法是它代表对象的内存地址,但考虑到垃圾回收过程中对象可能会被移动,源码从而改变其地址,面试易语言迅雷源码这种说法并不完全准确。源码实际上,面试hashCode保存在对象的源码头部分,而非内存地址本身。面试这种设计避免了重复到已被回收对象的源码地址的问题。详细对象头的面试解释可参考相关文章。 在理解了 hashCode并非简单的源码内存地址之后,我们来看它的面试生成策略:策略 1:通过在启动参数中添加 `-XX:hashCode=4`,改变默认的源码 hashCode计算方式。这是使用 Park-Miller 伪随机数生成器生成的随机数。
策略 2:将对象的内存地址进行移位运算后与一个随机数进行异或操作。
策略 3:返回固定的数字 1。
策略 4:返回当前对象的内存地址。
策略 5:返回一个自增序列的当前值。
策略 6:通过与当前线程相关联的随机数加上三个确定值,使用 Marsaglia's xorshift scheme 随机数算法得到的结果。JDK8 的默认 hashCode计算方法就是此算法。
理解 hashCode的生成策略有助于更好地利用其特性。接下来,我们探讨了测试 hashCode是否等同于内存地址的实践,展示了不同情况下 hashCode和 `System.identityHashCode()` 的行为差异。这表明,尽管 hashCode与内存地址关系不大,但它在对象的哈希表或散列查找中起着关键作用。 在面试中,理解 hashCode和 equals的区别和使用场景尤为重要。首先,hashCode提供了一种快速比较对象的方法,而 equals则能更全面地比较对象。其次,尽管 hashCode在多数情况下可靠,但它并非绝对可靠,因此在某些场景下,仍需要通过 equals进行更详细的比较。 位移优化是 hashCode中的一个重要技术,通过使用位运算符如左移、右移等,可以提高计算速度和效率。在 String类的实现中,使用了优化后的opengl32源码乘法公式,这可以被编译器优化为高效的操作。选择的原因是为了在保证较高的性能的同时,避免过小的质数导致的哈希冲突,以及过大质数导致的哈希值范围超出整数范围的问题。 总之,理解 hashCode的原理和应用对于提升程序性能、优化算法实现至关重要。推荐深入学习相关文章和资源,进一步提升对 hashCode的理解和应用能力。同时,强烈推荐一个专注于Java进阶架构师的博客,以获取更多深入的技术见解和实践指导。原创|如果懂了HashMap这两点,面试就没问题了
HashMap在后端面试中经常被问及,比如默认初始容量、加载因子和线程安全性等问题。通常,这些问题能对答如流,表明对HashMap有较好的理解。然而,近期团队的技术分享中,我从两个角度获得了一些新见解,现在分享给大家。
首先,让我们探讨如何找到比初始容量值大的最小的2的幂次方整数。通常,使用默认构造器时,HashMap的初始容量为,加载因子为0.。这样做可能导致在数据量大时频繁进行扩容,影响性能。因此,通常会预估容量并使用带容量的构造器创建。通过分析源码,我们可以得知HashMap数组部分长度范围为[0,2^]。要找到比初始容量大的最小的2的幂次方整数,我们需重点关注tableSizeFor方法。此方法巧妙地设计,当输入的容量本身为2的整数次幂时,返回该容量;否则,返回比输入容量大的最小2的整数次幂。此设计旨在确保容量始终为2的整数次幂,从而优化哈希操作,避免哈希冲突。在获取key对应的成本筹码分布源码数组下标时,通过key的哈希值与数组长度-1进行与运算,这种方法依赖于容量为2的整数次幂的特性,以确保哈希值的分散性。
容量为2的整数次幂的关键在于,它允许通过与运算高效地定位key对应的数组下标。容量不是2的整数次幂时,与运算后的哈希值可能会导致位数为0的冲突,影响数据定位的准确性。tableSizeFor方法在计算过程中,首先对输入的容量进行-1操作,以避免容量本身就是2的整数次幂时,计算结果为容量的2倍。接着,通过连续的移位与或操作,找到比输入容量大的最小的2的整数次幂。这种方法确保了内存的有效利用,避免了不必要的扩容。
下面,让我们通过一个示例来详细解释算法中的移位与或操作。假设初始容量n为一个位的整数,例如:n = xxx xxxxxxxx xxxxxxxx xxxxxxxx(x表示该位上是0还是1,具体值不关心)。首先,执行n |= n >> 1操作,用n本身与右移一位后的n进行或操作,可以将n的最高位的1及其紧邻的右边一位置为1。接下来,重复此操作,进行n |= n >> 2、n |= n >> 4、n |= n >> 8和n |= n >> 。最后,将n与最大容量进行比较,如果大于等于2^,则返回最大容量;否则,返回n + 1,找到比n大的最小的2的整数次幂。
在实践中,这确保了在给定容量范围内高效地找到合适的容量值。例如,输入时,输出为,即比大的最小的2的整数次幂。
接下来,我们探讨HashMap在处理key时进行哈希处理的假反弹公式源码特殊操作。在执行put操作时,首先对key进行哈希处理。在源码中,可以看到执行了(h = key.hashCode()) ^ (h >> )的操作。这个操作将key的hashCode值与右移位后的值进行异或操作,将哈希值的高位和低位混合计算,以生成更离散的哈希值。通过演示,我们可以发现,当三个不同的key生成的hashCode值的低位完全相同、高位不同时,它们在数组中的下标会相同,导致哈希冲突。通过异或操作,我们解决了这个问题,使得经过哈希处理后的key能被更均匀地分布在数组中,提高了数据的分散性,减少了哈希冲突。
总结来说,这两个点揭示了HashMap在容量和哈希处理上的一些巧妙设计,这些设计提高了数据结构的效率和性能。理解这些原理不仅有助于解决面试问题,还能在实际工作中借鉴这些思想,优化数据存储和访问效率。希望我的讲解能帮助大家掌握这两个知识点,如有任何疑问,欢迎留言或私聊。通过深入研究和实践,我们可以更好地理解和利用HashMap这一强大的数据结构。
南京群顶科技java实习面经
南京群顶科技Java实习面试内容概述:
面试开始于自我介绍,面试官随后对项目进行了一番了解。面试中涉及的技术点包括:StringBuilder和StringBuffer的区别,重写hashCode的必要性,抽象类与接口的区别,反射与使用场景,序列化和反序列化。此外,面试官询问了有关hashmap中使用红黑树的原因,以及hashmap和hashtable的区别。
在数据结构方面,面试官对ArrayList和LinkedList的区别进行了提问,同时询问了ArrayList是否具备线程安全性。关于SQL,面试官探讨了慢查询的解决方法以及MySQL事务隔离级别的概念,包括脏读和幻读的主力大户指标源码区分。
面试官对JVM的组成部分进行了提问,并询问了面试者是否对JVM进行过优化,提及轻量级锁和线程池的拒绝策略。在框架方面,面试者被要求讲述SpringIoC的优点及SpringAop的应用场景,并分享了项目中使用Spring的方法。面试中还涉及了事务管理,但面试者未能全面回答Spring事务的相关内容。
面试题还包括了对Redis的理解,例如Redis是否为单线程,内存删除策略,以及Redis的持久化方式选择。
面试结束后,面试者发现面试官在面试过程中修改了默认用户的密码,并在面试结束后立即更改,时间早于面试开始。幸好面试官未对此事进行调侃。
一文搞懂 == 、equals和hashCode
面试中常被问到的 == 和 equals() 有何区别?重写 equals() 为何需重写 hashCode()?本文将一一解答。hashCode() 的存在并非多余,而是为高效数据存储和检索提供支持,尤其是在 HashMap 和 HashSet 中。
首先,了解 == 的作用。当用于基本类型时,它比较的是数值;对于引用类型(对象),它比较的是对象在内存中的地址。而在 equals() 中,对象类的默认实现依赖于 == 进行内存地址比较,但用户可以重写它来比较对象属性。
重写 equals() 的关键在于,当两个对象属性相等时,equals() 返回 true,表明它们相等。然而,如果只重写了 equals() 而未重写 hashCode(),HashMap 和 HashSet 会依据 hashCode() 的结果来存储和查找对象。如果两个对象 equals() 返回 true 但 hashCode() 不同,它们在 HashMap 中可能被视为两个不同的键,导致意外的结果。
例如,未重写 hashCode() 的情况,当我们尝试将两个相等的 Girl 对象添加到 HashSet 中,由于哈希冲突,set 的大小可能会出现意外。因此,重写 equals() 时,确保与之匹配的重写 hashCode() 是至关重要的,以确保正确地存储和检索对象。
总结来说,equals() 用于比较对象内容,hashCode() 则用于高效定位,两者结合使用确保了数据结构的正确性。在实际编程中,切勿忽视它们的相互关系。"思考:在重写 equals() 时,忘记重写 hashCode() 将可能导致 HashMap 或 HashSet 的行为出乎意料。"
Java面试问题:HashMap的底层原理
JDK1.8中HashMap的put()和get()操作的过程
put操作:
①首先判断数组是否为空,如果数组为空则进行第一次扩容(resize)
②根据key计算hash值并与上数组的长度-1(int index = key.hashCode()&(length-1))得到键值对在数组中的索引。
③如果该位置为null,则直接插入
④如果该位置不为null,则判断key是否一样(hashCode和equals),如果一样则直接覆盖value
⑤如果key不一样,则判断该元素是否为 红黑树的节点,如果是,则直接在 红黑树中插入键值对
⑥如果不是 红黑树的节点,则就是 链表,遍历这个 链表执行插入操作,如果遍历过程中若发现key已存在,直接覆盖value即可。
如果 链表的长度大于等于8且数组中元素数量大于等于阈值,则将 链表转化为 红黑树,(先在 链表中插入再进行判断)
如果 链表的长度大于等于8且数组中元素数量小于阈值,则先对数组进行扩容,不转化为 红黑树。
⑦插入成功后,判断数组中元素的个数是否大于阈值(threshold),超过了就对数组进行扩容操作。
get操作:
①计算key的hashCode的值,找到key在数组中的位置
②如果该位置为null,就直接返回null
③否则,根据equals()判断key与当前位置的值是否相等,如果相等就直接返回。
④如果不等,再判断当前元素是否为树节点,如果是树节点就按 红黑树进行查找。
⑤否则,按照 链表的方式进行查找。
3.HashMap的扩容机制
4.HashMap的初始容量为什么是?
1.减少hash碰撞 (2n ,=2^4)
2.需要在效率和内存使用上做一个权衡。这个值既不能太小,也不能太大。
3.防止分配过小频繁扩容
4.防止分配过大浪费资源
5.HashMap为什么每次扩容都以2的整数次幂进行扩容?
因为Hashmap计算存储位置时,使用了(n - 1) & hash。只有当容量n为2的幂次方,n-1的二进制会全为1,位运算时可以充分散列,避免不必要的哈希冲突,所以扩容必须2倍就是为了维持容量始终为2的幂次方。
6.HashMap扩容后会重新计算Hash值吗?
①JDK1.7
JDK1.7中,HashMap扩容后,所有的key需要重新计算hash值,然后再放入到新数组中相应的位置。
②JDK1.8
在JDK1.8中,HashMap在扩容时,需要先创建一个新数组,然后再将旧数组中的数据转移到新数组上来。
此时,旧数组中的数据就会根据(e.hash & oldCap),数据的hash值与扩容前数组的长度进行与操作,根据结果是否等于0,分为2类。
1.等于0时,该节点放在新数组时的位置等于其在旧数组中的位置。
2.不等于0时,该节点在新数组中的位置等于其在旧数组中的位置+旧数组的长度。
7.HashMap中当 链表长度大于等于8时,会将 链表转化为 红黑树,为什么是8?
如果 hashCode 分布良好,也就是 hash 计算的结果离散好的话,那么 红黑树这种形式是很少会被用到的,因为各个值都均匀分布,很少出现 链表很长的情况。在理想情况下, 链表长度符合泊松分布,各个长度的命中概率依次递减,当长度为 8 的时候,概率仅为 0.。这是一个小于千万分之一的概率,通常我们的 Map 里面是不会存储这么多的数据的,所以通常情况下,并不会发生从 链表向 红黑树的转换。
8.HashMap为什么线程不安全?
1.在JDK1.7中,当并发执行扩容操作时会造成死循环和数据丢失的情况。
在JDK1.7中,在多线程情况下同时对数组进行扩容,需要将原来数据转移到新数组中,在转移元素的过程中使用的是头插法,会造成死循环。
2.在JDK1.8中,在并发执行put操作时会发生数据覆盖的情况。
如果线程A和线程B同时进行put操作,刚好这两条不同的数据hash值一样,并且该位置数据为null,所以这线程A、B都会通过判断,将执行插入操作。
假设一种情况,线程A进入后还未进行数据插入时挂起,而线程B正常执行,从而正常插入数据,然后线程A获取CPU时间片,此时线程A不用再进行hash判断了,问题出现:线程A会把线程B插入的数据给覆盖,发生线程不安全。
9.为什么HashMapJDK1.7中扩容时要采用头插法,JDK1.8又改为尾插法?
JDK1.7的HashMap在实现resize()时,新table[ ]的列表队头插入。
这样做的目的是:避免尾部遍历。
避免尾部遍历是为了避免在新列表插入数据时,遍历到队尾的位置。因为,直接插入的效率更高。
对resize()的设计来说,本来就是要创建一个新的table,列表的顺序不是很重要。但如果要确保插入队尾,还得遍历出 链表的队尾位置,然后插入,是一种多余的损耗。
直接采用队头插入,会使得 链表数据倒序。
JDK1.8采用尾插法是避免在多线程环境下扩容时采用头插法出现死循环的问题。
.HashMap是如何解决哈希冲突的?
拉链法(链地址法)
为了解决碰撞,数组中的元素是单向 链表类型。当 链表长度大于等于8时,会将 链表转换成 红黑树提高性能。
而当 链表长度小于等于6时,又会将 红黑树转换回单向 链表提高性能。
.HashMap为什么使用 红黑树而不是B树或 平衡二叉树AVL或二叉查找树?
1.不使用二叉查找树
二叉 排序树在极端情况下会出现线性结构。例如:二叉 排序树左子树所有节点的值均小于根节点,如果我们添加的元素都比根节点小,会导致左子树线性增长,这样就失去了用树型结构替换 链表的初衷,导致查询时间增长。所以这是不用二叉查找树的原因。
2.不使用 平衡二叉树
平衡二叉树是严格的平衡树, 红黑树是不严格平衡的树, 平衡二叉树在插入或删除后维持平衡的开销要大于 红黑树。
红黑树的虽然查询性能略低于 平衡二叉树,但在插入和删除上性能要优于 平衡二叉树。
选择 红黑树是从功能、性能和开销上综合选择的结果。
3.不使用B树/B+树
HashMap本来是数组+ 链表的形式, 链表由于其查找慢的特点,所以需要被查找效率更高的树结构来替换。
如果用B/B+树的话,在数据量不是很多的情况下,数据都会“挤在”一个结点里面,这个时候遍历效率就退化成了 链表。
.HashMap和Hashtable的异同?
①HashMap是⾮线程安全的,Hashtable是线程安全的。
Hashtable 内部的⽅法基本都经过 synchronized 修饰。
②因为线程安全的问题,HashMap要⽐Hashtable效率⾼⼀点。
③HashMap允许键和值是null,而Hashtable不允许键或值是null。
HashMap中,null 可以作为键,这样的键只有 ⼀个,可以有 ⼀个或多个键所对应的值为 null。
HashTable 中 put 进的键值只要有 ⼀个 null,直接抛出 NullPointerException。
④ Hashtable默认的初始 大小为,之后每次扩充,容量变为原来的2n+1。
HashMap默认的初始 大⼩为,之后每次扩充,容量变为原来的2倍。
⑤创建时如果给定了容量初始值,那么 Hashtable 会直接使⽤你给定的 ⼤⼩, ⽽ HashMap 会将其扩充为2的幂次⽅ ⼤⼩。
⑥JDK1.8 以后的 HashMap 在解决哈希冲突时当 链表⻓度 大于等于8时,将 链表转化为红⿊树,以减少搜索时间。Hashtable没有这样的机制。
Hashtable的底层,是以数组+ 链表的形式来存储。
⑦HashMap的父类是AbstractMap,Hashtable的父类是Dictionary
相同点:都实现了Map接口,都存储k-v键值对。
.HashMap和HashSet的区别?
HashSet 底层就是基于 HashMap 实现的。(HashSet 的源码⾮常⾮常少,因为除了 clone() 、 writeObject() 、 readObject() 是 HashSet ⾃⼰不得不实现之外,其他⽅法都是直接调用 HashMap 中的⽅法)
1.HashMap实现了Map接口,HashSet实现了Set接口
2.HashMap存储键值对,HashSet存储对象
3.HashMap调用put()向map中添加元素,HashSet调用add()方法向Set中添加元素。
4.HashMap使用键key计算hashCode的值,HashSet使用对象来计算hashCode的值,在hashCode相等的情况下,使用equals()方法来判断对象的相等性。
5.HashSet中的元素由HashMap的key来保存,而HashMap的value则保存了一个静态的Object对象。
.HashSet和TreeSet的区别?
相同点:HashSet和TreeSet的元素都是不能重复的,并且它们都是线程不安全的。
不同点:
①HashSet中的元素可以为null,但TreeSet中的元素不能为null
②HashSet不能保证元素的排列顺序,TreeSet支持自然 排序、定制 排序两种 排序方式
③HashSet底层是采用 哈希表实现的,TreeSet底层是采用 红黑树实现的。
④HashSet的add,remove,contains方法的时间复杂度是 O(1),TreeSet的add,remove,contains方法的时间复杂度是 O(logn)
.HashMap的遍历方式?
①通过map.keySet()获取key,根据key获取到value
②通过map.keySet()遍历key,通过map.values()遍历value
③通过Map.Entry(String,String) 获取,然后使用entry.getKey()获取到键,通过entry.getValue()获取到值
④通过Iterator