Collection子接口2：Set接口

1. Set接口概述

Set接口是Collection的子接口，Set接口相较于Collection接口没有提供额外的方法
Set 集合不允许包含相同的元素，如果试把两个相同的元素加入同一个 Set 集合中，则添加操作失败。
Set集合支持的遍历方式和Collection集合一样：foreach和Iterator。
Set的常用实现类有：HashSet、TreeSet、LinkedHashSet。

2. Set主要实现类：HashSet

2.1 HashSet概述

HashSet 是 Set 接口的主要实现类，大多数时候使用 Set 集合时都使用这个实现类。
HashSet 按 Hash 算法来存储集合中的元素，因此具有很好的存储、查找、删除性能。
HashSet 具有以下特点：
- 不能保证元素的排列顺序
- HashSet 不是线程安全的
- 集合元素可以是 null
HashSet 集合判断两个元素相等的标准：两个对象通过 hashCode() 方法得到的哈希值相等，并且两个对象的 equals()方法返回值为true。
对于存放在Set容器中的对象，对应的类一定要重写hashCode()和equals(Object obj)方法，以实现对象相等规则。即：“相等的对象必须具有相等的散列码”。
HashSet集合中元素的无序性，不等同于随机性。这里的无序性与元素的添加位置有关。具体来说：我们在添加每一个元素到数组中时，具体的存储位置是由元素的hashCode()调用后返回的hash值决定的。导致在数组中每个元素不是依次紧密存放的，表现出一定的无序性。

2.2 HashSet中添加元素的过程：

第1步：当向 HashSet 集合中存入一个元素时，HashSet 会调用该对象的 hashCode() 方法得到该对象的 hashCode值，然后根据 hashCode值，通过某个散列函数决定该对象在 HashSet 底层数组中的存储位置。
第2步：如果要在数组中存储的位置上没有元素，则直接添加成功。
第3步：如果要在数组中存储的位置上有元素，则继续比较：
- 如果两个元素的hashCode值不相等，则添加成功；
- 如果两个元素的hashCode()值相等，则会继续调用equals()方法：
  - 如果equals()方法结果为false，则添加成功。
  - 如果equals()方法结果为true，则添加失败。
第2步添加成功，元素会保存在底层数组中。

第3步两种添加成功的操作，由于该底层数组的位置已经有元素了，则会通过链表的方式继续链接，存储。

举例：

package com.atguigu.set;  
  
import java.util.Objects;  
  
public class MyDate {  
    private int year;  
    private int month;  
    private int day;  
  
    public MyDate(int year, int month, int day) {  
        this.year = year;  
        this.month = month;  
        this.day = day;  
    }  
  
    @Override  
    public boolean equals(Object o) {  
        if (this == o) return true;  
        if (o == null || getClass() != o.getClass()) return false;  
        MyDate myDate = (MyDate) o;  
        return year == myDate.year &&  
                month == myDate.month &&  
                day == myDate.day;  
    }  
  
    @Override  
    public int hashCode() {  
        return Objects.hash(year, month, day);  
    }  
  
    @Override  
    public String toString() {  
        return "MyDate{" +  
                "year=" + year +  
                ", month=" + month +  
                ", day=" + day +  
                '}';  
    }  
}

package com.atguigu.set;  
  
import org.junit.Test;  
  
import java.util.HashSet;  
  
public class TestHashSet {  
    @Test  
    public void test01(){  
        HashSet set = new HashSet();  
        set.add("张三");  
        set.add("张三");  
        set.add("李四");  
        set.add("王五");  
        set.add("王五");  
        set.add("赵六");  
  
        System.out.println("set = " + set);//不允许重复，无序  
    }  
  
    @Test  
    public void test02(){  
        HashSet set = new HashSet();  
        set.add(new MyDate(2021,1,1));  
        set.add(new MyDate(2021,1,1));  
        set.add(new MyDate(2022,2,4));  
        set.add(new MyDate(2022,2,4));  
  
  
        System.out.println("set = " + set);//不允许重复，无序  
    }  
}

2.3 重写 hashCode() 方法的基本原则

在程序运行时，同一个对象多次调用 hashCode() 方法应该返回相同的值。
当两个对象的 equals() 方法比较返回 true 时，这两个对象的 hashCode() 方法的返回值也应相等。
对象中用作 equals() 方法比较的 Field，都应该用来计算 hashCode 值。

注意：如果两个元素的 equals() 方法返回 true，但它们的 hashCode() 返回值不相等，hashSet 将会把它们存储在不同的位置，但依然可以添加成功。

2.4 重写equals()方法的基本原则

重写equals方法的时候一般都需要同时复写hashCode方法。通常参与计算hashCode的对象的属性也应该参与到equals()中进行计算。
推荐：开发中直接调用Eclipse/IDEA里的快捷键自动重写equals()和hashCode()方法即可。
- 为什么用Eclipse/IDEA复写hashCode方法，有31这个数字？
首先，选择系数的时候要选择尽量大的系数。因为如果计算出来的hash地址越大，所谓的“冲突”就越少，查找起来效率也会提高。（减少冲突）

其次，31只占用5bits,相乘造成数据溢出的概率较小。

再次，31可以由i*31== (i<<5)-1来表示,现在很多虚拟机里面都有做相关优化。（提高算法效率）

最后，31是一个素数，素数作用就是如果我用一个数字来乘以这个素数，那么最终出来的结果只能被素数本身和被乘数还有1来整除！(减少冲突)

3. Set实现类之二：LinkedHashSet

LinkedHashSet 是 HashSet 的子类，不允许集合元素重复。
LinkedHashSet 根据元素的 hashCode 值来决定元素的存储位置，但它同时使用双向链表维护元素的次序，这使得元素看起来是以添加顺序保存的。
LinkedHashSet插入性能略低于 HashSet，但在迭代访问 Set 里的全部元素时有很好的性能。

举例：

package com.atguigu.set;  
  
import org.junit.Test;  
  
import java.util.LinkedHashSet;  
  
public class TestLinkedHashSet {  
    @Test  
    public void test01(){  
        LinkedHashSet set = new LinkedHashSet();  
        set.add("张三");  
        set.add("张三");  
        set.add("李四");  
        set.add("王五");  
        set.add("王五");  
        set.add("赵六");  
  
        System.out.println("set = " + set);//不允许重复，体现添加顺序  
    }  
}

4. Set实现类之三：TreeSet

4.1 TreeSet概述

TreeSet 是 SortedSet 接口的实现类，TreeSet 可以按照添加的元素的指定的属性的大小顺序进行遍历。
TreeSet底层使用红黑树结构存储数据
新增的方法如下： (了解)
- Comparator comparator()
- Object first()
- Object last()
- Object lower(Object e)
- Object higher(Object e)
- SortedSet subSet(fromElement, toElement)
- SortedSet headSet(toElement)
- SortedSet tailSet(fromElement)
TreeSet特点：不允许重复、实现排序（自然排序或定制排序）
TreeSet 两种排序方法：自然排序和定制排序。默认情况下，TreeSet 采用自然排序。
- 自然排序：TreeSet 会调用集合元素的 compareTo(Object obj) 方法来比较元素之间的大小关系，然后将集合元素按升序(默认情况)排列。
  - 如果试图把一个对象添加到 TreeSet 时，则该对象的类必须实现 Comparable 接口。
  - 实现 Comparable 的类必须实现 compareTo(Object obj) 方法，两个对象即通过 compareTo(Object obj) 方法的返回值来比较大小。
- 定制排序：如果元素所属的类没有实现Comparable接口，或不希望按照升序(默认情况)的方式排列元素或希望按照其它属性大小进行排序，则考虑使用定制排序。定制排序，通过Comparator接口来实现。需要重写compare(T o1,T o2)方法。
  - 利用int compare(T o1,T o2)方法，比较o1和o2的大小：如果方法返回正整数，则表示o1大于o2；如果返回0，表示相等；返回负整数，表示o1小于o2。
  - 要实现定制排序，需要将实现Comparator接口的实例作为形参传递给TreeSet的构造器。
因为只有相同类的两个实例才会比较大小，所以向 TreeSet 中添加的应该是同一个类的对象。
对于 TreeSet 集合而言，它判断两个对象是否相等的唯一标准是：两个对象通过 compareTo(Object obj) 或compare(Object o1,Object o2)方法比较返回值。返回值为0，则认为两个对象相等。

{{userData.name}}已认证

Collection子接口2：Set接口

1. Set接口概述

2. Set主要实现类：HashSet

2.1 HashSet概述

2.2 HashSet中添加元素的过程：

2.3 重写 hashCode() 方法的基本原则

2.4 重写equals()方法的基本原则

3. Set实现类之二：LinkedHashSet

4. Set实现类之三：TreeSet

4.1 TreeSet概述

Collection子接口1：List接口

Map接口