Коллекции HashSet, HashMap

Март 2, 2021

Главная
Информатика
Коллекции HashSet, HashMap

Содержание

2. Задание на практическую работу 2 1. Изучить теоретический материал (слайды 5-17). Внимательно ознакомиться с ожидаемыми результатами
3. Результат выполнения практической работы (задание 3)
4. Результат выполнения практической работы (задание 4)
5. Хеш-таблицы (hash table) Хеш-таблица (hash table) – это структура данных, обеспечивающая быструю вставку, поиск и удаление
6. Хеш-таблицы . Методы hashCode() и equals() Вычисление хэш-кода объекта и точное сравнение объектов – способы, которые
7. Хеш-таблицы (hash table) Работа с элементами хеш-таблицы выполняются по следующему алгоритму. 1. Вызов хеш-функции. Добавление нового
8. Хеш-таблицы. Понятие коллизии Коллизия – ситуация, при которой два разных объекта получают одинаковый хеш-код (см. рисунок).
9. Хеш-таблицы. Разрешение коллизий. Метод цепочек Метод цепочек (chaining) – каждой ячейке массива соответствует свой связный список.
10. Хеш-таблицы. Разрешение коллизий. Открытая адресация Открытая адресация (open addressing) – в каждой ячейке хеш-таблицы хранится не
11. Хеш-таблицы. Выводы 1. Хеш-таблица создается на основе массива. Главное преимущество хеш-таблиц – скорость добавления, поиска и
12. Интерфейсы Set, SortedSet, NavigableSet Интерфейс Set расширяет интерфейс Collection (см. практическую работу 1, слайды 7-8) и
13. Интерфейс Map Интерфейс Map – является самостоятельным интерфейсом (не расширяет интерфейс Collection, см. практическую работу 1,
14. Основные методы интерфейса Map
15. Классы коллекций
16. Реализация интерфейса Set. Класс HashSet Класс HashSet – реализует интерфейс Set, необходим для создания неупорядоченного множества
17. Реализация интерфейса Map. Класс HashMap Класс HashMap – реализует интерфейс Map, необходим для создания множества (отображения,
18. Применение класса HashSet 1.Создадим множество HashSet, например, cats, содержащее объекты ссылочного типа String, используя конструктор, определенный
19. Применение класса HashSet (начало)
20. Применение класса HashSet (окончание)
21. Применение класса HashMap 1. Создадим отображение HashMap, например, catMap, содержащее объекты ссылочного типа String, используя конструктор,
22. Применение класса HashMap (начало)
24. Скачать презентацию

Слайд 2

Задание на практическую работу 2
1. Изучить теоретический материал (слайды 5-17). Внимательно ознакомиться

с ожидаемыми результатами выполнения практической работы (слайды 3-4).
2. Выполнить исследование предметной области, которая была выбрана на практической работе 1, на предмет создания коллекций HashSet и HashMap, а также формирования их структурных элементов. Например, для первого варианта задания можно создать коллекции списков учебных групп. Для второго варианта – списков сотрудников и т.п.
3. Коллекция HashSet. Создать коллекцию (согласно своему варианту) – множество объектов ссылочного типа, используя конструктор класса HashSet. Добавить в множество минимум пять объектов, которые являются совместимыми с типом данных коллекции. Вывести на экран элементы множества используя цикл for. Добавить новый элемент, который уже присутствует в множестве. Определить, содержит ли коллекция определенный объект. Удалить из коллекции любой объект. Получить количество элементов, содержащихся в коллекции на данный момент. Удалить все элементы множества. Проверить, является ли коллекция HashSet пустой (слайд-помощи – 18, слайды-подсказки – 19-20).
4. Коллекция HashMap. Создать коллекцию (согласно своему варианту) – отображение каждого элемента из одного множества объектов (ключей) на другое (значений). Добавить в коллекцию минимум пять пар «ключ-значение». Несколько ключей должны иметь одно и тоже значение. Выполнить прямой перебор коллекции используя цикл for. Добавить новый элемент с уже имеющимся в отображении ключом. Вынести список всех ключей из HashMap в отдельную коллекцию. Вынести список всех значений из HashMap в коллекцию HashSet и получить количество уникальных значений.. Определить, содержит ли коллекция HashMap определенный ключ. Определить, содержит ли коллекция HashMap определенное значение. Получить количество элементов, содержащихся в данный момент в коллекции HashMap. Удалить из коллекции выбранный объект по ключу и по значению. (слайд-помощи – 21, слайды-подсказки – 22-23).
5. Результат выполнения практической работы загрузить в СДО УГАТУ следующим образом. Сформировать архив, содержащий файлы программного кода, а также файл формата DOC, который содержит экранные формы результата выполнения.

Слайд 3

Результат выполнения практической работы (задание 3)

Слайд 4

Результат выполнения практической работы (задание 4)

Слайд 5

Хеш-таблицы (hash table)
Хеш-таблица (hash table) – это структура данных, обеспечивающая быструю вставку, поиск

и удаление объектов. Хеш-таблицы реализуются на основе массивов. Элементы таблицы хранятся в виде пар ключ-значение. Для каждого объекта выполняется преобразование в уникальное число (адрес ячейки) массива. Генерация уникального числа получается в результате хеширования на основе его ключа. Ячейки массива называются корзинами (buckets), слотами (slots).
Хеширование (hash) – процесс преобразования объекта в целочисленную форму (хеш-код), которое выполняется с помощью метода хеш-функции.
Хеш-функция (hash function) – функция, осуществляющая преобразование входных данных произвольной длины в (выходную) битовую строку установленной длины, выполняемое определенным алгоритмом. Основной целью хеш-функции является преобразование диапазона ключей в диапазон индексов, обеспечивающее равномерное распределение ключей по индексам хеш-таблицы. Требования к хэш-функциям. 1. Быстрое вычисление хэш-кода по значению ключа – сложность вычисления хэш-кода не должна зависеть от n – количества элементов в хеш-таблице. 2. Детерминированность – для заданного значения ключа хэш-функция всегда должна возвращать одно и то же значение. 3. Равномерность – хеш-функция должна равномерно заполнять массив. Класс Object имеет метод hashCode(), который используется для эффективного размещения объектов, добавляемых в коллекцию. В классах объектов данный метод должен быть переопределен (override) для эффективной работы.
Хеш-код (hash code) – результат сужающего преобразования (хеш-функции) множества значений объекта до некоторого подмножества целых чисел. Каждый Java-объект имеет свой хеш-код.
Коэффициент заполнения хеш-таблицы (load factor, fill factor) – отношение числа хранимых объектов хеш-таблицы к размеру массива (среднее число элементов на одну ячейку). От этого коэффициента зависит среднее время выполнения операций добавления, поиска и удаления объектов. Информация о диапазоне значений ключей обычно известна. На основе этого выбираются размер хеш-таблицы и хеш-функция.
Длина пробирования – количество шагов, необходимых для обнаружения элемента.

Слайд 6

Хеш-таблицы . Методы hashCode() и equals()
Вычисление хэш-кода объекта и точное сравнение объектов

– способы, которые используются для сравнения объектов. Базовый класс Object реализует методы – hashCode(), equals(), getClass(), toString(), notify(), notifyAll(), finalize(), clone().
public native int hashCode() – возвращает хэш-код объекта, который передается в качестве параметра. Допускается определять собственную реализацию метода hashCode(). Для эффективной работы с коллекцией, хеш-код не должен повторяться для неэквивалентных объектов.
System.out.println("Мурка".hashCode()); //1005126255
public boolean equals(Object obj) – используется для проверки объектов на равенство. Метод equals() должен обеспечивать: симметричность, рефлексивность и транзитивность.
System.out.println("Мурка".equals("Тишка")); //false
Эквивалентность и хеш-код взаимосвязаны между собой – хеш-код вычисляется на основании содержимого объекта: – если у двух объектов разные хэш-коды, то содержимое объектов гарантированно должно быть различно; – если у двух объектов одинаковые хэш-коды, то объекты не обязательно эквивалентны или равны (коллизия); – для одного объекта, хеш-код всегда будет одинаковым; – если объекты эквиваленты, то их хеш-коды одинаковые.
Например, есть некоторое множество объектов Animals = {cat, lion, dog}. Если hashCode(cat)!= hashCode(dog), то содержимое рассматриваемых объектов гарантированно разное. Обратное утверждение не всегда является верным – у двух разных объектов может быть различное содержимое, но одинаковые хэш-коды. Поэтому точное сравнение производится вызовом метода equals(), который возвращает true, если объекты действительно равны.

Слайд 7

Хеш-таблицы (hash table)
Работа с элементами хеш-таблицы выполняются по следующему алгоритму.
1. Вызов

хеш-функции. Добавление нового или поиск существующего объекта (ключа) требует вызова хеш-функции и определения хеш-кода, под которым хранится или должен быть сохранен объект.
2. Обращение к элементу массива. Определение сегмента (корзины, слота), который соответствует полученному хеш-коду.
.

Слайд 8

Хеш-таблицы. Понятие коллизии
Коллизия – ситуация, при которой два разных объекта получают одинаковый

хеш-код (см. рисунок). Причина коллизий возникает из особенности вычисления хеш-кода – выполняется отображение из большого пространства значений (объектов, ключей) в пространство с меньшим значением (хеш-кодов).
Существует две основных реализации хэш-таблицы: открытая адресация и метод цепочек. Например, если объект не удается разместить в ячейке с индексом, вычисленным посредством хеш-функции, метод открытой адресации выполняет поиск другой ячейки. Другое возможное решение основано на методе цепочек – для каждого индекса в хеш-таблице вводится связанный список. Ключ элемента хешируется в индекс, а полученный элемент вставляется в связанный список по данному индексу. Другие элементы, хешируемые в тот же индекс, а затем добавляются в список.

Слайд 9

Хеш-таблицы. Разрешение коллизий. Метод цепочек
Метод цепочек (chaining) – каждой ячейке массива

соответствует свой связный список. При возникновении коллизии осуществляется добавление нового элемента в данный список, т.е. элементы с одинаковым значением хеш-функции объединяются в связный список. Указатель на список хранится в советующей ячейке хеш-таблицы. Поиск и удаление элемента требуют просмотра всего списка. В Java для разрешения коллизий используется модифицированный метод цепочек.

Слайд 10

Хеш-таблицы. Разрешение коллизий. Открытая адресация
Открытая адресация (open addressing) – в каждой

ячейке хеш-таблицы хранится не указатель на связный список, а один элемент (ключ, значение). Если ячейка с индексом hash(key) занята, то осуществляется поиск следующих позициях таблицы. Основные недостатки структур с методом открытой адресации: – количество элементов в таблице не может превышать размера массива; – по мере увеличения числа элементов в таблице и повышения коэффициента заполнения (load factor) производительность структуры резко снижается, поэтому необходимо проводить повторное хеширование; – сложно организовать удаление элемента. Основное преимущество хэш-таблицы с открытой адресацией – отсутствие затрат на создание и хранение объектов списка.

Слайд 11

Хеш-таблицы. Выводы
1. Хеш-таблица создается на основе массива. Главное преимущество хеш-таблиц –

скорость добавления, поиска и удаления объектов.
2. Хеш-функция преобразует значение ключа в индекс массива. Основной целью хеш-функции является преобразование диапазона ключей (объектов) в диапазон индексов, обеспечивающее равномерное распределение ключей по индексам хеш-таблицы
3. Соответствие между хеш-кодом ключа (объекта) и хеш-кодом сегмента (корзины, слота) не хранится, а вычисляется. Конечно, появляется необходимость сравнивать объекты методом equals() но количество таких объектов ограничено.
4. Хеширование ключа в уже заполненную ячейку, корзину (buckets), слот (slots) называется коллизией.
5. Хеширование может осуществляться умножением кодов символов на разные степени констант, суммированием произведений и применением оператора вычисления остатка (%) для сокращения результата до размера хеш-таблицы.
6. Существует две основные схемы разрешения коллизий: открытая адресация и метод цепочек. При открытой адресации объекты, хешируемые в заполненную ячейку массива, размещаются в другой ячейке. В методе цепочек каждый элемент массива содержит связанный список, а все объекты, хешируемые в заданный индекс массива, вставляются в данный связанный список.
7. В Java для разрешения коллизий используется модифицированный метод цепочек.
8. Количество шагов, необходимых для обращения к элементу, называется длиной пробирования.
9. Коэффициентом заполнения – отношение количества элементов данных в хеш-таблице к размеру массива. Диапазон значений ключей обычно превышает размер массива. Заполнение хеш-таблицы более чем наполовину (или на две трети), приведет к увеличению продолжительности пробирования и, как следствие, к снижению быстродействия.

Слайд 12

Интерфейсы Set, SortedSet, NavigableSet
Интерфейс Set расширяет интерфейс Collection (см. практическую работу 1,

слайды 7-8) и определяет поведение коллекции – множество, не допускающее дублирования элементов. В Интерфейсе Set не определяются дополнительные методы. Для установления связей между элементами коллекции, используется хеш-код. Хеш-код зависит от содержимого объекта. Следовательно, взаимосвязь хеш-кода с объектом основывается на содержимом объекта.
Интерфейс SortedSet расширяет интерфейс Set и определяет поведение множеств, отсортированных в порядке возрастания. Помимо методов, предоставляемых интерфейсом Set, в интерфейсе SortedSet объявляются собственные методы.
Интерфейс NavigableSet расширяет интерфейс SortedSet, добавляя методы для повышения скорости поиска упорядоченных элементов.

Слайд 13

Интерфейс Map
Интерфейс Map – является самостоятельным интерфейсом (не расширяет интерфейс Collection, см.

практическую работу 1, слайды 7-8), описывающим функциональность ассоциативных массивов. Интерфейсы Map и Collection не совместимы, т.к. созданы для различных структур данных. Map используется для отображения каждого элемента из одного множества объектов (ключей) на другое (значений): – каждому элементу из множества ключей ставится в соответствие множество значений (список); – одному элементу из множества значений может соответствовать один или более элементов из множества ключей; – параметризируется при помощи двух обобщенных типов: один для ключей, другой для значений.
Реализующие классы HashMap, LinkedHashMap, SortedMap, TreeMap хранят неупорядоченный набор объектов парами ключ-значение, в порядке возрастания ключей. Порядок следования пар ключ/значение не определен.

Слайд 14

Основные методы интерфейса Map

Слайд 15

Классы коллекций

Слайд 16

Реализация интерфейса Set. Класс HashSet
Класс HashSet – реализует интерфейс Set, необходим

для создания неупорядоченного множества уникальных элементов.
1. HashSet реализован на основе хеш-таблицы:
– порядок объектов коллекции определяется по хеш-коду; – множество HashSet может содержать только одно null значение.
3. Класс HashSet реализован с использованием метода цепочек.
2. Класс HashSet реализует интерфейс Set и объявляется следующим образом:
class HashSet
HashSet myHashSet = new HashSet<>();
3. В классе HashSet определены следующие конструкторы. HashSet() – создает хеш-множество по умолчанию. HashSet(Collection с) – создает хеш-множество, инициализируемое элементами из коллекции с. HashSet(int емкость) – создает хеш-множество, имеющее начальную емкость. Емкость – размер базового массива, используемого для хранения объектов коллекции. По мере ввода элементов в хеш-множество емкость динамически увеличивается. HashSet(int емкость, float коэффициент_заполнения) – создает хеш-множество, имеющее начальную емкость и коэффициент заполнения (емкость загрузки). Коэффициент заполнения определяет насколько заполненным должно быть хеш-множество, прежде чем будет изменен его размер. Диапазон принимаемых значений – от 0,0 до 1,0. Таким образом, когда количество объектов превысит емкость множества, умноженной на коэффициент заполнения, то множество расширяется. В конструкторах, которые не принимают коэффициент заполнения в качестве параметра, выбирается значение – 0,75.
4. Преимущества. Высокая скорость добавления, поиска и удаления объектов: – не требуется перебирать элементы в определенном порядке; – сравнение хэш-кода происходит многократно быстрее; – соответствие между хеш-кодом ключа и хеш-кодом сегмента (корзины, слота) не хранится, а вычисляется.
5. Недостатки. Отсутствие удобного способа перебора элементов в определенном порядке (например, от меньших к большим). Не все сегменты (корзины, слота) заполнены списками, на нулевые сегмента (корзины, слота) также затрачивается память.

Слайд 17

Реализация интерфейса Map. Класс HashMap
Класс HashMap – реализует интерфейс Map, необходим для

создания множества (отображения, карты) с сохранением связи между ключами и значениями в виде пар "ключ-значение".
1. HashMap реализован на основе хеш-таблицы: – порядок объектов коллекции определяется по хеш-коду; – ключи должны быть уникальными, а значения могут быть дублированными; – множество HashMap может содержать один null ключ и множество null значений; – по заданному ключу можно найти значение объекта; – в качестве ключей и значений могут выступать любые объекты (числа, строки или объекты других классов).
2. Класс HashMap реализован с использованием метода цепочек.
3. Класс HashMap реализует интерфейс Map и объявляется следующим образом:
class HashMap
HashMap myHashMap = new HashMap<>();
4. В классе HashMap определены следующие конструкторы. HashМap() – создает хеш-отображение по умолчанию. HashМap (Мар m) – хеш-отображение инициируется элементами отображения m. HashМap (int емкость) – задается емкость хеш-отображения HashМap (int емкость, float коффициент_заполнения) – емкость и коэффициент заполнения хеш-отображения задаются в качестве аргументов конструктора.
5. Преимущества. Высокая скорость добавления, поиска и удаления объектов: – не требуется перебирать элементы в определенном порядке; – сравнение хэш-кода происходит многократно быстрее; – организован доступ к объекту по ключу; – cоответствие между хеш-кодом ключа и хеш-кодом сегмента (корзины, слота) не хранится, а вычисляется; – ключом Map может быть любое значение (объект, строка, символ, примитивы); – ключи в Map упорядочены.
6. Недостатки. Отсутствие удобного способа перебора элементов в определенном порядке (например, от меньших к большим). Не все сегменты (корзины, слота) заполнены списками, на нулевые сегмента (корзины, слота) также затрачивается память.

Слайд 18

Применение класса HashSet
1.Создадим множество HashSet, например, cats, содержащее объекты ссылочного типа

String, используя конструктор, определенный в классе HashMap: Set cats = new HashSet<>(); или Set cats = new HashSet<>(5).
2. Добавим в множество несколько символьных строк. Символьные строки, заключенные в кавычки, преобразуются в объекты ссылочного типа String. Добавляемые в коллекцию объекты должны быть совместимы с типом данных коллекции:
cats.add("Барсик");
cats.add("Мурка");
cats.add("Плюшка");
cats.add("Тучка");
3. Выведем на экран элементы множества используя цикл for:
for(String cat: cats) {
System.out.println("\t имя кошки: " + cat);
}
4. Добавим новый элемент, который уже присутствует в множестве: cats.add("Мурка");
5. Определим, содержит ли коллекция определенный объект: if cats.contains("Тучка")){}
6. Удалим из множества выбранный объект: cats.remove("Тучка");
7. Получим количество элементов, содержащихся в данный момент в коллекции cats: cats.size()
8. Удалим все элементы из множества: cats.clear();
9. Проверим, является ли коллекция HashSet пустой: cats.isEmpty();

Слайд 19

Применение класса HashSet (начало)

Слайд 20

Применение класса HashSet (окончание)

Слайд 21

Применение класса HashMap
1. Создадим отображение HashMap, например, catMap, содержащее объекты ссылочного

типа String, используя конструктор, определенный в классе HashMap. Укажем тип для ключей (String), а также тип для значений (String): Map catMap = new HashMap<>() или Map catMap = new HashMap<>(5).
2. Добавим в множество несколько пар «ключ-значение». Несколько ключей должны иметь одно и тоже значение. Чтобы избежать дублирования в качестве ключа зададим регистрационный номер cats, а в качестве значения – имя:
catMap.put("1m12", "Мурка");
catMap.put("2t15", "Тучка");
catMap.put("3b16", "Барсик");
catMap.put("4b20", "Барсик");
3. Выведем на экран элементы множества используя цикл for:
for (Map.Entry cat : catMap.entrySet()){
System.out.println("key: " + cat.getKey() + " value: " + cat.getValue());
}
4. Добавим новый элемент с уже имеющимся в отображении ключом: catMap.put("3", "Мурка");
5. Вынесем список всех ключей из HashMap в отдельную коллекцию:
List keys = new LinkedList<>(catMap.keySet());
6. Вынесем список всех значений из HashMap в коллекцию HashSet и получить количество уникальных значений:
Set values = new HashSet<>(catMap.values());
System.out.println(values.size());
7. Определим, содержит ли коллекция определенный ключ: if (catMap.containsKey("3")){}
8. Определим, содержит ли коллекция определенное значение: if (catMap.containsValue("Мурка")){}
9. Получим количество элементов, содержащихся в данный момент в коллекции: catMap.size();
10. Удалим из коллекции выбранный объект по ключу и значению:
catMap.remove("3b16");
catMap.remove("2", "Тучка");

Коллекции HashSet, HashMap

Содержание

Задание на практическую работу 21. Изучить теоретический материал (слайды 5-17). Внимательно ознакомиться

Результат выполнения практической работы (задание 3)

Результат выполнения практической работы (задание 4)

Хеш-таблицы (hash table)Хеш-таблица (hash table) – это структура данных, обеспечивающая быструю вставку, поиск

Хеш-таблицы . Методы hashCode() и equals()Вычисление хэш-кода объекта и точное сравнение объектов

Хеш-таблицы (hash table)Работа с элементами хеш-таблицы выполняются по следующему алгоритму. 1. Вызов

Хеш-таблицы. Понятие коллизии Коллизия – ситуация, при которой два разных объекта получают одинаковый

Хеш-таблицы. Разрешение коллизий. Метод цепочек Метод цепочек (chaining) – каждой ячейке массива

Хеш-таблицы. Разрешение коллизий. Открытая адресация Открытая адресация (open addressing) – в каждой

Хеш-таблицы. Выводы 1. Хеш-таблица создается на основе массива. Главное преимущество хеш-таблиц –

Интерфейсы Set, SortedSet, NavigableSetИнтерфейс Set расширяет интерфейс Collection (см. практическую работу 1,

Интерфейс MapИнтерфейс Map – является самостоятельным интерфейсом (не расширяет интерфейс Collection, см.