Бинарные поисковые деревья

Содержание

Слайд 2

Словарные операции

поиск элемента с заданным ключом х
добавление нового элемента с заданным ключом

Словарные операции поиск элемента с заданным ключом х добавление нового элемента с
х
удаление элемента с заданным ключом х

ФПМИ БГУ

Слайд 3

Бинарное поисковое дерево

Поисковое
5. Каждой вершине поставлено в соответствие некоторое целое число -

Бинарное поисковое дерево Поисковое 5. Каждой вершине поставлено в соответствие некоторое целое
ключ. Для каждой вершины v все ключи в её левом поддереве строго меньше ключа вершины v, а в правом – строго больше.

корень

n – число вершин
m=n-1 – число дуг

ФПМИ БГУ

Корневое дерево
Ориентированный граф, в существует ровно одна вершина без входящих дуг (корень).
В каждую вершину, за исключением корня, входит ровно одна дуга.
Из корня дерева существует единственный путь в любую вершину.

Бинарное
4. Каждая вершина содержит не более 2-х сыновей (левый и, возможно, правый).

Слайд 4

10

18

23

21

22

20

19

11

13

14

17

3

4

6

8

9

7

2

1

Построить бинарное поисковое дерево для последовательности элементов:

ФПМИ БГУ

2, 1, 6, 4,

10 18 23 21 22 20 19 11 13 14 17 3
3, 10, 9, 8, 7, 18, 17, 14, 13, 11, 19, 20, 22, 23, 21

2

?

так как мы договорились (см. определение) , что в дереве все ключи различны, то одинаковые элементы при добавлении будем игнорировать

Слайд 5

10

18

23

21

22

20

19

11

13

14

17

3

4

6

8

9

7

2

1

Высота вершины: длина наибольшего пути от вершины до одного из её потомков.

10 18 23 21 22 20 19 11 13 14 17 3

высота (10) = 5
Высота дерева: высота корня.
высота (дерева) = 7

Глубина вершины: длина пути из корня в вершину (этот путь единственный).
глубина (10) = 2

Уровень вершины: высота дерева минус глубина вершины
уровень (10) = высота (дерева)- глубина (10) =7 – 2 = 5

ФПМИ БГУ

Высота, глубина, уровень

0-й уровень

1-й уровень

2-й уровень

7-й уровень

3-й уровень

4-й уровень

5-й уровень

6-й уровень

Слайд 6

10

18

23

21

22

20

19

11

13

14

17

3

4

6

8

9

7

2

1

Для полупути снимается ограничение на направление дуг.
Пример полупути, соединяющего вершины 1 и

10 18 23 21 22 20 19 11 13 14 17 3
7: 1 - 2 - 6 - 10 - 9 - 8 - 7

ФПМИ БГУ

Путь, полупуть

Слайд 7

10

18

23

21

22

20

19

11

13

14

17

3

4

6

8

9

7

2

1

Центральная вершина полупути
такая вершина, что количество вершин в полупути до неё равно

10 18 23 21 22 20 19 11 13 14 17 3
количеству вершин после неё

Средняя по значению (медиана) вершина полупути такая вершина, что у половины из оставшихся вершин этого полупути ключ меньше, а у половины – больше

Что делать, если число вершин, среди которых надо найти центральную или среднюю ЧЁТНО?

ФПМИ БГУ

Центральная и средняя вершины полупути

?

центральной и средней вершины НЕ СУЩЕСТВУЕТ

Слайд 8

10

18

23

21

22

20

19

11

13

14

17

6

8

9

2

Наибольшим полупутём в дереве будем называть полупуть наибольшей длины.

ФПМИ БГУ

Корнем полупути назовём

10 18 23 21 22 20 19 11 13 14 17 6
вершину полупути с самой большой высотой.

Слайд 9

10

18

23

21

22

20

19

11

13

14

17

3

4

6

8

9

2

10

18

23

21

22

20

19

11

13

14

17

3

4

6

8

9

2

Пример.
1) Длина наибольшего полупути = 8.
2) Вершины 18 и 6 являются корнями

10 18 23 21 22 20 19 11 13 14 17 3
полупутей наибольшей длины.
3) Через вершину 18 проходить 5 попарно различных полупутей наибольшей длины.

ФПМИ БГУ

Слайд 10

прямой (левый, правый) - PreOrderTraversal (v)

ФПМИ БГУ

Обходы

обратный (левый, правый) - PostOrderTraversal (v)

внутренний

прямой (левый, правый) - PreOrderTraversal (v) ФПМИ БГУ Обходы обратный (левый, правый)
(левый, правый) - InOrderTraversal (v)

Время выполнения обхода: пропорционально числу вершин в дереве (=n)

Слайд 11

10

18

23

21

22

20

19

11

13

14

17

3

4

6

8

9

2

1

7

прямой левый обход
def PreOrderTraversal (v):
if v is not None:
Action (v)

10 18 23 21 22 20 19 11 13 14 17 3
PreOrderTraversal (v.left)
PreOrderTraversal (v.right)

прямой правый обход
def PreOrderTraversal (v):
if v is not None:
Action (v)
PreOrderTraversal (v.right)
PreOrderTraversal (v.left)

прямой левый обход

прямой правый обход

2, 1, 6, 4, 3, 10, 9, 8, 7, 18, 17, 14, 13, 11, 19, 20, 22, 21, 23

2, 6, 10, 18, 19, 20, 22, 23, 21, 17, 14, 13, 11, 9, 8, 7, 4, 3, 1

ФПМИ БГУ

Слайд 12

10

18

23

21

22

20

19

11

13

14

17

3

4

6

8

9

2

1

7

обратный левый обход
def PostOrderTraversal (v):
if v is not None:
PostOrderTraversal (v.left)

10 18 23 21 22 20 19 11 13 14 17 3
PostOrderTraversal (v.right)
Action (v)

обратный правый обход
def PostOrderTraversal (v):
if v is not None:
PostOrderTraversal (v.right)
PostOrderTraversal (v.left)
Action (v)

обратный левый обход

обратный правый обход

1 ,3, 4, 7, 8, 9, 11, 13, 14, 17, 21, 23, 22, 20, 19, 18, 10, 6, 2

23, 21, 22, 20, 19, 11, 13, 14, 17, 18, 7, 8, 9, 10, 3, 4, 6, 1, 2

ФПМИ БГУ

Слайд 13

10

18

23

21

22

20

19

11

13

14

17

3

4

6

8

9

2

1

7

внутренний левый обход
def InOrderTraversal (v):
if v is not None:
InOrderTraversal (v.left)

10 18 23 21 22 20 19 11 13 14 17 3
Action (v)
InOrderTraversal (v.right)

внутренний правый обход
def InOrderTraversal (v):
if v is not None:
InTraversal (v.right)
Action (v)
InOrderTraversal (v.left)

внутренний левый обход
(ключи отсортированы по возрастанию)

внутренний правый обход
(ключи отсортированы по убыванию)

1, 2, 3, 4, 6, 7, 8, 9, 10, 11, 13, 14, 17, 18, 19, 20, 21, 22, 23

23, 22, 21, 20, 19, 18, 17, 14, 13, 11, 10, 9, 8, 7, 6, 4, 3, 2, 1

ФПМИ БГУ

Слайд 14

ФПМИ БГУ

Примеры задач

Найти высоту дерева.
Определить, является ли дерево сбалансированнным по высоте?
Найти длину

ФПМИ БГУ Примеры задач Найти высоту дерева. Определить, является ли дерево сбалансированнным
наибольшего полупути (корни полупутей наибольшей длины).
Проверить, является ли дерево идеально-сбалансированным по числу вершин?
Найти среднюю по значению вершину в дереве.
Найти среднюю по значению вершину среди вершин, у которых высоты поддеревьев совпадают.
Найти среднюю по значению вершину среди вершин некоторого пути.

Слайд 15

Обратный левый (или правый) обход

если вершина v лист, то её высота равна

Обратный левый (или правый) обход если вершина v лист, то её высота
0;
если у вершины v только одно поддерево, то её высота равна высоте этого поддерева +1;
если у вершины v есть оба поддерева, то её высота равна максимуму из высот поддреревьев, увеличенному на 1.

10

18

23

21

22

20

19

11

13

14

17

6

8

9

2

0

1

0

0

0

1

2

3

1

2

4

5

6

7

3

Найти высоту дерева.
Определить, является ли дерево сбалансированнным по высоте (для всех вершин высоты их подеревьев должны отличаться не более, чем на 1)?

ФПМИ БГУ

Нужно знать высоту каждой вершины.

Слайд 16

10

18

23

21

22

20

19

11

13

14

17

6

8

9

2

0

1

0

0

0

1

2

3

1

2

4

5

6

7

3

Зная метки высот, можно найти длину наибольшего полупути и его корень:

Вершина

10 18 23 21 22 20 19 11 13 14 17 6
18: 3+3+2=8
является корнем наибольшего полупути.
Длина наибольшего полупути равна 8.

3) Найти длину наибольшего полупути (корни полупутей наибольшей длины).

ФПМИ БГУ

найдём ту вершину v, для которой сумма меток высот её поддеревьев, увеличенное на 2 или 1 (в зависимости от того, сколько поддеревьев у вершины v), является наибольшей.

Слайд 17

10

18

23

21

22

20

19

11

13

14

17

6

8

9

2

0

1

0

0

0

1

2

3

1

2

4

5

6

7

3

3) Найти длину наибольшего полупути (корни полупутей наибольшей длины).

ФПМИ БГУ

1

0

7

2

Вершины 2, 10,

10 18 23 21 22 20 19 11 13 14 17 6
18 являются корнями полупутей наибольшей длины 8.

Вопрос 1.
Сколько полупутей наибольшей длины проходит через вершины?
1
2
10
18
19

Вопрос 2.
Через какие вершины пройдёт наибольшее число полупутей наибольшей длины?

Слайд 18

если вершина v лист, то её метка равна 1;
если у вершины v

если вершина v лист, то её метка равна 1; если у вершины
только одно поддерево, то её метка равна метке этого поддерева +1;
если у вершины v есть оба поддерева, то её метка равна сумме меток поддеревьев, увеличенной на 1.

10

18

23

21

22

20

19

11

13

14

17

6

8

9

2

1

2

1

1

1

2

3

4

3

4

10

13

14

15

5

4) Проверить, является ли дерево идеально-сбалансированным по числу вершин: для каждой вершины число вершин в поддеревьях должно отличаться не более, чем на 1 (для простоты вычислений, если у вершины отсутствует поддерево, то число вершин в таком поддереве полагается равным 0).

ФПМИ БГУ

Нужно знать число вершин в каждом поддереве.

Обратный левый (или правый) обход

Слайд 19

Выполнить любой обход дерева и подсчитать число вершин (n=15).
Если n –

Выполнить любой обход дерева и подсчитать число вершин (n=15). Если n –
чётно, то полагаем, что средней не существует.
Если n – не чётно, то выполним внутренний обход, считая пройденные во время этого обхода вершины. Остановимся, как только счётчик пройденных вершин станет равным [n/2]+1 (=8).

10

18

23

21

22

20

19

11

13

14

17

6

8

9

2

1

2

3

4

5

6

7

8
вершина 14 является средней по значению

ФПМИ БГУ

5) Найти среднюю по значению вершину в дереве
(не использовать дополнительную память, зависящую от n).

Сначала нужно узнать чётно или нет число вершин в дереве.
Если число вершин нечётно, то средняя вершина существует и её можно найти, просматривая вершины дерева, например, по не убыванию ключей.
(на рис. нумерация вершин при левом InOrderTraversal)

Слайд 20

Сначала обратным обходом расставить вершинам метки высот. Во время этого же обхода

Сначала обратным обходом расставить вершинам метки высот. Во время этого же обхода
подсчитать количество вершин, у которых метки высот поддеревьев совпали. Пусть у нас m таких вершин.
Если m – чётно, то полагаем, что считаем, что средней не существует.
Если m – не чётно, то выполним внутренний обход, считая при этом только лишь те вершины, для которых высоты их поддеревьев совпадают. Остановимся, как только счётчик станет равным [m/2]+1.

18

23

22

20

19

11

12

14

17

0

1

2

вершины, для которых высоты поддеревьев совпали:
11,12,13, 18,21,22,23

4

3

3

2

1

0

21

0

13

0

ФПМИ БГУ

6) Найти среднюю по значению вершину среди вершин, у которых высоты поддеревьев совпадают.

Сначала нужно узнать чётно или нет число нужных вершин. Если число нечётно, то средняя вершина существует и её можно найти, просматривая нужные вершины, например, по не убыванию ключей.

Внутренний (левый) обход:
11,12,13, 14, 17, 18,19,20,21,22,23

Слайд 21

m

i

a

t

u

s

b

p

f

вершина t является средней по значению

f

p

m

i

b

s

u

t

ФПМИ БГУ

7) Найти среднюю по значению вершину

m i a t u s b p f вершина t является
среди вершин некоторого пути.
Предположим, что задан корень этого пути.

Слайд 22

Удаление вершины

ФПМИ БГУ

Случай 1. Удаляется лист.

Случай 2. Удаляется вершина, у которой есть

Удаление вершины ФПМИ БГУ Случай 1. Удаляется лист. Случай 2. Удаляется вершина,
только одно поддерево

Случай 3. Удаляется вершина, у которой есть оба поддерева (возможно «правое» или «левое» удаление).

Слайд 23

ФПМИ БГУ

Случай 1. Удаляется лист.

ФПМИ БГУ Случай 1. Удаляется лист.

Слайд 24

ФПМИ БГУ

Случай 2. Удаляется вершина, у которой есть только одно поддерево

ФПМИ БГУ Случай 2. Удаляется вершина, у которой есть только одно поддерево

Слайд 25

ФПМИ БГУ

Случай 2. Удаляется вершина, у которой есть только одно поддерево

ФПМИ БГУ Случай 2. Удаляется вершина, у которой есть только одно поддерево

Слайд 26

10

18

23

21

22

20

19

11

13

14

17

6

8

9

2

правое удаление

11

18

23

21

22

20

19

13

14

17

6

8

9

2

12

11

ФПМИ БГУ

Случай 3. Удаляется вершина, у которой есть оба поддерева (

10 18 23 21 22 20 19 11 13 14 17 6
«правое» удаление).

Слайд 27

10

18

23

21

22

20

19

11

13

14

17

6

8

9

2

левое удаление

9

18

23

21

22

20

19

13

14

17

6

8

2

12

9

ФПМИ БГУ

Случай 3. Удаляется вершина, у которой есть оба поддерева (

10 18 23 21 22 20 19 11 13 14 17 6
«левое» удаление).

Слайд 28

!!! Если у удаляемой вершины только одно поддерево, то НЕТ ПОНЯТИЯ ПРАВОЕ/ЛЕВОЕ
удаление.

!!! Если у удаляемой вершины только одно поддерево, то НЕТ ПОНЯТИЯ ПРАВОЕ/ЛЕВОЕ
Удаление всегда выполняется однозначною.

Найти вершину, которая удовлетворяет заданному свойству. Удалить эту вершину (правое удаление).

?

(рис.1)

или

ФПМИ БГУ

(рис.2)

Ответ: правильно выполнено удаление на рис. 1.

Слайд 29

Оценки числа операций
в худшем случае

10

18

19

6

2

построение дерева для последовательности из n элементов

поиск

Оценки числа операций в худшем случае 10 18 19 6 2 построение
элемента с заданным ключом x

добавление элемента с заданным ключом х

в худшем случае высота дерева
h = n-1

обход дерева из n вершин

удаление элемента с заданным ключом x

ФПМИ БГУ

h

h

n·h

n

h

Слайд 30

ФПМИ БГУ

В 1962 году советские учёные
Г.М.Адельсон-Вельский
и 
Е.М.Ландис
предложили структуру данных сбалансированного поискового

ФПМИ БГУ В 1962 году советские учёные Г.М.Адельсон-Вельский и Е.М.Ландис предложили структуру данных сбалансированного поискового дерева.
дерева.

Слайд 31

Георгий Максимович Адельсон-Вельский

Евгений Михайлович Ландис 

Георгий Максимович Адельсон-Вельский Евгений Михайлович Ландис

Слайд 32

ФПМИ БГУ

В рамках дисциплины в дальнейшем мы подробно исследуем эту структуру данных,

ФПМИ БГУ В рамках дисциплины в дальнейшем мы подробно исследуем эту структуру
а пока лишь получим краткую информацию о ней.

Слайд 33

АВЛ-дерево – это бинарное поисковое дерево, которое является сблансированным по высоте.

2

4

1

3

5

для

АВЛ-дерево – это бинарное поисковое дерево, которое является сблансированным по высоте. 2
каждой вершины дерева высоты её поддеревьев отличаются не более, чем на 1

ФПМИ БГУ

АВЛ — аббревиатура, образованная первыми буквами фамилий создателей.

Слайд 34


ТЕОРЕМА. Пусть n – число внутренних вершин АВЛ-дерева, а h – его

ТЕОРЕМА. Пусть n – число внутренних вершин АВЛ-дерева, а h – его
высота.
Тогда справедливы следующие неравенства:

ФПМИ БГУ

Слайд 35

Использование поисковых деревьев на практике

ФПМИ БГУ

Использование поисковых деревьев на практике ФПМИ БГУ

Слайд 36

Сортировка деревом

Предположим, что на вход поступаю числа, среди которых нет повторяющихся.
Рассмотрим

Сортировка деревом Предположим, что на вход поступаю числа, среди которых нет повторяющихся.
следующий алгоритм сортировки.
1. По последовательности чисел сначала построим АВЛ-дерево.
n*log n
2. Выполним внутренний левый обход построенного дерева.
n
В результате работы алгоритма числа будут выданы в порядке возрастания.
Какое время работы алгоритма в худшем случае?
n*log n

ФПМИ БГУ

Слайд 37

Абстрактный тип данных: множество (set)

Множество (англ. set) —хранит набор попарно различных объектов

Абстрактный тип данных: множество (set) Множество (англ. set) —хранит набор попарно различных
без определённого порядка.
Интерфейс множества включает три основные операции:
Insert(x) — добавить в множество ключ x;
Contains(x) — проверить, содержится ли в множестве ключ x;
Remove(x) — удалить ключ x из множества.

ФПМИ БГУ

Для реализации интерфейса множества обычно используются такие структуры данных, как:
сбалансированные поисковые деревья: например, AVL-деревья, 2-3-деревья, красно-чёрные деревья.
хеш-таблицы.

В стандартной библиотеке C++ есть контейнер std::set, который реализует множество на основе сбалансированного дерева (обычно красно-чёрного), и контейнер std::unordered_set, построенный на базе хеш-таблицы.
В языке Java определён интерфейс Set, у которого есть несколько реализаций, среди которых классы TreeSet (работает на основе красно-чёрного дерева) и HashSet (на основе хеш-таблицы).
В языке Python есть только встроенный тип set, использующий хеширование, но нет готового класса множества, построенного на сбалансированных деревьях.

Слайд 38

Абстрактный тип данных ассоциативный массив (map)

Ассоциативный массив (англ. associative array), или отображение

Абстрактный тип данных ассоциативный массив (map) Ассоциативный массив (англ. associative array), или
(англ. map), или словарь (англ. dictionary), —хранит пары вида (ключ, значение), при этом каждый ключ встречается не более одного раза.
Название «ассоциативный» происходит от того, что значения ассоциируются с ключами.
Интерфейс ассоциативного массива включает операции:
Insert(k,v) — добавить пару, состоящую из ключа k и значения v;
Find(k) — найти значение, ассоциированное с ключом k, или сообщить, что значения, связанного с заданным ключом, нет;
Remove(k) — удалить пару, ключ в которой равен k.

ФПМИ БГУ

Данный интерфейс реализуется на практике теми же способами, что и интерфейс множества. Реализация технически немного сложнее, чем множества, но использует те же идеи.
Для языка программирования C++ в стандартной библиотеке доступен контейнер std::map, работающий на основе сбалансированного дерева (обычно красно-чёрного), и контейнер std::unordered_map, работающий на основе хеш-таблицы.
В языке Java определён интерфейс Map, который реализуется несколькими классами, в частности классом TreeMap (базируется на красно-чёрном дереве) и HashMap (базируется на хеш-таблице).
В языке Python очень широко используется встроенный тип dict. Этот словарь использует внутри хеширование.

Слайд 39

Сборник задач по теории алгоритмов : учеб.-метод. пособие / В.М. Котов, Ю.Л.

Сборник задач по теории алгоритмов : учеб.-метод. пособие / В.М. Котов, Ю.Л.
Орлович, Е.П. Соболевская, С.А. Соболь – Минск : БГУ, 2017. С. 122-180

Литература

https://acm.bsu.by/wiki/Программная_реализация_бинарных_поисковых_деревьев

ФПМИ БГУ

0.1 построение дерева 0.2 удаление вершин из дерева 0.3 проверка является ли бинарное дерево поисковым

Общие задачи