Структуры и алгоритмы обработки данных. Лекция 1

Март 9, 2021

Главная
Информатика
Структуры и алгоритмы обработки данных. Лекция 1

Содержание

2. Литература по алгоритмизации: Кнут Д. Искусство программирования. Тома 1-4, 1976-2013. Вирт Н. Алгоритмы + структуры данных
3. Литература по С++: Страуструп Б. Программирование. Принципы и практика с использованием C++. 2-е изд., 2016. Прата
4. Интернет-ресурсы (общего назначения): Национальный открытый университет «ИНТУИТ» [Электронный ресурс] URL: http://www.intuit.ru/ (дата обращения 11.09.2016). Хабр [Электронный
5. 1. Алгоритмы: вводные понятия.
6. Алгоритм (лат. algorithmi) – Это набор инструкций, описывающих порядок действий исполнителя, для достижения определённого результата (неформальное
7. Алгоритм вычислений Алгоритм решения вычислительной задачи – это корректно определённая вычислительная процедура, на вход которой подаётся
8. Исполнитель – Это абстрактная или реальная (техническая или биологическая) система, способная выполнить действия, предписываемые алгоритмом Неформальный
9. Теория алгоритмов – Наука на стыке математики и информатики об общих свойствах и закономерностях алгоритмов и
10. Способы формализации алгоритма Теория автоматов: машина Тьюринга, машина Поста; Рекурсивные функции Гёделя — Эрбрана — Клини
11. Виды алгоритмов Детерминированные (жёсткие, механические) – единственная и достоверная последовательность инструкций, приводящая к однозначному результату Гибкие:
12. Свойства алгоритма: Дискретность – разбиение на конечное количество отдельных шагов Понятность – включает только команды из
13. Способы записи алгоритма Словесный (на естественном языке) Формульный Табличный (для реляционных задач) Графический (блок-схемы) Операторный –
14. Компьютерная программа – Это алгоритм решения вычислительной задачи компьютером Исполнитель Машинная команда: КОп (обяз.часть) Адресная часть
15. Язык программирования – Это набор допустимых операторов, синтаксические и семантические правила их использования для создания компьютерных
16. 2. Корректность алгоритма.
17. Инвариант Алгоритм корректен, если для каждого ввода результатом его работы является корректный вывод Методы оценки корректности
18. Инвариант цикла – Свойство, сохраняемое циклом – это логическое выражение (предикат), истинное непосредственно перед и сразу
19. Доказательство корректности цикла инвариантом 1. Доказывается, что выражение инварианта истинно перед началом цикла (инициализация). 2. Доказывается,
20. Схема проверки инварианта цикла
21. Пример – алгоритм поиска минимума в массиве Формулировка инварианта: После выполнения каждого шага цикла в переменной
22. Область неопределённости Область изменения параметров задачи [1,n) можно разделить на две части: исследованную область, для которой
23. Пример – алгоритм суммирования элементов массива После каждого шага цикла при любом i к переменной Sum
24. Пример – сортировка массива пузырьком На каждом шаге внешнего цикла на свое место «всплывает» один элемент
25. 3. Анализ эффективности алгоритма
26. Анализ алгоритма Позволяет предсказать требуемые для его выполнения ресурсы (время работы процессора, память и пр.) На
27. Эффективность алгоритма Критерии – скорость (время) и расход памяти (или других ресурсов – диска, трафик в
28. Сложность алгоритма Сложность как характеристика связана с эффективностью: Эффективный алгоритм требует приемлемое время исполнения и разумную
29. Вычислительная сложность Составляющие: Временная сложность - отражает временные затраты на реализацию алгоритма Емкостная сложность – отражает
30. Практический метод (1/2) Характеризуется измеримыми параметрами: Временная сложность – во временных единицах (микро-, милли-, секундах) или
31. Практический метод (2/2) Факторы, влияющие на оценку: Особенности аппаратно-программной платформы: Характеристики оборудования (тактовая частота, объём ОЗУ
32. Теоретический подход (1/2) Характеризует алгоритм без привязки к конкретному оборудованию, ПО и средствам реализации Временная сложность
33. Теоретический подход (2/2) Факторы, влияющие на оценку эффективности (сложности): Объём входных данных (размер входа, размерность задачи)
34. Модель вычислительной машины Идеализированная одноядерная однопроцессорная машина с памятью с произвольным доступом (RAM) Команды – арифметические,
35. Время работы алгоритма Тогда время работы алгоритма складывается из элементарных операций (шагов), которые необходимо выполнить Время
36. Функция роста Время работы – это функция от объёма входных данных Пусть n – объём входных
37. Лучший, средний и худший случаи Пусть рассматривается алгоритм проверки наличия числа в некотором массиве Если этот
38. Правила определения количества операторов в одной инструкции алгоритма 1. В строке алгоритма расположена одна простая команда
39. Пример 1. Среднее арифметическое всех положительных чисел массива A[n] T(n)=1+1+(n+1)+n+n+n+1+1=4n+5 Порядок роста: 4 и 5 –
41. Скачать презентацию

Слайд 2

Литература по алгоритмизации:
Кнут Д. Искусство программирования. Тома 1-4, 1976-2013.
Вирт Н. Алгоритмы +

структуры данных = программы, 1985.
Лафоре Р. Структуры данных и алгоритмы в Java. 2-е изд., 2013.
Макконнелл Дж. Основы современных алгоритмов. 2-е изд., 2004.
Седжвик Р., Уэйн К. Алгоритмы на Java. 4-е изд., 2013.
Скиена С. Алгоритмы. Руководство по разработке, 2011.
Стивенс Р. Алгоритмы. Теория и практическое применение (С#), 2016.
Хайнеман Д. и др. Алгоритмы. Справочник с примерами на C, C++, Java и Python, 2017.

Слайд 3

Литература по С++:
Страуструп Б. Программирование. Принципы и практика с использованием C++. 2-е

изд., 2016.
Прата С. Язык программирования С++. Лекции и упражнения. - 6-е изд., 2012.
Шилдт Г. Полный справочник по C++. 4-е изд., 2006.
Хортон А. Visual C++ 2010. Полный курс, 2011.
Седжвик Р. Фундаментальные алгоритмы на C++, 2001-2002
Павловская Т.А. C/C++. Программирование на языке высокого уровня, 2003.

Слайд 4

Интернет-ресурсы (общего назначения):
Национальный открытый университет «ИНТУИТ» [Электронный ресурс] URL: http://www.intuit.ru/ (дата обращения

11.09.2016).
Хабр [Электронный ресурс]. URL: http://habr.ru/ (дата обращения 01.07.2014).
Tproger [Электронный ресурс] URL: https://tproger.ru/ (дата обращения 07.09.2018).
СodeNet – всё для программиста [Электронный ресурс]. URL: http://www.codenet.ru/ (дата обращения 07.09.2018).
MIT OpenCourseWare [Электронный ресурс]. URL: http://ocw.mit.edu (дата обращения 01.07.2014).

Слайд 5

1. Алгоритмы: вводные понятия.

Слайд 6

Алгоритм (лат. algorithmi) –
Это набор инструкций, описывающих порядок действий исполнителя, для достижения

определённого результата (неформальное определение)
Базисное понятие в математике:
Вычисления (вычислительная задача) – это обработка числовой информации по определённому алгоритму. →

Слайд 7

Алгоритм вычислений
Алгоритм решения вычислительной задачи – это корректно определённая вычислительная процедура, на

вход которой подаётся значение (набор значений), и результатом выполнения которой является выходное значение (набор значений)
Алгоритм корректен, если для каждого ввода результатом его работы является корректный вывод.

Слайд 8

Исполнитель –
Это абстрактная или реальная (техническая или биологическая) система, способная выполнить действия,

предписываемые алгоритмом
Неформальный (знает конечную цель А.) и формальный
Характеристики:
Среда (обстановка) – место действия
Система команд:
Должны быть заданы условия применимости (состояние среды)
Описаны результаты выполнения
Набор действий
Отказы (недопустимое для выполнения команды состояние среды).

Слайд 9

Теория алгоритмов –
Наука на стыке математики и информатики об общих свойствах

и закономерностях алгоритмов и разнообразных формальных моделях их представления
Теоретическая основа вычислительных наук
Задачи:
Формализация алгоритма (модели вычислений) →
Формализация задач
Алгоритмическая неразрешимость
Уровни сложности (классификация, анализ, критерии качества).

Слайд 10

Способы формализации алгоритма
Теория автоматов:
машина Тьюринга,
машина Поста;
Рекурсивные функции Гёделя — Эрбрана — Клини
Нормальный алгоритм

Маркова
λ-исчисление Чёрча.

Слайд 11

Виды алгоритмов
Детерминированные (жёсткие, механические) – единственная и достоверная последовательность инструкций, приводящая к

однозначному результату
Гибкие:
Вероятностные (стохастические):
Используют случайные величины (ГСЧ),
Несколько путей решения, приводящими к высоко вероятному достижению результата;
Эвристические – используют различные разумные соображения без строгих обоснований.

Слайд 12

Свойства алгоритма:
Дискретность – разбиение на конечное количество отдельных шагов
Понятность – включает только

команды из набора допустимых команд исполнителя
Детерминированность (определённость) – каждый следующий шаг однозначно определяется состоянием системы – один и тот же ответ для одних и тех же исходных данных
Результативность – всегда приводит к получению определённого результата
Массовость – применимость к множеству наборов начальных данных
Завершаемость (конечность) – результат за конечное время (число шагов).

Слайд 13

Способы записи алгоритма
Словесный (на естественном языке)
Формульный
Табличный (для реляционных задач)
Графический (блок-схемы)
Операторный – из

конечного набора допустимых команд исполнителя.

Слайд 14

Компьютерная программа –
Это алгоритм решения вычислительной задачи компьютером
Исполнитель
Машинная команда:
КОп (обяз.часть)
Адресная часть
BB 11

01 B9 0D 00 B4 0E 8A 07 43 CD 10 E2 F9 CD 20 48 65 6C 6C 6F 2C 20 57 6F 72 6C 64 21
Скрипт.

Слайд 15

Язык программирования –
Это набор допустимых операторов, синтаксические и семантические правила их

использования для создания компьютерных программ
Уровневая классификация:
ЯВУ
Ассемблеры - машиноориентированные
Язык двоичных машинных кодов (нативный код)
Трансляция:
Интерпретация
Компиляция.

Слайд 16

2. Корректность алгоритма.

Слайд 17

Инвариант
Алгоритм корректен, если для каждого ввода результатом его работы является корректный вывод
Методы

оценки корректности – на принципах математической индукции (путём рассуждений)
Инвариант – это свойство некоторого класса (множества) мат.объектов, остающееся неизменным при определённого вида преобразованиях.

Слайд 18

Инвариант цикла –
Свойство, сохраняемое циклом – это логическое выражение (предикат), истинное непосредственно

перед и сразу после каждой итерации цикла, зависящее от переменных, изменяющихся в теле цикла
Инвариант цикла ≠ условие цикла
Инвариант может быть использован для доказательства корректности циклического алгоритма без необходимости его непосредственного выполнения (верификация)
Чтобы убедиться, что оптимизированный цикл остался корректным, достаточно доказать, что инвариант цикла не нарушен и условие завершения цикла достижимо.

Примеры инвариантов:
а) i + j == 9
б) i >= 0 && i <= 10

Слайд 19

Доказательство корректности цикла инвариантом
1. Доказывается, что выражение инварианта истинно перед началом цикла

(инициализация).
2. Доказывается, что выражение инварианта сохраняет свою истинность после выполнения тела цикла (сохранение). Так, по индукции, доказывается, что по завершении цикла инвариант будет выполняться.
3. Доказывается, что при истинности инварианта после завершения цикла (завершение) переменные примут те значения, которые и требуется получить (что определяется из выражения инварианта и конечных значениях переменных в условии цикла).
4. Доказывается (возможно, без применения инварианта), что цикл завершится, то есть условие завершения рано или поздно будет выполнено.
Истинность утверждений на этих этапах однозначно свидетельствует о том, что цикл выполнится за конечное время и даст желаемый результат.

Слайд 20

Схема проверки инварианта цикла

Слайд 21

Пример – алгоритм поиска минимума в массиве
Формулировка инварианта:
После выполнения каждого шага цикла

в переменной Min записан минимум из первых i элементов [1,i) массива.

Слайд 22

Область неопределённости
Область изменения параметров задачи [1,n) можно разделить на две части:
исследованную

область, для которой найден Min в [1,i);
область неопределенности [i+1,n).
Необходимо составлять цикл так, чтобы на каждой итерации область неопределенности сокращалась
В начале первой итерации исследованная область представляла собой единственную точку 1, а область неопределенности составляла [2,n)
На втором шаге область неопределенности сократилась до [3,n), на третьем – до [4,n) и т.д., пока не превратится в пустое множество.

Слайд 23

Пример – алгоритм суммирования элементов массива
После каждого шага цикла при любом i

к переменной Sum добавляется элемент массива A[i]
После окончания очередного шага цикла в Sum накоплена сумма всех элементов массива с номерами от 1 до i
Вывод: после завершения цикла (i=n), в Sum будет записана сумма всех элементов массива.

Слайд 24

Пример – сортировка массива пузырьком
На каждом шаге внешнего цикла на свое место

«всплывает» один элемент массива
Поэтому инвариант внешнего цикла: «После выполнения i-ro шага цикла первые i элементов массива отсортированы и установлены на свои места»
Во внутреннем цикле очередной «лёгкий» элемент поднимается вверх к началу массива
Перед первым шагом внутреннего цикла элемент, который будет стоять на i-м месте в отсортированном массиве, может находиться в любой ячейке от А[i] до А[n]
После каждого шага его «зона нахождения» сужается на одну позицию
Инвариант внутреннего цикла: «Элемент на i-м месте в отсортированном массиве может находиться в любой ячейке от A[i] до А[j]»
Когда в конце этого цикла j = i, элемент A[i] встаёт на своё место.

Слайд 25

3. Анализ эффективности алгоритма

Слайд 26

Анализ алгоритма
Позволяет предсказать требуемые для его выполнения ресурсы (время работы процессора, память

и пр.)
На основе анализа нескольких алгоритмов можно выбрать наиболее эффективный. →

Слайд 27

Эффективность алгоритма
Критерии – скорость (время) и расход памяти (или других ресурсов –

диска, трафик в сети и пр.)
Алгоритм А1 эффективнее алгоритма А2, если алгоритм А1 выполняется за меньшее время и (или) требует меньше компьютерных ресурсов
Составляющие эффективности:
Время – мера системной эффективности
Расход памяти – мера эффективности пространства
Количество команд относительно количества обрабатываемых данных – мера вычислительной эффективности.

Слайд 28

Сложность алгоритма
Сложность как характеристика связана с эффективностью:
Эффективный алгоритм требует приемлемое время исполнения

и разумную ресурсоемкость
Сложность возрастает при увеличении времени исполнения алгоритма и (или) задействованных ресурсов
Т.о. для одной и той же задачи более сложный алгоритм из нескольких характеризуется меньшей эффективностью.

Слайд 29

Вычислительная сложность
Составляющие:
Временная сложность - отражает временные затраты на реализацию алгоритма
Емкостная сложность –

отражает объём требующейся алгоритму памяти
Подходы к оценке:
Эмпирический анализ (экспериментальный, практический):
Практический метод →
Теоретический метод
Асимптотический анализ.

Слайд 30

Практический метод (1/2)
Характеризуется измеримыми параметрами:
Временная сложность – во временных единицах (микро-, милли-,

секундах) или количестве тактов процессора
Емкостная сложность – в битах (байтах и производных единицах), минимальных аппаратных требованиях и пр.

Слайд 31

Практический метод (2/2)
Факторы, влияющие на оценку:
Особенности аппаратно-программной платформы:
Характеристики оборудования (тактовая частота, объём

ОЗУ и сверхоперативной памяти, размер файла подкачки)
Архитектура программной среды (многозадачность, алгоритм работы планировщика задач, особенности ОС)
Язык программирования (транслятор)
Квалификация (опыт) программиста
В результате – практическая оценка не является абсолютным показателем эффективности (сложности).

Слайд 32

Теоретический подход (1/2)
Характеризует алгоритм без привязки к конкретному оборудованию, ПО и средствам

реализации
Временная сложность – в количестве операций, тактах работы машины Тьюринга и пр.
Емкостная сложность определяется объёмом данных (входных, промежуточных, выходных), числом задействованных ячеек на ленте машины Тьюринга и пр.

Слайд 33

Теоретический подход (2/2)
Факторы, влияющие на оценку эффективности (сложности):
Объём входных данных (размер входа,

размерность задачи) – например, количество элементов в массиве на сортировку или длина строки и пр.
Метод решения – например, тот или иной алгоритм сортировки.

Слайд 34

Модель вычислительной машины
Идеализированная одноядерная однопроцессорная машина с памятью с произвольным доступом (RAM)
Команды

– арифметические, перемещения данных, управляющие
Каждая команда выполняется за определённое фиксированное время. →

Слайд 35

Время работы алгоритма
Тогда время работы алгоритма складывается из элементарных операций (шагов), которые

необходимо выполнить
Время выполнения различных строк псевдокода может отличаться, но пусть одна и та же I-я строка выполняется за константное время сI. →

Слайд 36

Функция роста
Время работы – это функция от объёма входных данных
Пусть n –

объём входных данных для некоторого алгоритма
Тогда Т(n) – функция роста, показывает рост времени при увеличении входных данных
Скорость роста (порядок роста) – функция более высокого порядка, главный член формулы T(n).

Слайд 37

Лучший, средний и худший случаи
Пусть рассматривается алгоритм проверки наличия числа в некотором

массиве
Если этот массив упорядочен по возрастанию, то проверяем до первого элемента, который равен или больше искомого. В этом случае Т(n)Однако в худшем случае (когда искомый элемент – последний в неотсортированном массиве) нужно просмотреть все элементы, и тогда Т(n) = n.

Слайд 38

Правила определения количества операторов в одной инструкции алгоритма
1. В строке алгоритма расположена

одна простая команда – количество равно 1.
2. Учитывается каждая команда в блоке команд.
3. Оператор цикла, в котором количество итераций зависит от n, оценивается через количество выполняемых сравнений в условии цикла: n+1.
4. Если тело цикла выполняется n раз, тогда количество операций в теле цикла после выполнения всех итераций = количество операторов тела цикла*n.

Слайд 39

Пример 1. Среднее арифметическое всех положительных чисел массива A[n]
T(n)=1+1+(n+1)+n+n+n+1+1=4n+5
Порядок роста:
4 и

5 – константы, рост будет определяться значением переменной n
Константы при определении порядка роста в выражении игнорируются
Т.о. получаем линейную зависимость количества операций от количества элементов n.

Структуры и алгоритмы обработки данных. Лекция 1

Содержание

Литература по алгоритмизации:Кнут Д. Искусство программирования. Тома 1-4, 1976-2013.Вирт Н. Алгоритмы +

Литература по С++:Страуструп Б. Программирование. Принципы и практика с использованием C++. 2-е

Интернет-ресурсы (общего назначения):Национальный открытый университет «ИНТУИТ» [Электронный ресурс] URL: http://www.intuit.ru/ (дата обращения

1. Алгоритмы: вводные понятия.

Алгоритм (лат. algorithmi) –Это набор инструкций, описывающих порядок действий исполнителя, для достижения

Алгоритм вычисленийАлгоритм решения вычислительной задачи – это корректно определённая вычислительная процедура, на

Исполнитель –Это абстрактная или реальная (техническая или биологическая) система, способная выполнить действия,

Теория алгоритмов – Наука на стыке математики и информатики об общих свойствах

Способы формализации алгоритмаТеория автоматов:машина Тьюринга, машина Поста;Рекурсивные функции Гёделя — Эрбрана — КлиниНормальный алгоритм

Виды алгоритмовДетерминированные (жёсткие, механические) – единственная и достоверная последовательность инструкций, приводящая к

Свойства алгоритма:Дискретность – разбиение на конечное количество отдельных шаговПонятность – включает только

Способы записи алгоритмаСловесный (на естественном языке)ФормульныйТабличный (для реляционных задач)Графический (блок-схемы)Операторный – из

Компьютерная программа –Это алгоритм решения вычислительной задачи компьютеромИсполнительМашинная команда:КОп (обяз.часть)Адресная частьBB 11

Язык программирования – Это набор допустимых операторов, синтаксические и семантические правила их

2. Корректность алгоритма.

ИнвариантАлгоритм корректен, если для каждого ввода результатом его работы является корректный выводМетоды

Инвариант цикла –Свойство, сохраняемое циклом – это логическое выражение (предикат), истинное непосредственно

Доказательство корректности цикла инвариантом1. Доказывается, что выражение инварианта истинно перед началом цикла

Схема проверки инварианта цикла

Пример – алгоритм поиска минимума в массивеФормулировка инварианта:После выполнения каждого шага цикла

Область неопределённостиОбласть изменения параметров задачи [1,n) можно разделить на две части: исследованную

Пример – алгоритм суммирования элементов массиваПосле каждого шага цикла при любом i

Пример – сортировка массива пузырькомНа каждом шаге внешнего цикла на свое место