Структуры и алгоритмы обработки данных. Лекция 1

Содержание

Слайд 2

Литература по алгоритмизации:

Кнут Д. Искусство программирования. Тома 1-4, 1976-2013.
Вирт Н. Алгоритмы +

Литература по алгоритмизации: Кнут Д. Искусство программирования. Тома 1-4, 1976-2013. Вирт Н.
структуры данных = программы, 1985.
Лафоре Р. Структуры данных и алгоритмы в Java. 2-е изд., 2013.
Макконнелл Дж. Основы современных алгоритмов. 2-е изд., 2004.
Седжвик Р., Уэйн К. Алгоритмы на Java. 4-е изд., 2013.
Скиена С. Алгоритмы. Руководство по разработке, 2011.
Стивенс Р. Алгоритмы. Теория и практическое применение (С#), 2016.
Хайнеман Д. и др. Алгоритмы. Справочник с примерами на C, C++, Java и Python, 2017.

Слайд 3

Литература по С++:

Страуструп Б. Программирование. Принципы и практика с использованием C++. 2-е

Литература по С++: Страуструп Б. Программирование. Принципы и практика с использованием C++.
изд., 2016.
Прата С. Язык программирования С++. Лекции и упражнения. - 6-е изд., 2012.
Шилдт Г. Полный справочник по C++. 4-е изд., 2006.
Хортон А. Visual C++ 2010. Полный курс, 2011.
Седжвик Р. Фундаментальные алгоритмы на C++, 2001-2002
Павловская Т.А. C/C++. Программирование на языке высокого уровня, 2003.

Слайд 4

Интернет-ресурсы (общего назначения):

Национальный открытый университет «ИНТУИТ» [Электронный ресурс] URL: http://www.intuit.ru/ (дата обращения

Интернет-ресурсы (общего назначения): Национальный открытый университет «ИНТУИТ» [Электронный ресурс] URL: http://www.intuit.ru/ (дата
11.09.2016).
Хабр [Электронный ресурс]. URL: http://habr.ru/ (дата обращения 01.07.2014).
Tproger [Электронный ресурс] URL: https://tproger.ru/ (дата обращения 07.09.2018).
СodeNet – всё для программиста [Электронный ресурс]. URL: http://www.codenet.ru/ (дата обращения 07.09.2018).
MIT OpenCourseWare [Электронный ресурс]. URL: http://ocw.mit.edu (дата обращения 01.07.2014).

Слайд 5

1. Алгоритмы: вводные понятия.

1. Алгоритмы: вводные понятия.

Слайд 6

Алгоритм (лат. algorithmi) –

Это набор инструкций, описывающих порядок действий исполнителя, для достижения

Алгоритм (лат. algorithmi) – Это набор инструкций, описывающих порядок действий исполнителя, для
определённого результата (неформальное определение)
Базисное понятие в математике:
Вычисления (вычислительная задача) – это обработка числовой информации по определённому алгоритму. →

Слайд 7

Алгоритм вычислений

Алгоритм решения вычислительной задачи – это корректно определённая вычислительная процедура, на

Алгоритм вычислений Алгоритм решения вычислительной задачи – это корректно определённая вычислительная процедура,
вход которой подаётся значение (набор значений), и результатом выполнения которой является выходное значение (набор значений)
Алгоритм корректен, если для каждого ввода результатом его работы является корректный вывод.

Слайд 8

Исполнитель –

Это абстрактная или реальная (техническая или биологическая) система, способная выполнить действия,

Исполнитель – Это абстрактная или реальная (техническая или биологическая) система, способная выполнить
предписываемые алгоритмом
Неформальный (знает конечную цель А.) и формальный
Характеристики:
Среда (обстановка) – место действия
Система команд:
Должны быть заданы условия применимости (состояние среды)
Описаны результаты выполнения
Набор действий
Отказы (недопустимое для выполнения команды состояние среды).

Слайд 9

Теория алгоритмов –

Наука на стыке математики и информатики об общих свойствах

Теория алгоритмов – Наука на стыке математики и информатики об общих свойствах
и закономерностях алгоритмов и разнообразных формальных моделях их представления
Теоретическая основа вычислительных наук
Задачи:
Формализация алгоритма (модели вычислений) →
Формализация задач
Алгоритмическая неразрешимость
Уровни сложности (классификация, анализ, критерии качества).

Слайд 10

Способы формализации алгоритма

Теория автоматов:
машина Тьюринга,
машина Поста;
Рекурсивные функции Гёделя — Эрбрана — Клини
Нормальный алгоритм

Способы формализации алгоритма Теория автоматов: машина Тьюринга, машина Поста; Рекурсивные функции Гёделя
Маркова
λ-исчисление Чёрча.

Слайд 11

Виды алгоритмов

Детерминированные (жёсткие, механические) – единственная и достоверная последовательность инструкций, приводящая к

Виды алгоритмов Детерминированные (жёсткие, механические) – единственная и достоверная последовательность инструкций, приводящая
однозначному результату
Гибкие:
Вероятностные (стохастические):
Используют случайные величины (ГСЧ),
Несколько путей решения, приводящими к высоко вероятному достижению результата;
Эвристические – используют различные разумные соображения без строгих обоснований.

Слайд 12

Свойства алгоритма:

Дискретность – разбиение на конечное количество отдельных шагов
Понятность – включает только

Свойства алгоритма: Дискретность – разбиение на конечное количество отдельных шагов Понятность –
команды из набора допустимых команд исполнителя
Детерминированность (определённость) – каждый следующий шаг однозначно определяется состоянием системы – один и тот же ответ для одних и тех же исходных данных
Результативность – всегда приводит к получению определённого результата
Массовость – применимость к множеству наборов начальных данных
Завершаемость (конечность) – результат за конечное время (число шагов).

Слайд 13

Способы записи алгоритма

Словесный (на естественном языке)
Формульный
Табличный (для реляционных задач)
Графический (блок-схемы)
Операторный – из

Способы записи алгоритма Словесный (на естественном языке) Формульный Табличный (для реляционных задач)
конечного набора допустимых команд исполнителя.

Слайд 14

Компьютерная программа –

Это алгоритм решения вычислительной задачи компьютером
Исполнитель
Машинная команда:
КОп (обяз.часть)
Адресная часть
BB 11

Компьютерная программа – Это алгоритм решения вычислительной задачи компьютером Исполнитель Машинная команда:
01 B9 0D 00 B4 0E 8A 07 43 CD 10 E2 F9 CD 20 48 65 6C 6C 6F 2C 20 57 6F 72 6C 64 21
Скрипт.

Слайд 15

Язык программирования –

Это набор допустимых операторов, синтаксические и семантические правила их

Язык программирования – Это набор допустимых операторов, синтаксические и семантические правила их
использования для создания компьютерных программ
Уровневая классификация:
ЯВУ
Ассемблеры - машиноориентированные
Язык двоичных машинных кодов (нативный код)
Трансляция:
Интерпретация
Компиляция.

Слайд 16

2. Корректность алгоритма.

2. Корректность алгоритма.

Слайд 17

Инвариант

Алгоритм корректен, если для каждого ввода результатом его работы является корректный вывод
Методы

Инвариант Алгоритм корректен, если для каждого ввода результатом его работы является корректный
оценки корректности – на принципах математической индукции (путём рассуждений)
Инвариант – это свойство некоторого класса (множества) мат.объектов, остающееся неизменным при определённого вида преобразованиях.

Слайд 18

Инвариант цикла –

Свойство, сохраняемое циклом – это логическое выражение (предикат), истинное непосредственно

Инвариант цикла – Свойство, сохраняемое циклом – это логическое выражение (предикат), истинное
перед и сразу после каждой итерации цикла, зависящее от переменных, изменяющихся в теле цикла
Инвариант цикла ≠ условие цикла
Инвариант может быть использован для доказательства корректности циклического алгоритма без необходимости его непосредственного выполнения (верификация)
Чтобы убедиться, что оптимизированный цикл остался корректным, достаточно доказать, что инвариант цикла не нарушен и условие завершения цикла достижимо.

Примеры инвариантов:
а) i + j == 9
б) i >= 0 && i <= 10

Слайд 19

Доказательство корректности цикла инвариантом

1. Доказывается, что выражение инварианта истинно перед началом цикла

Доказательство корректности цикла инвариантом 1. Доказывается, что выражение инварианта истинно перед началом
(инициализация).
2. Доказывается, что выражение инварианта сохраняет свою истинность после выполнения тела цикла (сохранение). Так, по индукции, доказывается, что по завершении цикла инвариант будет выполняться.
3. Доказывается, что при истинности инварианта после завершения цикла (завершение) переменные примут те значения, которые и требуется получить (что определяется из выражения инварианта и конечных значениях переменных в условии цикла).
4. Доказывается (возможно, без применения инварианта), что цикл завершится, то есть условие завершения рано или поздно будет выполнено.
Истинность утверждений на этих этапах однозначно свидетельствует о том, что цикл выполнится за конечное время и даст желаемый результат.

Слайд 20

Схема проверки инварианта цикла

Схема проверки инварианта цикла

Слайд 21

Пример – алгоритм поиска минимума в массиве

Формулировка инварианта:
После выполнения каждого шага цикла

Пример – алгоритм поиска минимума в массиве Формулировка инварианта: После выполнения каждого
в переменной Min записан минимум из первых i элементов [1,i) массива.

Слайд 22

Область неопределённости

Область изменения параметров задачи [1,n) можно разделить на две части:
исследованную

Область неопределённости Область изменения параметров задачи [1,n) можно разделить на две части:
область, для которой найден Min в [1,i);
область неопределенности [i+1,n).
Необходимо составлять цикл так, чтобы на каждой итерации область неопределенности сокращалась
В начале первой итерации исследованная область представляла собой единственную точку 1, а область неопределенности составляла [2,n)
На втором шаге область неопределенности сократилась до [3,n), на третьем – до [4,n) и т.д., пока не превратится в пустое множество.

Слайд 23

Пример – алгоритм суммирования элементов массива

После каждого шага цикла при любом i

Пример – алгоритм суммирования элементов массива После каждого шага цикла при любом
к переменной Sum добавляется элемент массива A[i]
После окончания очередного шага цикла в Sum накоплена сумма всех элементов массива с номерами от 1 до i
Вывод: после завершения цикла (i=n), в Sum будет записана сумма всех элементов массива.

Слайд 24

Пример – сортировка массива пузырьком

На каждом шаге внешнего цикла на свое место

Пример – сортировка массива пузырьком На каждом шаге внешнего цикла на свое
«всплывает» один элемент массива
Поэтому инвариант внешнего цикла: «После выполнения i-ro шага цикла первые i элементов массива отсортированы и установлены на свои места»
Во внутреннем цикле очередной «лёгкий» элемент поднимается вверх к началу массива
Перед первым шагом внутреннего цикла элемент, который будет стоять на i-м месте в отсортированном массиве, может находиться в любой ячейке от А[i] до А[n]
После каждого шага его «зона нахождения» сужается на одну позицию
Инвариант внутреннего цикла: «Элемент на i-м месте в отсортированном массиве может находиться в любой ячейке от A[i] до А[j]»
Когда в конце этого цикла j = i, элемент A[i] встаёт на своё место.

Слайд 25

3. Анализ эффективности алгоритма

3. Анализ эффективности алгоритма

Слайд 26

Анализ алгоритма

Позволяет предсказать требуемые для его выполнения ресурсы (время работы процессора, память

Анализ алгоритма Позволяет предсказать требуемые для его выполнения ресурсы (время работы процессора,
и пр.)
На основе анализа нескольких алгоритмов можно выбрать наиболее эффективный. →

Слайд 27

Эффективность алгоритма

Критерии – скорость (время) и расход памяти (или других ресурсов –

Эффективность алгоритма Критерии – скорость (время) и расход памяти (или других ресурсов
диска, трафик в сети и пр.)
Алгоритм А1 эффективнее алгоритма А2, если алгоритм А1 выполняется за меньшее время и (или) требует меньше компьютерных ресурсов
Составляющие эффективности:
Время – мера системной эффективности
Расход памяти – мера эффективности пространства
Количество команд относительно количества обрабатываемых данных – мера вычислительной эффективности.

Слайд 28

Сложность алгоритма

Сложность как характеристика связана с эффективностью:
Эффективный алгоритм требует приемлемое время исполнения

Сложность алгоритма Сложность как характеристика связана с эффективностью: Эффективный алгоритм требует приемлемое
и разумную ресурсоемкость
Сложность возрастает при увеличении времени исполнения алгоритма и (или) задействованных ресурсов
Т.о. для одной и той же задачи более сложный алгоритм из нескольких характеризуется меньшей эффективностью.

Слайд 29

Вычислительная сложность

Составляющие:
Временная сложность - отражает временные затраты на реализацию алгоритма
Емкостная сложность –

Вычислительная сложность Составляющие: Временная сложность - отражает временные затраты на реализацию алгоритма
отражает объём требующейся алгоритму памяти
Подходы к оценке:
Эмпирический анализ (экспериментальный, практический):
Практический метод →
Теоретический метод
Асимптотический анализ.

Слайд 30

Практический метод (1/2)

Характеризуется измеримыми параметрами:
Временная сложность – во временных единицах (микро-, милли-,

Практический метод (1/2) Характеризуется измеримыми параметрами: Временная сложность – во временных единицах
секундах) или количестве тактов процессора
Емкостная сложность – в битах (байтах и производных единицах), минимальных аппаратных требованиях и пр.

Слайд 31

Практический метод (2/2)

Факторы, влияющие на оценку:
Особенности аппаратно-программной платформы:
Характеристики оборудования (тактовая частота, объём

Практический метод (2/2) Факторы, влияющие на оценку: Особенности аппаратно-программной платформы: Характеристики оборудования
ОЗУ и сверхоперативной памяти, размер файла подкачки)
Архитектура программной среды (многозадачность, алгоритм работы планировщика задач, особенности ОС)
Язык программирования (транслятор)
Квалификация (опыт) программиста
В результате – практическая оценка не является абсолютным показателем эффективности (сложности).

Слайд 32

Теоретический подход (1/2)

Характеризует алгоритм без привязки к конкретному оборудованию, ПО и средствам

Теоретический подход (1/2) Характеризует алгоритм без привязки к конкретному оборудованию, ПО и
реализации
Временная сложность – в количестве операций, тактах работы машины Тьюринга и пр.
Емкостная сложность определяется объёмом данных (входных, промежуточных, выходных), числом задействованных ячеек на ленте машины Тьюринга и пр.

Слайд 33

Теоретический подход (2/2)

Факторы, влияющие на оценку эффективности (сложности):
Объём входных данных (размер входа,

Теоретический подход (2/2) Факторы, влияющие на оценку эффективности (сложности): Объём входных данных
размерность задачи) – например, количество элементов в массиве на сортировку или длина строки и пр.
Метод решения – например, тот или иной алгоритм сортировки.

Слайд 34

Модель вычислительной машины

Идеализированная одноядерная однопроцессорная машина с памятью с произвольным доступом (RAM)
Команды

Модель вычислительной машины Идеализированная одноядерная однопроцессорная машина с памятью с произвольным доступом
– арифметические, перемещения данных, управляющие
Каждая команда выполняется за определённое фиксированное время. →

Слайд 35

Время работы алгоритма

Тогда время работы алгоритма складывается из элементарных операций (шагов), которые

Время работы алгоритма Тогда время работы алгоритма складывается из элементарных операций (шагов),
необходимо выполнить
Время выполнения различных строк псевдокода может отличаться, но пусть одна и та же I-я строка выполняется за константное время сI. →

Слайд 36

Функция роста
Время работы – это функция от объёма входных данных
Пусть n –

Функция роста Время работы – это функция от объёма входных данных Пусть
объём входных данных для некоторого алгоритма
Тогда Т(n) – функция роста, показывает рост времени при увеличении входных данных
Скорость роста (порядок роста) – функция более высокого порядка, главный член формулы T(n).

Слайд 37

Лучший, средний и худший случаи

Пусть рассматривается алгоритм проверки наличия числа в некотором

Лучший, средний и худший случаи Пусть рассматривается алгоритм проверки наличия числа в
массиве
Если этот массив упорядочен по возрастанию, то проверяем до первого элемента, который равен или больше искомого. В этом случае Т(n)Однако в худшем случае (когда искомый элемент – последний в неотсортированном массиве) нужно просмотреть все элементы, и тогда Т(n) = n.

Слайд 38

Правила определения количества операторов в одной инструкции алгоритма

1. В строке алгоритма расположена

Правила определения количества операторов в одной инструкции алгоритма 1. В строке алгоритма
одна простая команда – количество равно 1.
2. Учитывается каждая команда в блоке команд.
3. Оператор цикла, в котором количество итераций зависит от n, оценивается через количество выполняемых сравнений в условии цикла: n+1.
4. Если тело цикла выполняется n раз, тогда количество операций в теле цикла после выполнения всех итераций = количество операторов тела цикла*n.

Слайд 39

Пример 1. Среднее арифметическое всех положительных чисел массива A[n]

T(n)=1+1+(n+1)+n+n+n+1+1=4n+5
Порядок роста:
4 и

Пример 1. Среднее арифметическое всех положительных чисел массива A[n] T(n)=1+1+(n+1)+n+n+n+1+1=4n+5 Порядок роста:
5 – константы, рост будет определяться значением переменной n
Константы при определении порядка роста в выражении игнорируются
Т.о. получаем линейную зависимость количества операций от количества элементов n.
Имя файла: Структуры-и-алгоритмы-обработки-данных.-Лекция-1.pptx
Количество просмотров: 44
Количество скачиваний: 0