Прикладной Python. Базы данных. Лекция №6

Март 10, 2021

Главная
Информатика
Прикладной Python. Базы данных. Лекция №6

Содержание

2. Базовые понятия реляционных БД Проектирование БД SQL. Основные операции: SELECT, INSERT, UPDATE, DELETE, JOIN Индексы EXPLAIN
3. Где хранить данные? На клиенте Cookie (4кб) Web Storage На сервере В памяти На диске На
4. БД - Взаимосвязанные данные специальным образом хранящиеся на каком-либо носителе СУБД – Программный комплекс обеспечивающий работу
5. Предназначение СУБД Управление данными на дисках и в оперативной памяти Журнализация, резервное копирование Предоставление интерфейсов взаимодействия
6. Реляционная модель данных Таблица - отношение, relation Строка - кортеж, tuple Столбец - атрибут, column
7. Таблица пользователей
8. Первиичный ключ (primary key) — в реляционной модели данных один из потенциальных ключей отношения, выбранный в
9. Внешний ключ — это столбец или комбинация столбцов, значения которых соответствуют Первичному ключу в другой таблице.
10. Виды связей в реляционной БД Связь один к одному образуется, когда ключевой столбец (идентификатор) присутствует в
11. Примеры
12. Примеры
13. Пример
14. Структура SQL запроса SELECT SELECT [DISTINCT | DISTINCTROW | ALL] select_expression,... FROM table_references [WHERE where_definition] [GROUP
15. Операции SQL: SELECT SELECT * FROM users WHERE age > 10; SELECT * FROM users WHERE
16. Агрегация SELECT first_name, count(id) as cnt FROM users_user WHERE first_name LIKE "%дим%" GROUP BY first_name HAVING
17. Агрегатные функции MySQL AVG: вычисляет среднее значение SUM: вычисляет сумму значений MIN: вычисляет наименьшее значение MAX:
18. JOIN SELECT h.name, a.name FROM heroes h, abilities a WHERE h.id = a.hero_id; SELECT h.name, a.name
19. Вложенные запросы SELECT title FROM article t1 JOIN ( SELECT rubric_id, MAX(id) max_id FROM article GROUP
20. Операции SQL: INSERT, UPDATE, DELETE INSERT INTO users (name, age) VALUES ('Petr', 10); UPDATE users SET
21. Индекс — объект базы данных, создаваемый с целью повышения производительности поиска данных. Таблицы в базе данных
22. По каким полям надо делать индексы Индексы для полей, по которым происходит JOIN Индексы для полей,
23. Задачи проектирования Обеспечение хранения всей необходимой информации Обеспечение возможности получения данных по всем запросам Сокращение избыточности
24. Типы данных в MySQL INT - Целое число нормального размера. Диапазон со знаком от -2147483648 до
25. Больше типов данных CHAR(M) [BINARY] - Строка фиксированной длины, при хранении всегда дополняется пробелами в конце
26. Проектируем БД Спроектировать базу данных для магазина
27. Анализ запросов: EXPLAIN Ничего не говорит о том как влияют на запросы триггеры. Не работает с
28. Explain: id EXPLAIN select * from users_car where id LIKE "1%" EXPLAIN select *, (SELECT 1
29. Explain: select_type SIMPLE – Простой запрос SELECT без подзапросов или UNION PRIMARY - Самый внешний запрос
30. Explain: table EXPLAIN select * from users_car where id LIKE "1%" EXPLAIN select * from users_car
31. Explain: type ALL - Этот подход обычно называют сканированием таблицы. index - То же, что и
32. Explain: possible_keys, key EXPLAIN select id from users_user\G;
33. NoSQL Rising
34. Общие характеристики NoSQL БД Не используют реляционную модель Хорошо подходят для развертывания на кластере Open-source Schemaless
35. NoSQL: key-value СУБД Кейсы применения БД хранилищ ключ-значение: Кеширование - быстрое и частое сохранение данных для
36. NoSQL: распределенные СУБД Кейсы применения распределенных СУБД: Хранение неструктурированных, не разрушаемых данных - если вам необходимо
37. NoSQL: документоориентированные СУБД Кейсы применения документоориентированные СУБД: Популярные СУБД MongoDB - очень популярное и функциональное хранилище
38. NoSQL: СУБД типа граф Кейсы применения распределенных СУБД: работа со сложно связанной информацией. Например граф знакомств
39. SQL подход к проектированию БД
40. NoSQL подход
42. Скачать презентацию

Базовые понятия реляционных БД
Проектирование БД
SQL. Основные операции: SELECT, INSERT, UPDATE, DELETE, JOIN
Индексы
EXPLAIN
NoSQL
Базы

данных

Где хранить данные?
На клиенте
Cookie (4кб)
Web Storage
На сервере
В памяти
На диске
На

диске и в памяти

БД - Взаимосвязанные данные специальным образом хранящиеся на каком-либо носителе
СУБД –

Программный комплекс обеспечивающий работу с данными в БД

Предназначение СУБД
Управление данными на дисках и в оперативной памяти
Журнализация, резервное копирование
Предоставление

интерфейсов взаимодействия с БД
Предоставление механизма транзакций

Реляционная модель данных
Таблица - отношение, relation
Строка - кортеж, tuple
Столбец -

атрибут, column

Таблица пользователей

Первиичный ключ (primary key) — в реляционной модели данных один из потенциальных ключей отношения, выбранный в качестве

основного ключа (или ключа по умолчанию). Если в отношении имеется единственный потенциальный ключ, он является и первичным ключом. Если потенциальных ключей несколько, один из них выбирается в качестве первичного, а другие называют «альтернативными».

Слайд 9

Внешний ключ — это столбец или комбинация столбцов, значения которых соответствуют Первичному ключу

в другой таблице. Связь между двумя таблицами задается через соответствие первичного ключа в одной из таблиц внешнему ключу во второй.

Слайд 10

Виды связей в реляционной БД
Связь один к одному образуется, когда ключевой столбец

(идентификатор) присутствует в другой таблице, в которой тоже является ключом либо свойствами столбца задана его уникальность (одно и тоже значение не может повторяться в разных строках).
Связи один ко многим одной записи первой таблицы соответствует несколько записей в другой таблице.
Если нескольким записям из одной таблицы соответствует несколько записей из другой. таблицы, то такая связь называется «многие ко многим».

Слайд 11

Примеры

Слайд 12

Примеры

Слайд 13

Пример

Слайд 14

Структура SQL запроса SELECT
SELECT
[DISTINCT | DISTINCTROW | ALL]
select_expression,...

FROM table_references
[WHERE where_definition]
[GROUP BY {unsigned_integer | col_name | formula}]
[HAVING where_definition]
[ORDER BY {unsigned_integer | col_name | formula} [ASC | DESC], ...]

Слайд 15

Операции SQL: SELECT
SELECT * FROM users WHERE age > 10;
SELECT * FROM

users WHERE name = 'masha';
SELECT MAX(age) FROM users;
SELECT id, name, LENGTH(name) AS len
FROM users
WHERE email LIKE '%@mail.ru' AND age > 10
ORDER BY name DESC
LIMIT 10 OFFSET 15;
Дока по встроенным методам в MySQL
https://dev.mysql.com/doc/refman/8.0/en/string-functions.html

Слайд 16

Агрегация
SELECT first_name, count(id) as cnt
FROM users_user
WHERE first_name
LIKE "%дим%"
GROUP

BY first_name
HAVING cnt > 100
ORDER BY cnt;

Слайд 17

Агрегатные функции MySQL
AVG: вычисляет среднее значение
SUM: вычисляет сумму значений
MIN: вычисляет наименьшее значение
MAX:

вычисляет наибольшее значение
COUNT: вычисляет количество строк в запросе

Слайд 18

JOIN
SELECT h.name, a.name
FROM heroes h, abilities a
WHERE h.id = a.hero_id;
SELECT h.name, a.name
FROM

heroes h
INNER JOIN abilities a ON h.id = a.hero_id;
SELECT h.name, a.name
FROM heroes h
LEFT JOIN abilities a ON h.id = a.hero_id;

Слайд 19

Вложенные запросы
SELECT title
FROM article t1
JOIN (
SELECT rubric_id, MAX(id) max_id
FROM article

GROUP BY rubric_id LIMIT 5
) t2
ON t1.id = t2.max_id;

Слайд 20

Операции SQL: INSERT, UPDATE, DELETE
INSERT INTO users (name, age) VALUES ('Petr', 10);
UPDATE

users SET rating = rating + 1;
UPDATE users SET age = 20 WHERE name = 'Petr';
DELETE FROM users WHERE name = 'Masha';
DELETE FROM users WHERE age > 150;

Слайд 21

Индекс — объект базы данных, создаваемый с целью повышения производительности поиска данных. Таблицы в

базе данных могут иметь большое количество строк, которые хранятся в произвольном порядке, и их поиск по заданному критерию путём последовательного просмотра таблицы строка за строкой может занимать много времени. Индекс формируется из значений одного или нескольких столбцов таблицы и указателей на соответствующие строки таблицы и, таким образом, позволяет искать строки, удовлетворяющие критерию поиска. Ускорение работы с использованием индексов достигается в первую очередь за счёт того, что индекс имеет структуру, оптимизированную под поиск — например, сбалансированного дерева.
Кластерный индекс – индекс, хранящий не только значение колонки, но и данные всей строки. Может быть только 1 для таблицы.

Слайд 22

По каким полям надо делать индексы
Индексы для полей, по которым происходит JOIN

Индексы для полей, по которым фильтруются записи
Индексы для полей, по которым идет сортировка

Слайд 23

Задачи проектирования
Обеспечение хранения всей необходимой информации
Обеспечение возможности получения данных по всем

запросам
Сокращение избыточности и дублирования данных
Обеспечение целостности данных

Слайд 24

Типы данных в MySQL
INT - Целое число нормального размера. Диапазон со знаком

от -2147483648 до 2147483647. Диапазон без знака от 0 до 4294967295.
DOUBLE - Число с плавающей точкой удвоенной точности нормального размера. Допустимые значения: от -1,7976931348623157E+308 до -2,2250738585072014E-308, 0, и от 2,2250738585072014E-308 до 1,7976931348623157E+308. Если указан атрибут UNSIGNED, отрицательные значения недопустимы.
DATE - Дата. Поддерживается интервал от '1000-01-01' до '9999-12-31'. MySQL выводит значения DATE в формате 'YYYY-MM-DD', но можно установить значения в столбец DATE, используя как строки, так и числа. See section 6.2.2.2 Типы данных DATETIME, DATE и TIMESTAMP.
DATETIME - Комбинация даты и времени. Поддерживается интервал от '1000-01-01 00:00:00' до '9999-12-31 23:59:59'.
TIMESTAMP - Временная метка.
TIMEВ - Время. Интервал от '-838:59:59' до '838:59:59’.
YEAR - Год в двухзначном или четырехзначном форматах (по умолчанию формат четырехзначный).

Слайд 25

Больше типов данных
CHAR(M) [BINARY] - Строка фиксированной длины, при хранении всегда дополняется

пробелами в конце строки до заданного размера. Диапазон аргумента M составляет от 0 до 255 символов. Если не задан атрибут чувствительности к регистру BINARY, то величины CHAR сортируются и сравниваются как независимые от регистра в соответствии с установленным по умолчанию алфавитом.
CHAR - Это синоним для CHAR(1).
VARCHAR(M) [BINARY] - Строка переменной длины.
TINYBLOB, TINYTEXT - Столбец типа BLOB или TEXT с максимальной длиной
255 (2^8 - 1) символов.
BLOB, TEXT - Столбец типа BLOB или TEXT с максимальной длиной 65535 (2^16 - 1) символов.
Больше типов и более подробная дока:
http://www.mysql.ru/docs/man/Column_types.html

Слайд 26

Проектируем БД
Спроектировать базу данных для магазина

Слайд 27

Анализ запросов: EXPLAIN
Ничего не говорит о том как влияют на запросы триггеры.
Не

работает с хранимыми процедурами ( хотя можно разложить процедуру на запросы и выполнить каждый из них)

Ничего не говорит об оптимизациях на этапе выполнения запроса

Часть отображаемой информации оценочная.

Слайд 28

Explain: id
EXPLAIN select * from users_car where id LIKE "1%"
EXPLAIN select *,

(SELECT 1 from users_user) from users_car where id LIKE "1%";

EXPLAIN SELECT 1 UNION ALL SELECT 1;

Слайд 29

Explain: select_type
SIMPLE – Простой запрос SELECT без подзапросов или UNION
PRIMARY - Самый

внешний запрос
SUBQUERY - Запрос Select, который содержится в подзапросе (не в From)
DERIVED - Значение DERIVED означает, что запрос SELECT является подзапросом в фразе FROM
UNION - Второй и последуюие запросы SELECT входящие в объединение union помечаются признаком UNION
UNION RESULT - Запрос SELECT, применяемый для выборки данных из временной таблицы созданной в ходе выполнения UNION

Слайд 30

Explain: table
EXPLAIN select * from users_car where id LIKE "1%"
EXPLAIN select *

from users_car as uc join users_user as uu on uc.user_id=uu.id;

Слайд 31

Explain: type
ALL - Этот подход обычно называют сканированием таблицы.
index - То же,

что и сканирование таблицы, но MySQL просматривает записи в порядке задаваемом индексом, а не в порядке следования строк.
range - Просмотр диапазона – неполное сканирование индекса.
ref - доступ по индексу, возвращает строки соответствующие единственному заданному значению
eq_ref - поиск по индексу в случае если MySQL точно знает, что будет возвращено 1 значение.
Null - запрос на фазе оптимизации разрешен так, что не потребовалось обращаться к таблицам базы данных

Слайд 32

Explain: possible_keys, key
EXPLAIN select id from users_user\G;

$Explain: possible_keys, key EXPLAIN select id from users_user\G;$

Слайд 33

NoSQL Rising

Слайд 34

Общие характеристики NoSQL БД
Не используют реляционную модель
Хорошо подходят для развертывания на кластере
Open-source
Schemaless

Слайд 35

NoSQL: key-value СУБД
Кейсы применения БД хранилищ ключ-значение:
Кеширование - быстрое и частое сохранение

данных для будущего использования
Очередь - некоторые БД типа ключ-значение поддерживают списки, наборы и очереди
Распределение информации/задач - используется для реализации паттерна Pub/Sub
Живое обновление информации - приложения использующие состояния
Популярные решения:
Memcached / MemcacheDB - распределённая БД в оперативной памяти
Redis - БД в оперативной памяти с поддержкой структур данных и возможностью выполнять операции на данных
…

Слайд 36

NoSQL: распределенные СУБД
Кейсы применения распределенных СУБД:
Хранение неструктурированных, не разрушаемых данных - если

вам необходимо хранить большие объемы данных в течение долгого времени, то такие БД очень хорошо справятся с задачей
Масштабирование - по задумке такие базы данных легко масштабируются.
Популярные СУБД:
Cassandra - структура данных основана на BigTable и DynamoDB
HBase - хранилище для Apache Hadoop основанное на принципах BigTable

Слайд 37

NoSQL: документоориентированные СУБД
Кейсы применения документоориентированные СУБД:
Популярные СУБД
MongoDB - очень популярное и функциональное

хранилище
Couchbase - основанное на JSON, совместимое c Memcached хранилище
CouchDB - передовое документо-ориентированное хранилище

Слайд 38

NoSQL: СУБД типа граф
Кейсы применения распределенных СУБД:
работа со сложно связанной информацией. Например

граф знакомств в соц сети.
Моделирование и поддержка классификаций - такие БД преуспели везде где есть связи. Моделирование данных и классификация различной информации по связям можно с легкостью представить используя эти БД.
Популярные СУБД
OrientDB - очень быстрое документо-ориентированное хранилище гибрид типа граф написанное на Java. Включает в себя разные режимы работы
Neo4J - безсхемное, очень мощное и популярное хранилище написанное на Java

Прикладной Python. Базы данных. Лекция №6

Содержание

Базовые понятия реляционных БДПроектирование БДSQL. Основные операции: SELECT, INSERT, UPDATE, DELETE, JOINИндексыEXPLAINNoSQLБазы

Где хранить данные?На клиенте Cookie (4кб)Web Storage На сервере В памятиНа дискеНа

БД - Взаимосвязанные данные специальным образом хранящиеся на каком-либо носителе СУБД –

Предназначение СУБДУправление данными на дисках и в оперативной памяти Журнализация, резервное копированиеПредоставление

Реляционная модель данныхТаблица - отношение, relation Строка - кортеж, tuple Столбец -

Таблица пользователей

Первиичный ключ (primary key) — в реляционной модели данных один из потенциальных ключей отношения, выбранный в качестве

Внешний ключ — это столбец или комбинация столбцов, значения которых соответствуют Первичному ключу

Виды связей в реляционной БДСвязь один к одному образуется, когда ключевой столбец

Примеры

Примеры

Пример

Структура SQL запроса SELECTSELECT [DISTINCT | DISTINCTROW | ALL] select_expression,...

Операции SQL: SELECTSELECT * FROM users WHERE age > 10;SELECT * FROM

АгрегацияSELECT first_name, count(id) as cnt FROM users_user WHERE first_name LIKE "%дим%" GROUP

Агрегатные функции MySQLAVG: вычисляет среднее значениеSUM: вычисляет сумму значенийMIN: вычисляет наименьшее значениеMAX:

JOINSELECT h.name, a.nameFROM heroes h, abilities aWHERE h.id = a.hero_id;SELECT h.name, a.nameFROM

Вложенные запросыSELECT titleFROM article t1JOIN ( SELECT rubric_id, MAX(id) max_id FROM article

Операции SQL: INSERT, UPDATE, DELETEINSERT INTO users (name, age) VALUES ('Petr', 10);UPDATE

Индекс — объект базы данных, создаваемый с целью повышения производительности поиска данных. Таблицы в

По каким полям надо делать индексыИндексы для полей, по которым происходит JOIN

Задачи проектированияОбеспечение хранения всей необходимой информации Обеспечение возможности получения данных по всем

Типы данных в MySQLINT - Целое число нормального размера. Диапазон со знаком

Больше типов данныхCHAR(M) [BINARY] - Строка фиксированной длины, при хранении всегда дополняется

Проектируем БДСпроектировать базу данных для магазина

Анализ запросов: EXPLAINНичего не говорит о том как влияют на запросы триггеры.Не

Explain: idEXPLAIN select * from users_car where id LIKE "1%"EXPLAIN select *,

Explain: select_typeSIMPLE – Простой запрос SELECT без подзапросов или UNIONPRIMARY - Самый

Explain: tableEXPLAIN select * from users_car where id LIKE "1%"EXPLAIN select *

Explain: typeALL - Этот подход обычно называют сканированием таблицы.index - То же,

Explain: possible_keys, keyEXPLAIN select id from users_user\G;

NoSQL Rising

Общие характеристики NoSQL БДНе используют реляционную модельХорошо подходят для развертывания на кластереOpen-sourceSchemaless

NoSQL: key-value СУБДКейсы применения БД хранилищ ключ-значение:Кеширование - быстрое и частое сохранение

NoSQL: распределенные СУБДКейсы применения распределенных СУБД:Хранение неструктурированных, не разрушаемых данных - если

NoSQL: документоориентированные СУБДКейсы применения документоориентированные СУБД:Популярные СУБДMongoDB - очень популярное и функциональное

NoSQL: СУБД типа графКейсы применения распределенных СУБД:работа со сложно связанной информацией. Например

SQL подход к проектированию БД

NoSQL подход

Похожие презентации

Базовые понятия реляционных БД
Проектирование БД
SQL. Основные операции: SELECT, INSERT, UPDATE, DELETE, JOIN
Индексы
EXPLAIN
NoSQL
Базы

Где хранить данные?
На клиенте
Cookie (4кб)
Web Storage
На сервере
В памяти
На диске
На

БД - Взаимосвязанные данные специальным образом хранящиеся на каком-либо носителе
СУБД –

Предназначение СУБД
Управление данными на дисках и в оперативной памяти
Журнализация, резервное копирование
Предоставление

Реляционная модель данных
Таблица - отношение, relation
Строка - кортеж, tuple
Столбец -

Виды связей в реляционной БД
Связь один к одному образуется, когда ключевой столбец

Структура SQL запроса SELECT
SELECT
[DISTINCT | DISTINCTROW | ALL]
select_expression,...

Операции SQL: SELECT
SELECT * FROM users WHERE age > 10;
SELECT * FROM

Агрегация
SELECT first_name, count(id) as cnt
FROM users_user
WHERE first_name
LIKE "%дим%"
GROUP

Агрегатные функции MySQL
AVG: вычисляет среднее значение
SUM: вычисляет сумму значений
MIN: вычисляет наименьшее значение
MAX:

JOIN
SELECT h.name, a.name
FROM heroes h, abilities a
WHERE h.id = a.hero_id;
SELECT h.name, a.name
FROM

Вложенные запросы
SELECT title
FROM article t1
JOIN (
SELECT rubric_id, MAX(id) max_id
FROM article

Операции SQL: INSERT, UPDATE, DELETE
INSERT INTO users (name, age) VALUES ('Petr', 10);
UPDATE

По каким полям надо делать индексы
Индексы для полей, по которым происходит JOIN

Задачи проектирования
Обеспечение хранения всей необходимой информации
Обеспечение возможности получения данных по всем

Типы данных в MySQL
INT - Целое число нормального размера. Диапазон со знаком

Больше типов данных
CHAR(M) [BINARY] - Строка фиксированной длины, при хранении всегда дополняется

Проектируем БД
Спроектировать базу данных для магазина

Анализ запросов: EXPLAIN
Ничего не говорит о том как влияют на запросы триггеры.
Не

Explain: id
EXPLAIN select * from users_car where id LIKE "1%"
EXPLAIN select *,

Explain: select_type
SIMPLE – Простой запрос SELECT без подзапросов или UNION
PRIMARY - Самый

Explain: table
EXPLAIN select * from users_car where id LIKE "1%"
EXPLAIN select *

Explain: type
ALL - Этот подход обычно называют сканированием таблицы.
index - То же,

Explain: possible_keys, key
EXPLAIN select id from users_user\G;

Общие характеристики NoSQL БД
Не используют реляционную модель
Хорошо подходят для развертывания на кластере
Open-source
Schemaless

NoSQL: key-value СУБД
Кейсы применения БД хранилищ ключ-значение:
Кеширование - быстрое и частое сохранение

NoSQL: распределенные СУБД
Кейсы применения распределенных СУБД:
Хранение неструктурированных, не разрушаемых данных - если

NoSQL: документоориентированные СУБД
Кейсы применения документоориентированные СУБД:
Популярные СУБД
MongoDB - очень популярное и функциональное

NoSQL: СУБД типа граф
Кейсы применения распределенных СУБД:
работа со сложно связанной информацией. Например