Содержание
- 2. В примере с электронной таблицей понятно, что даже в самых сложных случаях используются не все ячейки
- 3. соответствуют одной физической позиции, могут возникнуть коллизии при вычислении хэш-адресов. Когда это происходит, записи сохраняются в
- 4. Предположим, требуется найти элемент в физическом массиве по его логическому индексу. Сначала необходимо преобразовать логический индекс
- 5. Перед использованием этого массива необходимо его инициализировать. Следующая функция присваивает полю index значение -1 (значение, которое
- 6. Процедура store() преобразует имя ячейки в хэш-адрес в первичном массиве primary. Если позиция, на которую указывает
- 7. /* в противном случае, создать список коллизий либо добавить в его элемент */ p = (struct
- 8. Для того чтобы получить значение элемента, программа должна сначала вычислить хэш-адрес и проверить, совпадает ли с
- 10. Скачать презентацию
Слайд 2В примере с электронной таблицей понятно, что даже в самых сложных случаях
В примере с электронной таблицей понятно, что даже в самых сложных случаях
используются не все ячейки таблицы. Предположим, что почти во всех случаях фактически занятые ячейки составляют не более 10 процентов потенциально доступных мест. Это значит, что если таблица имеет размер 260x100 (2`600 ячеек), в любой момент времени будет использоваться лишь примерно 260 ячеек. Этим подразумевается, что самый большой массив, который понадобится для хранения всех занятых ячеек, будет в обычных условиях состоять только из 260 элементов. Но как ячейки логического массива сопоставить этому меньшему физическому массиву? И что происходит, когда этот массив переполняется? Ниже предлагается одно из возможных решений.
Когда пользователь вводит данные в ячейку электронной таблицы (т.е. заполняет элемент логического массива), позиция ячейки, определяемая по ее имени, используется для получения индекса (хэш-адреса) в меньшем физическом массиве. При выполнении хэширования физический массив называется также первичным массивом. Индекс в первичном массиве получается из имени ячейки, которое преобразуется в число, точно так, как и в примере с массивом указателей. Но затем это число делится на 10, в результате чего получается начальная точка входа в первичный массив. (Помните, что в данном случае размер физического массива составляет только 10 % размера логического массива.) Если ячейка физического массива по этому индексу свободна, в нее заносятся логический индекс и данные. Но поскольку 10 логических позиций
Когда пользователь вводит данные в ячейку электронной таблицы (т.е. заполняет элемент логического массива), позиция ячейки, определяемая по ее имени, используется для получения индекса (хэш-адреса) в меньшем физическом массиве. При выполнении хэширования физический массив называется также первичным массивом. Индекс в первичном массиве получается из имени ячейки, которое преобразуется в число, точно так, как и в примере с массивом указателей. Но затем это число делится на 10, в результате чего получается начальная точка входа в первичный массив. (Помните, что в данном случае размер физического массива составляет только 10 % размера логического массива.) Если ячейка физического массива по этому индексу свободна, в нее заносятся логический индекс и данные. Но поскольку 10 логических позиций
Слайд 3соответствуют одной физической позиции, могут возникнуть коллизии при вычислении хэш-адресов. Когда это
соответствуют одной физической позиции, могут возникнуть коллизии при вычислении хэш-адресов. Когда это
происходит, записи сохраняются в связанном списке, иногда называемом списком коллизий (collision list). С каждой ячейкой первичного массива связан отдельный список коллизий. Конечно, до возникновения коллизии эти списки имеют нулевую длину, как показано на рисунке
Слайд 4Предположим, требуется найти элемент в физическом массиве по его логическому индексу. Сначала
Предположим, требуется найти элемент в физическом массиве по его логическому индексу. Сначала
необходимо преобразовать логический индекс в соответствующее значение хэш-адреса и проверить, соответствует ли логический индекс, хранящийся в полученной позиции физического массива, искомому. Если да, информацию можно извлечь. В противном случае необходимо просматривать список коллизий для данной позиции до тех пор, пока не будет найден требуемый логический индекс или пока не будет достигнут конец цепочки.
В примере хэширования используется массив структур под названием primary:
#define MAX 260
struct htype {
int index; /* логический индекс */
int val; /* собственно значение элемента данных */
struct htype *next; /* указатель на следующий элемент с таким же
хэш-адресом */
} primary[MAX];
В примере хэширования используется массив структур под названием primary:
#define MAX 260
struct htype {
int index; /* логический индекс */
int val; /* собственно значение элемента данных */
struct htype *next; /* указатель на следующий элемент с таким же
хэш-адресом */
} primary[MAX];
Слайд 5Перед использованием этого массива необходимо его инициализировать. Следующая функция присваивает полю index
Перед использованием этого массива необходимо его инициализировать. Следующая функция присваивает полю index
значение -1 (значение, которое по определению никогда не будет сгенерировано в качестве индекса); это значение обозначает пустой элемент. Значение NULL в поле next соответствует пустой цепочке хэширования.
/* Инициализация хэш-массива. */
void init(void)
{
register int i;
for (i=0; i primary[i].index = -1;
primary[i].next = NULL; /* пустая цепочка */
primary[i].val = 0;
}
}
/* Инициализация хэш-массива. */
void init(void)
{
register int i;
for (i=0; i
primary[i].next = NULL; /* пустая цепочка */
primary[i].val = 0;
}
}
Слайд 6Процедура store() преобразует имя ячейки в хэш-адрес в первичном массиве primary. Если
Процедура store() преобразует имя ячейки в хэш-адрес в первичном массиве primary. Если
позиция, на которую указывает значение хэш-адрес, занята, процедура автоматически добавляет запись в список коллизий с помощью модифицированной версии функции slstore() из предыдущей главы. Логический индекс также сохраняется, поскольку он понадобится при извлечении элемента. Данные функции показаны ниже:
/* Вычисление хэш-адреса и сохранение значения. */
void store(char *cell_name, int v)
{
int h, loc;
struct htype *p;
/* Получение хэш-адреса */
loc = *cell_name - 'A'; /* столбец */
loc += (atoi(&cell_name[1])-1) * 26; /* строка * ширина + столбец */
h = loc/10; /* hash */
/* Сохранить в полученной позиции, если она не занята
либо если логические индексы совпадают - то есть, при обновлении.
*/
if(primary[h].index==-1 || primary[h].index==loc) {
primary[h].index = loc;
primary[h].val = v;
return;
}
/* Вычисление хэш-адреса и сохранение значения. */
void store(char *cell_name, int v)
{
int h, loc;
struct htype *p;
/* Получение хэш-адреса */
loc = *cell_name - 'A'; /* столбец */
loc += (atoi(&cell_name[1])-1) * 26; /* строка * ширина + столбец */
h = loc/10; /* hash */
/* Сохранить в полученной позиции, если она не занята
либо если логические индексы совпадают - то есть, при обновлении.
*/
if(primary[h].index==-1 || primary[h].index==loc) {
primary[h].index = loc;
primary[h].val = v;
return;
}
Слайд 7/* в противном случае, создать список коллизий
либо добавить в его элемент
/* в противном случае, создать список коллизий
либо добавить в его элемент
*/
p = (struct htype *) malloc(sizeof(struct htype));
if(!p) {
printf("Не хватает памяти\n");
return;
}
p->index = loc;
p->val = v;
slstore(p, &primary[h]);
}
/* Добавление элементов в список коллизий. */
void slstore(struct htype *i,
struct htype *start)
{
struct htype *old, *p;
old = start;
/* найти конец списка */
while(start) {
old = start;
start = start->next;
}
/* связать с новой записью */
old->next = i;
i->next = NULL;
}
p = (struct htype *) malloc(sizeof(struct htype));
if(!p) {
printf("Не хватает памяти\n");
return;
}
p->index = loc;
p->val = v;
slstore(p, &primary[h]);
}
/* Добавление элементов в список коллизий. */
void slstore(struct htype *i,
struct htype *start)
{
struct htype *old, *p;
old = start;
/* найти конец списка */
while(start) {
old = start;
start = start->next;
}
/* связать с новой записью */
old->next = i;
i->next = NULL;
}
Слайд 8Для того чтобы получить значение элемента, программа должна сначала вычислить хэш-адрес и
Для того чтобы получить значение элемента, программа должна сначала вычислить хэш-адрес и
проверить, совпадает ли с искомым логический индекс, хранящийся в полученной позиции физического массива. Если совпадает, возвращается значение ячейки; в противном случае — производится поиск в списке коллизий. Функция find(), выполняющая эти задачи, показана ниже:
/* Вычисление хэш-адреса и получение значения. */
int find(char *cell_name)
{
int h, loc;
struct htype *p;
/* получение значения хэш-адреса */
loc = *cell_name - 'A'; /* столбец */
loc += (atoi(&cell_name[1])-1) * 26; /* строка * ширина + столбец */
h = loc/10;
/* вернуть значение, если ячейка найдена */
if(primary[h].index == loc) return(primary[h].val);
else { /* в противном случае просмотреть список коллизий */
/* Вычисление хэш-адреса и получение значения. */
int find(char *cell_name)
{
int h, loc;
struct htype *p;
/* получение значения хэш-адреса */
loc = *cell_name - 'A'; /* столбец */
loc += (atoi(&cell_name[1])-1) * 26; /* строка * ширина + столбец */
h = loc/10;
/* вернуть значение, если ячейка найдена */
if(primary[h].index == loc) return(primary[h].val);
else { /* в противном случае просмотреть список коллизий */