散列技术
首先要谈谈什么是散列(Hash)技术,散列技术是在记录的存储位置和它的关键字之间建立一个确定的对应关系f,是的每一个关键字key对应一个存储位置。
散列函数
既然散列技术就是值跟地址的映射关系,那么我们的问题就是如何确定这个地址,散列函数就是用来计算散列地址的。散列函数的实现有多种方法,例如直接取址,平方取中法,除留余数法等。在此分析最常用的 除留余数法。
除留余数法基本公式:
f(a) = key % m;
其中key为取址的关键字,m为散列表的表长。
假设我有一个数组想要插入散列表,{1,4,5,6,8,9,10},假设我当前插入4, 表长m为6,使用散列函数 f = 4 % 6 = 4,因此4这个值对应的地址为4,其余同理。
但是请注意:
这存在一个问题,存10这个数的时候,余数也是4,跟4的地址重复了,所以这就是一个地址冲突的问题。
处理散列函数的冲突
处理冲突,一般采用开放地址法,简单得说就是:当要插入的值发生地址重复时,则寻找下一个地址是否可以存放该值。
开放地址法公式:
f(a) = (key + d) / m; (d=1,2,3,4,5….. <= m);
对于刚刚值为10的问题,和4的地址冲突后,调用发放地址法公式求得地址为5,然而5也被值5占了,因此再调用公式取得地址为0,此时0的地方为空,因此可以插入10;
对于d的取址,当d为(1,2,3,4,5….)时,取址只能往一边搜索,如果刚好当前位置的前一个位置为空时,也要把整个表搜索完。
更好的取址是(1², -1², 2², -2²……),这可以在当前位置往左右两个方向搜索,效率较高。
代码实现散列表的建立和查找
#include <iostream>
#include <stdlib.h>
#include <stdio.h>
#define SUCCESS 1
#define ERROR 0
#define HASHSIZE 12
#define NULLKEY -32768
typedef struct HashTable{
int *elem;
int count;
}HashTable;
int m = 0;
void initHashTable(HashTable *H){
int i;
m = HASHSIZE;
H->count = m;
H->elem = (int *) malloc (m*sizeof(int));
for(i = 0;i < m; i++){
H->elem[i] = NULLKEY;
}
}
//计算散列地址
int hash(int key){
return key % m;
}
void insertHash(HashTable *H, int key){
int addr = hash(key);
while(H->elem[addr] != NULLKEY){
addr = (addr+1) % m;
}
H->elem[addr] = key;
}
//散列查找
int searchHash(HashTable *H, int key){
int addr = hash(key);
while(H->elem[addr] != key){
addr = (addr + 1) % m;
if(H->elem[addr] == NULLKEY || addr == hash(key)){
return ERROR;
}
}
return SUCCESS;
}
//建立散列表
void createHash(HashTable *H, int a[]){
int i;
for(i = 0; i < m; i++){
insertHash(H, a[i]);
}
}
int main(){
HashTable *H = new HashTable;
initHashTable(H);
int a[] = {12,67,56,16,25,37,22,29,15,47,48,34};
createHash(H, a);
//设置搜索的值
if(searchHash(H, 12) == SUCCESS){
printf("查找成功");
}else{
printf("查找失败");
}
}
结果:
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/7807.html