查找:
在一些数据元素中,通过一定的方法找出与给定关键字相同数据的元素的过程
列表查找(线性表查找):
- 从列表中查找指定元素
- 输入:列表、待查找元素
- 输出:元素下标(未找到元素时一般返回None或-1)
- python内置列表查找函数index()
1、顺序查找
1、按照序列原有顺序对数组或列表进行遍历比较查询的基本查找算法。
2、对于任意一个序列以及一个给定的元素,将给定元素与序列中元素依次比较,直到找出与给定关键字相同的元素,或者将序列中的元素与其都比较完为止。
时间复杂度:
问题规模:列表的长度(n)
O(1):当查找的元素位于列表第一位时,最好的情况
O(n):遍历列表所有元素,最坏的情况
def linear_search(li, val):
for ind, v in enumerate(li): # 枚举列表的下标和值
if v == val:
return ind, li[ind]
else:
return None
2、二分查找(折半查找)
1、二分查找也称折半查找(Binary Search),它是一种效率较高的查找方法。但是,折半查找要求线性表必须采用顺序存储结构,而且表中元素按关键字有序排列。
2、首先,假设表中元素是按升序排列,将表中间位置记录的关键字,与查找关键字比较,如果两者相等,则查找成功;否则利用中间位置记录将表分成前、后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一子表。重复以上过程,直到找到满足条件的记录,使查找成功,或直到子表不存在为止,此时查找不成功。
3、
必须采用顺序存储结构。
必须按关键字大小有序排列。
时间复杂度:
O(logn)
def binary_search(li, val):
left = 0
rigth = len(li) - 1
while left <= rigth: # 候选区有值
mid = (left + rigth) // 2
if li[mid] == val:
return mid, li[mid]
elif li[mid] > val: # 待查找的值在mid左边
rigth = mid - 1
else: # 待查找的值在mid右边
left = mid + 1
3、比较两种算法的效率
当列表是有序列表时:
二分查找的耗时时间几乎为零,效率大于顺序查找
import time
def cal_time(func):
def inner(*args, **kwargs):
strat = time.time()
result = func(*args, **kwargs)
end = time.time()
print('%s执行时间:%s' % (func.__name__, end - strat))
return result
return inner
# 1.顺序查找
@cal_time
def linear_search(li, val):
for ind, v in enumerate(li):
if v == val:
return ind, li[ind]
else:
return None
# 2.二分查找(折半查找)
@cal_time
def binary_search(li, val):
left = 0
rigth = len(li) - 1
while left <= rigth: # 候选区有值
mid = (left + rigth) // 2
if li[mid] == val:
return mid, li[mid]
elif li[mid] > val: # 待查找的值在mid左边
rigth = mid - 1
else: # 待查找的值在mid右边
left = mid + 1
li = list(range(1, 1000000))
print(linear_search(li, 66548))
print(binary_search(li, 66548))
linear_search执行时间:0.0009965896606445312
(66547, 66548)
binary_search执行时间:0.0
(66547, 66548)
当列表不是有序列表时(二分查找需要先对列表进行排序):
这样时间都耗费在排序上,效率又低于顺序查找
import time
def cal_time(func):
def inner(*args, **kwargs):
strat = time.time()
result = func(*args, **kwargs)
end = time.time()
print('%s执行时间:%s' % (func.__name__, end - strat))
return result
return inner
# 1.顺序查找
@cal_time
def linear_search(li, val):
for ind, v in enumerate(li):
if v == val:
return ind, li[ind]
else:
return None
# 2.二分查找(折半查找)
@cal_time
def binary_search(li, val):
li.sort() # 排序
left = 0
rigth = len(li) - 1
while left <= rigth: # 候选区有值
mid = (left + rigth) // 2
if li[mid] == val:
return mid, li[mid]
elif li[mid] > val: # 待查找的值在mid左边
rigth = mid - 1
else: # 待查找的值在mid右边
left = mid + 1
li = list(range(1, 1000000))
print(linear_search(li, 66548))
print(binary_search(li, 66548))
linear_search执行时间:0.0019931793212890625
(66547, 66548)
binary_search执行时间:0.00398707389831543
(66547, 66548)