Python3快速的方法来检查元素集合中的元素

问题描述:

Python3中,有一种更快的方法来检查元素集合中是否存在元素,而不是使用字典进行尝试吗?Python3快速的方法来检查元素集合中的元素

我计时以下和尝试,除了是非常快速的循环通过一个数组,有没有更好的方式去做这个没有使用try/except

import timing 

bad_extensions_array = ['.png', '.gif', 
       '.map', '.jpg', '.ico', '.gzip', '.idx', 
       '.pack', '.eot', '.ttf', '.woff', '.zip', 
       '.pfx', '.woff2', '.o', '.node', '.gz', 
       '.icns', '.tgz', '.dll', '.js', '.nib', 
       '.PNG', '.exe', '.strings', '.xlsx', '.xls', 
       '.phar', '.xcf', '.foo', '.bmp', '.ser', 
       '.otf', '.gnumeric', '.ods', '.xml', '.graffle', 
       '.pdf'] 

bad_extensions_dict = { 
    '.png':True, '.gif':True, 
    '.map':True, '.jpg':True, '.ico':True, '.gzip':True, '.idx':True, 
    '.pack':True, '.eot':True, '.ttf':True, '.woff':True, '.zip':True, 
    '.pfx':True, '.woff2':True, '.o':True, '.node':True, '.gz':True, 
    '.icns':True, '.tgz':True, '.dll':True, '.js':True, '.nib':True, 
    '.PNG':True, '.exe':True, '.strings':True, '.xlsx':True, '.xls':True, 
    '.phar':True, '.xcf':True, '.foo':True, '.bmp':True, '.ser':True, 
    '.otf':True, '.gnumeric':True, '.ods':True, '.xml':True, '.graffle':True, 
    '.pdf':True 
} 

ext_ = 'sdsd' 

# ext_ not found 
# 0:00:00.110999 

# ext_ first in array 
# 0:00:00.018037 

def check_list(): 
    if ext_ in bad_extensions_array: 
     return True 
    return False 

# ext_ not found 
# 0:00:00.043047 

# ext_ found 
# 0:00:00.018655 

def check_dict(): 
    try: 
     return bad_extensions_dict[ext_] 
    except: 
     return False 

for x in range(100000): 
    #check_list() 
    #check_dict 
+5

'in'也可以作用于字典。但是如果你只关心按键而不是数值,那么考虑使用一套。 – Kevin

+0

如果密钥不存在,虽然我不确定它是否更快,但您可以使用'.get(ext_,False)'返回False –

+0

nope'dict.get'始终比较慢,但'in'正常工作'dict'然后'set'(都比'list更快) –

正如@Kevin所述,in也适用于字典。它实际上适用于任何标准集合(尽管str的定义略有不同)。

检查字典时,您正在识别该密钥是否存在。

由于还指出,如果bad_extensions仅代表你不应该使用扩展,一组将是最好的,因为这样的:

bad_extensions = { 
    'bmp', 'dll', 'eot', 'exe', 'foo', 'gif', 'gnumeric', 'graffle', 'gz', 
    'gzip', 'icns', 'ico', 'idx', 'jpg', 'js', 'map', 'nib', 'node', 'o', 
    'ods', 'otf', 'pack', 'pdf', 'pfx', 'phar', 'png', 'ser', 'strings', 
    'tgz', 'ttf', 'woff', 'woff2', 'xcf', 'xls', 'xlsx', 'xml', 'zip' 
} 
+0

哇,使用'in'与集合比尝试快60倍,除了字典 – ClickThisNick

+0

@ClickThisNick我注意到你也有您的设置中的一些值仅在大小写方面有所不同。考虑让'bad_extensions'中的每个项都是小写,并用'bad_extensions'中的'extension.lower()'进行检查。 – Kupiakos

+0

经测试,案件和.lower几乎两倍缓慢,在这种情况下进出口交易的准确性的速度。另外我不需要检查扩展名中的'.'。这将使它更快* – ClickThisNick