Python3快速的方法来检查元素集合中的元素
在Python3
中,有一种更快的方法来检查元素集合中是否存在元素,而不是使用字典进行尝试吗?Python3快速的方法来检查元素集合中的元素
我计时以下和尝试,除了是非常快速的循环通过一个数组,有没有更好的方式去做这个没有使用try
/except
?
import timing
bad_extensions_array = ['.png', '.gif',
'.map', '.jpg', '.ico', '.gzip', '.idx',
'.pack', '.eot', '.ttf', '.woff', '.zip',
'.pfx', '.woff2', '.o', '.node', '.gz',
'.icns', '.tgz', '.dll', '.js', '.nib',
'.PNG', '.exe', '.strings', '.xlsx', '.xls',
'.phar', '.xcf', '.foo', '.bmp', '.ser',
'.otf', '.gnumeric', '.ods', '.xml', '.graffle',
'.pdf']
bad_extensions_dict = {
'.png':True, '.gif':True,
'.map':True, '.jpg':True, '.ico':True, '.gzip':True, '.idx':True,
'.pack':True, '.eot':True, '.ttf':True, '.woff':True, '.zip':True,
'.pfx':True, '.woff2':True, '.o':True, '.node':True, '.gz':True,
'.icns':True, '.tgz':True, '.dll':True, '.js':True, '.nib':True,
'.PNG':True, '.exe':True, '.strings':True, '.xlsx':True, '.xls':True,
'.phar':True, '.xcf':True, '.foo':True, '.bmp':True, '.ser':True,
'.otf':True, '.gnumeric':True, '.ods':True, '.xml':True, '.graffle':True,
'.pdf':True
}
ext_ = 'sdsd'
# ext_ not found
# 0:00:00.110999
# ext_ first in array
# 0:00:00.018037
def check_list():
if ext_ in bad_extensions_array:
return True
return False
# ext_ not found
# 0:00:00.043047
# ext_ found
# 0:00:00.018655
def check_dict():
try:
return bad_extensions_dict[ext_]
except:
return False
for x in range(100000):
#check_list()
#check_dict
正如@Kevin所述,in
也适用于字典。它实际上适用于任何标准集合(尽管str
的定义略有不同)。
检查字典时,您正在识别该密钥是否存在。
由于还指出,如果bad_extensions
仅代表你不应该使用扩展,一组将是最好的,因为这样的:
bad_extensions = {
'bmp', 'dll', 'eot', 'exe', 'foo', 'gif', 'gnumeric', 'graffle', 'gz',
'gzip', 'icns', 'ico', 'idx', 'jpg', 'js', 'map', 'nib', 'node', 'o',
'ods', 'otf', 'pack', 'pdf', 'pfx', 'phar', 'png', 'ser', 'strings',
'tgz', 'ttf', 'woff', 'woff2', 'xcf', 'xls', 'xlsx', 'xml', 'zip'
}
哇,使用'in'与集合比尝试快60倍,除了字典 – ClickThisNick
@ClickThisNick我注意到你也有您的设置中的一些值仅在大小写方面有所不同。考虑让'bad_extensions'中的每个项都是小写,并用'bad_extensions'中的'extension.lower()'进行检查。 – Kupiakos
经测试,案件和.lower几乎两倍缓慢,在这种情况下进出口交易的准确性的速度。另外我不需要检查扩展名中的'.'。这将使它更快* – ClickThisNick
'in'也可以作用于字典。但是如果你只关心按键而不是数值,那么考虑使用一套。 – Kevin
如果密钥不存在,虽然我不确定它是否更快,但您可以使用'.get(ext_,False)'返回False –
nope'dict.get'始终比较慢,但'in'正常工作'dict'然后'set'(都比'list更快) –