如何使用Python计算目录中的文件数
我需要使用Python计算目录中的文件数。 我想最简单的方法是len(glob.glob('*'))
,但是这也将目录计为一个文件。如何使用Python计算目录中的文件数
有什么方法可以只计算目录中的文件吗?
os.listdir()
比使用glob.glob
略高效。为了测试,如果文件名是一个普通的文件(而不是目录或其他实体),使用os.path.isfile()
:
import os, os.path
# simple version for working with CWD
print len([name for name in os.listdir('.') if os.path.isfile(name)])
# path joining version for other paths
DIR = '/tmp'
print len([name for name in os.listdir(DIR) if os.path.isfile(os.path.join(DIR, name))])
这使用os.listdir
并适用于任何目录:
import os
directory = 'mydirpath'
number_of_files = len([item for item in os.listdir(directory) if os.path.isfile(os.path.join(directory, item))])
这可以被简化发电机和发得快一点有:
import os
isfile = os.path.isfile
join = os.path.join
directory = 'mydirpath'
number_of_files = sum(1 for item in os.listdir(directory) if isfile(join(directory, item)))
def count_em(valid_path):
x = 0
for root, dirs, files in os.walk(valid_path):
for f in files:
x = x+1
print "There are", x, "files in this directory."
return x
从抽放工艺this post
1.'files'是一个列表。 2. OP没有寻找递归计数 – SilentGhost 2010-04-13 18:56:21
import os
def count_files(in_directory):
joiner= (in_directory + os.path.sep).__add__
return sum(
os.path.isfile(filename)
for filename
in map(joiner, os.listdir(in_directory))
)
>>> count_files("/usr/lib")
1797
>>> len(os.listdir("/usr/lib"))
2049
import os
path, dirs, files = os.walk("/usr/lib").next()
file_count = len(files)
在Python 3中,[使用'path,dirs,files = os.walk(“/ usr/lib”).__ next __()'改为](https://*.com/问题/ 1073396/IS-发电机下可见的 - 蟒蛇-3-0)。 – alex 2017-08-27 18:33:56
或者对于跨版本的compat'next(os.walk(“/ usr/lib”))' – 2017-12-22 15:26:42
卢克的代码重新格式化。
import os
print len(os.walk('/usr/lib').next()[2])
def directory(path,extension):
list_dir = []
list_dir = os.listdir(path)
count = 0
for file in list_dir:
if file.endswith(extension): # eg: '.txt'
count += 1
return count
这是的fnmatch,这非常好使:
import fnmatch
print len(fnmatch.filter(os.listdir(dirpath), '*.txt'))
如果你知道你所使用的模式,这会快得多(大约一半的时间用我的一个包含10,000个文件的目录进行测试)寻找,而不是用'os.path.isfile()'作为接受的答案来测试每个文件。也比'glob.glob()'快得多。 – CivFan 2016-04-27 15:54:57
import os
print len(os.listdir(os.getcwd()))
有时这可能很有用,但它也包括计数中的子目录 – 2016-07-25 21:22:03
import os
total_con=os.listdir('<directory path>')
files=[]
for f_n in total_con:
if os.path.isfile(f_n):
files.append(f_n)
print len(files)
OP询问**文件的数目**,这也列出目录。 – Korem 2014-09-29 06:19:58
@Korem感谢您的评论 – 2014-09-29 06:31:38
如果您要使用的标准外壳操作系统,你可以更快得到结果一种使用纯pythonic方式。
为Windows例子:
import os
import subprocess
def get_num_files(path):
cmd = 'DIR \"%s\" /A-D /B /S | FIND /C /V ""' % path
return int(subprocess.check_output(cmd, shell=True))
但它不会像便携式。 – 2015-04-08 13:48:10
我发现了另一个答案,可能是为接受的答案是正确的。
for root, dirs, files in os.walk(input_path):
for name in files:
if os.path.splitext(name)[1] == '.TXT' or os.path.splitext(name)[1] == '.txt':
datafiles.append(os.path.join(root,name))
print len(files)
对于所有类型的文件,子目录包括:
import os
list = os.listdir(dir) # dir is your directory path
number_files = len(list)
print number_files
只有文件(避免子目录):
import os
onlyfiles = next(os.walk(dir))[2] #dir is your directory path as string
print len(onlyfiles)
@GuillermoPereira现在有效,谢谢。 – nguyenhoai890 2017-01-17 13:53:43
下面是一个简单的一行命令我发现有用:
print int(os.popen("ls | wc -l").read())
我用glob.iglob
类似目录结构
data
└───train
│ └───subfolder1
│ | │ file111.png
│ | │ file112.png
│ | │ ...
│ |
│ └───subfolder2
│ │ file121.png
│ │ file122.png
│ │ ...
└───test
│ file221.png
│ file222.png
以下选项返回图4(正如所料,即两个不计子文件夹本身)
len(list(glob.iglob("data/train/*/*.png", recursive=True)))
sum(1 for i in glob.iglob("data/train/*/*.png"))
我这样做,这回该文件夹中(Attack_Data文件数量)...这工作正常。
import os
def fcount(path):
#Counts the number of files in a directory
count = 0
for f in os.listdir(path):
if os.path.isfile(os.path.join(path, f)):
count += 1
return count
path = r"C:\Users\EE EKORO\Desktop\Attack_Data" #Read files in folder
print (fcount(path))
编辑你的答案,因为它不可读! – abhiarora 2017-01-11 15:36:25
我很惊讶,没有人提到os.scandir
:
def count_files(dir):
return len([1 for x in list(os.scandir(dir)) if x.is_file()])
与Python 3.6很好地合作! – 2018-02-13 10:04:15
如果你想数目录中的所有文件 - 包括子目录中的文件,最Python的方式是:
import os
file_count = sum(len(files) for _, _, files in os.walk(r'C:\Dropbox'))
print(file_count)
我们使用比明确添加文件计数更快的总和(计时未决)
嗨,我试图理解这个代码(代码完美),我知道我们可以在'for'循环中使用'_'。我也知道'os.walk'。但是不清楚'sum'函数中的下划线是怎么回事,请您详细说明一下。谢谢! – Ejaz 2018-01-02 13:22:51
Unsderscore只是一个变量名@Ejaz,当我们忽略变量的时候会使用这个变量 - 这就是我们在这里所做的 - 我们称之为walk,并且只计算每个目录中的文件数量,忽略根目录和目录遍历返回值 – 2018-01-03 18:58:44
如果你不在cwd上,记得在'os.path.filename(name)'里面添加'folder_path'。 http://*.com/questions/17893542/why-do-os-path-isfile-return-false – 2014-04-10 14:54:16
这不包括嵌套文件夹内的文件。 – codersofthedark 2015-04-23 09:33:21
对于嵌套在目录中的文件进行递归计数,使用os.walk()解决方案可能会更好。 – 2015-12-23 21:23:23