文件系统
python文件系统
1、标准库OS常用命令
- 常用命令
常用命令的调用方式
>>>import os
>>>os.常用命令()
常用命令 | 描述 |
---|---|
getcwd | 查看当前路径 |
chdir | 修改当前路径 |
mkdir | 建立一个子文件夹,已存在时会报错 |
rmdir | 删除一个文件夹,不存在时会报错 |
listdir | 列出当前目录或指定目录下所有文件夹及文件的名称,返回一个列表 |
rename | 修改文件或文件夹的名称 |
remove | 删除一个文件 |
注意:如果想要把一个目录下的文件名前都加上前缀,则可以通过循环遍历来实现
>>>for i in os.listdir():
>>> os.rename(i,'前缀'+i)
2、文件的打开与关闭
文件概述
-
文件可以包含任何数据内容。概念上,文件是数据的集合和抽象,类似地,函数是程序的集合和抽象。用文件形式组织和表达数据更有效也更为灵活。
-
文件包括两种类型:文本文件和二进制文件
-
二进制文件直接由比特0和比特1组成,没有统一字符编码,文件内部数据的组织格式与文件用途有关。
-
二进制文件和文本文件最重要的区别在于是否有统一的字符编码
-
无论文件创建为文本文件或者二进制文件,都可以用“文本文件方式”和“二进制文件方式”打开,打开后的操作不同
-
python中可通过内置方法Open()打开文件,open()方法的申明如下:
open(file,mode = 'r',buffering = -1)
该方法中的参数file一般为文件的路径名,参数mode用于设置文件的打开模式,默认值为‘r’,表示以只读模式打开文件,参数buffering用于设置访问文件时采用的缓冲方式,默认值为-1,表示采用系统默认的缓冲机制。若使用open()方法成功打开文件,则返回一个文件流,否则设置errno
-
文件的打开与关闭
-
文件的打开
OPen()函数提供7种基本的打开模式
打开模式 | 含义 |
---|---|
‘r’ | 只读模式,如果文件不存在,则返回异常FIileNotFoundError,默认值 |
‘w’ | 覆盖写模式,文件不存在则创建,存在则完全覆盖源文件 |
‘x’ | 创建写模式,文件不存在则创建,存在则返回异常FileExistsError |
‘a’ | 追加写模式,文件不存在则创建,存在则返回原文件最后追加内容 |
‘b’ | 二进制文件模式 |
‘t’ | 文本文件模式,默认值 |
‘+’ | 与r/w/x/a一同使用,在原功能基础上增加同时读写功能 |
‘rb’ | 以二进制格式打开一个文件用于只读,文件指针将会放在文件的开头,这是默认模式 |
‘r+’ | 打开一个文件用于读写,文件指针会放在文件的开头 |
‘w+’ | 打开一个文件用于读写,如果该文件已存在则将其覆盖,如果文件不存在,创建新文件 |
‘wb+’ | 以二进制格式打开一个文件用于读写,如果该文件已存在则将其覆盖,如果该文件不存在,创建新文件 |
r /w /x /a 等价于
rt | wt | xt | at |
---|---|---|---|
r+ | w+ | x+ | a+ |
rb | wb | xb | ab |
rb+ | wb+ | xb+ | ab+ |
-
打开非utf-8编码的文件
要读取非utf-8编码的文本文件,需要给open()函数传入encoding参数,例如,读取GBK编码的文件
>>>f = open('/Users/z9761/Desktop/gbk.txt','r',encoding = 'gbk')
>>>f,read()
遇到有些编码不规范的文件,你可能会遇到UnicodeDecodeError,因为在文本文件中可能夹杂了一些非法编码的字符。遇到这种情况,open()函数还接收一个errors参数,表示如果遇到编码错误后如何处理,最简单的方法时直接忽略:
>>>f = open('/Users/z9761/Desktop/gbk.txt','r',encoding = 'gbk',error = 'ignore')
-
打开二进制文件
前面讲的默认都是读取文本文件,并且是utf-8编码的文本文件,要读取二进制文件,比如图片、视频等等,用‘rb’模式打开文件即可:
>>>f = open('/Users/z9761/Desktop/aaa.jpg','rb')
>>>f.read()
b'\xff\xd8\xff\xe1\x00\x18Exif\x00\x00.....' #十六进制表示的字节
- 文件的关闭
f.close()
- 程序执行完毕后,系统会关闭由该程序打开的文件,但更好的做法,是在文件使用完毕后,由程序调用close()方法关闭文件。
- 在文件使用完毕后,及时使用close()函数关闭文件是有必要的
2、使用with open()函数打开
使用方法
每次都这么写实在太繁琐了,所以python引入了with语句来自动帮我们调研close()方法
>>>with open('/path/to/file','r') as f:
>>> print(f.read())
说明:
-
f.read()读取全部文件内容
-
调用read()会一次性读取文件的全部内容,如果文件有10G,内存就爆了
-
要保险起见,可以反复调用read(size)方法,每次最多读取size个字节的内容,例如,read(1024)每次读取1024个字节的数据内容
-
调用readline()可以每次读取一行内容,调用readlines()一次读取所有内容并按行返回list。因此,要根据需要决定怎么调用
-
如果文件很小,read()一次性读取最方便,如果不能确定文件大小,反复调用read(size)比较保险,如果是配置文件,调用readlines()最方便
>>>for line in f.readlines():
>>> print(line.strip()) #把末尾的'\n'在strip()函数中可以把目标内容line里面所有的空格,空行等都删除掉,只剩余文字内容
- read()方法可从指定文件中读取指定字节的数据,该方法的定义如下:
>>>read(size)
其中size用于指定从文件中读取的数据的字节数,若参数缺省,则一次读出指定文件中的所有数据,以读取文件a.txt中的数据为例,read()的用法如下:
>>>f = open('./a.txt')
>>>f.read(5) #从a.txt中读取5个字节
'hello'
>>>f,read(3) #从a.txt中读取3个字节
' it'
>>>f.read() #读取剩余的全部数据
‘heima.\nhello it cast.hello world.’
>>>f.read()
.. #再次调用,读取到的数据为空
我们会发现,在文件的一次打开与关闭之间进行的读写操作都是连续的,程序总是从上次读写的位置继续向下进行读写操作,实际上,每个文件对象都有一个称为“文件读写位置”的属性,该属性用于记录文件当前读写的位置。
python中提供了一些获取文件读写位置以及操作文件读写位置的方法,下面将对这些方法进行讲解。
1、tell()
用户可通过tell()方法获取文件当前的读写位置,在打开一个文件后,文件默认的读写位置为0,当对文件进行读操作后,文件的读写位置也随之移动。
2、f.seek()
一般情况下,文件的读写是顺序的,但并非每次读写都需从当前位置开始。python提供了seek()方法,使用该方法可控制文件的读写位置,实现文件的随机读写。seek()方法的声明如下:
>>>seek(offest,from)
其中参数offest表示偏移量,即读写位置需要移动的字节数,from用于指定文件的读写位置,该参数的取值为:0、1、2,他们代表的含义分别如下:
- 0:表示文件开头
- 1:表示使用当前读写位置
- 2:表示文件末尾
文件的其它属性与方法
调用方法
>>>文件名.方法或属性
- 文件的方法
名称 | 功能 |
---|---|
fileno() | 返回底层文件的文件描述符 |
flush() | 清空文件对象,将缓存中的内容写入磁盘 |
readable() | 若文件对象以打开且等待读取,则返回True,否则返回False |
seekable() | 若文件支持随机存取,则返回True,否则返回False |
truncate(size) | 截取文件到当前文件读写位置,若给定size,则截取为size大小 |
next() | 返回文件对象的下一行 |
- 文件的属性
名称 | 功能 |
---|---|
mode | 获取文件对象的打开模式 |
name | 获取文件对象的文件名 |
encoding | 获取文件使用的编码格式 |
closed | 若文件已关闭则返回True,否则返回False |
写文件
python中可通过write()方法向文件中写入数据,write()方法的定义如下:
write(str)
其中str表示要写入文件中字符串,若调用成功则返回本次写入文件中的字节数
>>>f = open('myfile.txt','w') #要写入内容,必须要先打开文件
>>>d.write("hello world.\n") #写入字符串
13 #本次写入文件的字节数
>>>f.write("hello sky.")
10
>>>f.write("hello flower.")
13
f.close() #关闭文件
文件缓冲
python中的open()方法的参数buffering可用来设置访问文件的缓冲方式,若buffering设置为0,则表示采用非缓冲方式:若设置为1则表示每次缓冲一行数据,若设置为大于1的值则表示使用给定值作为缓冲区的大小。当然若参数buffering缺省,或被设置为负值时,表示使用默认缓冲机制(由设备类型决定)
相比内存与缓冲区之间的读写,内存与磁盘间的读写时间消耗更大,因此采用有缓冲的打开方式可减少内存与磁盘的交互次数,提高文件读写的效率
这次关于文件的内容就到这