python高级文件和爬虫

文件后续
转换文字:分辨文件的编码格式
num = open(r'C:\Users\悠然\Desktop\练字\python.txt','r+',encoding='gbk')
text = num.read()
print(text)

如图：

python高级文件和爬虫

循环读以行为单位
num = open(r'C:\Users\悠然\Desktop\练字\新建文本文档.txt','r+',encoding='gbk')
text = num.readline()
while len(text)!=0:
    print(text,end='')
    #再读取一行下一行
    text = num.readline()

如图：

python高级文件和爬虫

复制并替换
foo = open(r'C:\Users\悠然\Desktop\练字\python.txt','r+',encoding='gbk')
num = open(r'C:\Users\悠然\Desktop\练字\python2.txt','w+',encoding='gbk')
lines = foo.readlines()
print(lines)
for li in lines:
num.write(li.replace('哈哈哈','XXX'))
num.close()
foo.close()
print("复制并替换完毕")

如图：

小小爬虫
from urllib import request
请求打开一个网页
response = request.urlopen('https://www.taobao.com')
在本地创建一个文本
xml = open('python_xml.html','w+',encoding='utf-8')
把服务器的相应处理
html = response.read()
xml.write(str(html.decode('utf-8')))
print('读取完毕')

如图：

图二：

完毕！

python高级文件和爬虫

相关推荐