【转】python⽂件读写——withopen语句
读写⽂件是最常见的IO操作。Python内置了读写⽂件的函数,⽤法和C是兼容的。
读写⽂件前,我们先必须了解⼀下,在磁盘上读写⽂件的功能都是由操作系统提供的,现代操作系统不允许普通的程序直接操作磁盘,所
以,读写⽂件就是请求操作系统打开⼀个⽂件对象(通常称为⽂件描述符),然后,通过操作系统提供的接⼝从这个⽂件对象中读取数据
(读⽂件),或者把数据写⼊这个⽂件对象(写⽂件)。
读⽂件
要以读⽂件的模式打开⼀个⽂件对象,使⽤Python内置的open()函数,传⼊⽂件名和标⽰符:
>>>f=open('/Urs/michael/','r')
标⽰符'r'表⽰读,这样,我们就成功地打开了⼀个⽂件。
如果⽂件不存在,open()函数就会抛出⼀个IOError的错误,并且给出错误码和详细的信息告诉你⽂件不存在:
>>>f=open('/Urs/michael/','r')
Traceback(mostrecentcalllast):
File"
FileNotFoundError:[Errno2]Nosuchfileordirectory:'/Urs/michael/'
如果⽂件打开成功,接下来,调⽤read()⽅法可以⼀次读取⽂件的全部内容,Python把内容读到内存,⽤⼀个str对象表⽰:
>>>()
'Hello,world!'
最后⼀步是调⽤clo()⽅法关闭⽂件。⽂件使⽤完毕后必须关闭,因为⽂件对象会占⽤操作系统的资源,并且操作系统同⼀时间能打开的⽂
件数量也是有限的:
>>>()
由于⽂件读写时都有可能产⽣IOError,⼀旦出错,后⾯的()就不会调⽤。所以,为了保证⽆论是否出错都能正确地关闭⽂件,我们可
以使⽤try...finally来实现:
try:
f=open('/path/to/file','r')
print(())
finally:
iff:
()
但是每次都这么写实在太繁琐,所以,Python引⼊了with语句来⾃动帮我们调⽤clo()⽅法:
withopen('/path/to/file','r')asf:
print(())
这和前⾯的try...finally是⼀样的,但是代码更佳简洁,并且不必调⽤()⽅法。
调⽤read()会⼀次性读取⽂件的全部内容,如果⽂件有10G,内存就爆了,所以,要保险起见,可以反复调⽤read(size)⽅法,每次最多读取
size个字节的内容。另外,调⽤readline()可以每次读取⼀⾏内容,调⽤readlines()⼀次读取所有内容并按⾏返回list。因此,要根据需要决定怎么
调⽤。
如果⽂件很⼩,read()⼀次性读取最⽅便;如果不能确定⽂件⼤⼩,反复调⽤read(size)⽐较保险;如果是配置⽂件,调⽤readlines()最⽅便:
nes():
print(())#把末尾的'n'删掉
写⽂件
写⽂件和读⽂件是⼀样的,唯⼀区别是调⽤open()函数时,传⼊标识符'w'或者'wb'表⽰写⽂本⽂件或写⼆进制⽂件:
>>>f=open('/Urs/michael/','w')
>>>('Hello,world!')
>>>()
你可以反复调⽤write()来写⼊⽂件,但是务必要调⽤()来关闭⽂件。当我们写⽂件时,操作系统往往不会⽴刻把数据写⼊磁盘,⽽是放到
内存缓存起来,空闲的时候再慢慢写⼊。只有调⽤clo()⽅法时,操作系统才保证把没有写⼊的数据全部写⼊磁盘。忘记调⽤clo()的后果是
数据可能只写了⼀部分到磁盘,剩下的丢失了。所以,还是⽤with语句来得保险:
withopen('/Urs/michael/','w')asf:
('Hello,world!')
要写⼊特定编码的⽂本⽂件,请给open()函数传⼊encoding参数,将字符串⾃动转换成指定编码
字符编码
要读取⾮UTF-8编码的⽂本⽂件,需要给open()函数传⼊encoding参数,例如,读取GBK编码的⽂件:
>>>f=open('/Urs/michael/','r',encoding='gbk')
>>>()
'测试'
遇到有些编码不规范的⽂件,你可能会遇到UnicodeDecodeError,因为在⽂本⽂件中可能夹杂了⼀些⾮法编码的字符。遇到这种情况,open()函
数还接收⼀个errors参数,表⽰如果遇到编码错误后如何处理。最简单的⽅式是直接忽略:
>>>f=open('/Urs/michael/','r',encoding='gbk',errors='ignore')
⼆进制⽂件
前⾯讲的默认都是读取⽂本⽂件,并且是UTF-8编码的⽂本⽂件。要读取⼆进制⽂件,⽐如图⽚、视频等等,⽤'rb'模式打开⽂件即可:
>>>f=open('/Urs/michael/','rb')
>>>()
b'xffxd8xffxe1x00x18Exifx00x00...'#⼗六进制表⽰的字节
总结:以后读写⽂件都使⽤withopen语句,不要再像以前那样⽤f=open()这种语句了
对于多个⽂件的读写,可以写成以下两种⽅式:
withopen('/home/xbwang/Desktop/output_','r')asf:
withopen('/home/xbwang/Desktop/output_','r')asf1:
withopen('/home/xbwang/Desktop/output_output_','r')asf2:
........
........
........
withopen('/home/xbwang/Desktop/output_','r')asf:
........
withopen('/home/xbwang/Desktop/output_','r')asf1:
........
withopen('/home/xbwang/Desktop/output_output_','r')asf2:
........
本文发布于:2022-12-04 09:47:59,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/fanwen/fan/88/50318.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |