从来都没有一把由坏钢铸成的好刀----本杰明·富兰克林
大家好,我是一个专业的python后台研发高级工程师,本质上并不是一个小编,但是有时候老板也会要求我来写写文章。
我在这个团队里面最主要的工作就是写python代码了,大家在文章中看到的代码,很多都是我写出来的哦。
python读取文件的几种方式
说到python读取文件,趁这个机会,小编也总结了一下,大概有下面几种方法:
f.read()
读取文件中全部内容,它通过一次性读取文件的所有内容放在一个大字符串中,即存在内存中。为了让内存不至于爆掉,可以加参数表示读取最多多少个字节。
f.read()的优势:方便、简单;一次性读出文件放在一个大字符串中,速度最快。
f.read()的弊端:文件过大的时候,占用内存会过大。
f.readline()
读取文件一行。第一次调用的时候,读的是第一行,第二次再调用,读的就是第二行了。
f.readline()的优势:占用内存小,逐行读取。
f.readline()的弊端:由于是逐行读取,读取速度比较慢。
上面两种方法返回的都是字符串。
f.readlines()
读取文件中全部内容,返回的是一个数组,文件中的每行内容就对应数组中的每个元素。
这种方法读取的文本内容,每行文本末尾都会带一个
'\n'
换行符 (可以使用L.rstrip('\n')去掉换行符。
readlines()的利端:一次性读取文本内容,速度比较快。
readlines()的弊端:随着文本的增大,占用内存会越来越多。
os.read()
与 f.read()类似,也是读取文件中的全部内容,也可以加参数表示读取最多多少个字节。
os.read()的奇葩问题
os.read()看起来与f.read()是相同的功能,尤其是在读取文本文件的时候,效果是完全相同的。
但是,在读取二进制文件的时候, 由于os.open()并不支持以二进制方式打开文件,导致的问题就是os.read()读不了二进制文件。
小编在windows10,python3.7的环境下测试了一把,使用os.read去读取一个png文件,结果只读到了四个字符出来,让人很是无语。
print()的奇葩问题
print只能输出字符串。不能输出二进制内容。
解决的办法就是用sys.stdout.buffer.write。
debug cgi程序的小技巧
接下来,小编讲一讲如何debug cgi程序(不限于python的cgi),php/c/c++都可以使用这些小技巧。
1)仔细阅读cgi相关的文档,是的,很多时候我们遇到的bug都是低级错误,在cgi文档里面都有写过。
2)绝大部分http server对于 cgi程序的输出都是有buffer的。 如果cgi程序执行到一半就有了输出,那么浏览器是看不到的,直到cgi程序执行结束之后,才会显示全部的输出。
3)仔细检查http server的出错日志。日志虽然不是万能的,但没有日志是万万不能的。
4)cgi程序一定要先在本地运行一下,确保无错误之后,再放到http server里面通过浏览器访问。
5)python cgi程序可以加上 import cgitb; cgitb.enable() 来定位问题。
6)如果需要在cgi程序里面调用外部程序,一定要使用绝对路径。
7)如果需要在cgi程序中读写文件,一定要检查文件的权限和owner。