1、文件
存储在外部介质上的数据或信息的集合,有序的数据序列
2、编码
信息从一种形式转换为另一种形式的过程
ASCII、Unicode、UTF-8
3、Unicode
跨语言、跨平台进行文本转换处理;对每种语言中字符设定统一且唯一的二进制编码
每个字符两个字节长,总共存储 65536 个 ,很明显 存储中文时往往不够的,所以只能存储常用汉字
4、UTF-8 编码
可变长的Unicode的实现方式,很明显UTF-8与Unicode是不能相互转换的,当然相同部分是有的就是 ASCII的128位
5、二进制文件
除了文本文件都是二进制文件,优点就是 1)节省空间;2)采用二进制无格式存储;3)表示更精确
6、文本文件
采用常用编码的文件,可以使用记事本打开的文件。
7、文件的基本处理
1)file = open(path , model) model可以是 r 、w、r+ 、a .... (只读、只写、读写、附加)
2)str = file.readline(); data = file.read(); [] = file.readlines() ; file.close(); 关闭流,切断文件与程序的关系
3)file.writelines(["hell","woir","dd"]); file.write(str); file.close() ; 清空缓冲区,写入磁盘
8、遍历文件模板
file = open(path,"r");
For line in file.readlines():
#codes
file.close()
file = open(path , "r") ;
For line in file:
#codes
file.close()