新的一行
Windows与Linux在处理文本文件时,标记新一行的符号是不一样的。在要换新一行的文本末尾,Windows用CR LF(\r\n,十六进制为0D 0A)标记,而在Linux/Unix里是LF(\n,十六进制为0A)。
历史
回车(carriage return)和换行(line feed)这两个概念要上溯到计算机还出现之前,有一种叫做电传打字机的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做回车,告诉打字机把打印头定位在左边界;另一个叫做换行,告诉打字机把纸向下移一行。这就是换行和回车的来历,从它们的英语名字上也可以看出一二。后来,计算机发明了,这两个概念也就被搬到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以,于是就出现了分歧。Unix系统里,每行结尾只有“换行”,即\n;Windows系统里面,每行结尾是“换行”“回车”,即\r\n;Mac系统里,每行结尾是“回车”(注:Mac OS X开始换行符也改为和Linux中一样)。
冲突就此产生
不同的换行符号,导致不同系统之间读取文件涉及换行时有可能出现问题。例如,Linux/Unix系统下的文件在Windows里用记事本打开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符。
而在编程读写文件操作时,如果打开文件时采用文本模式,则系统会自动转换返回给程序正确的结果;在Windows下用\n写文件产生的换行符为CR LF,而在Linux下则生成LF,采用二进制方式读取文件,系统直接读取存储的数据而不转换,这样就会得到不同的结果。事实上如果没有历史遗留的换行问题,那么文本模式的读写文件方法就没有必要了。但既然这个问题事实存在,那就应该格外小心,尤其是涉及到Windows与Linux下相互读取文件。
许多文本编辑器提供这种差异的处理功能。例如在Notepad++中,从菜单栏的View-> Show Symbol-> Show End of Line可以查看文档换行是何种类型;在其菜单栏的Edit-> EOL Conversion中,能够转换当前文本的换行符号。