UTF-8 BOM
踩坑
Desc
UTF-8
是一种常用的Unicode
字符编码格式UTF-8 BOM
又叫做UTF-8 签名
BOM
(Byte Order Mark)
通过在文件头部添加BOM
来识别具体的文件编码格式
Diff
在Windows
系统会为UTF-8
编码格式的文件头部添加EF BB BF
三个字节
而在类Unix
系统中并不鸟BOM
Summary
使用UTF-8
无BOM
格式
除非你知道你自己在做什么,否则不要使用UTF-8 BOM
格式
使用UTF-8 BOM
会带来的问题(包括但不限于)
- 锘
- HTML空白行
- 乱码
- FILE操作读取报错
- FILE操作读取第一行数据异常
常用编译器中,修改UTF-8 BOM
=> UTF-8
Sublime
File -> Save With Encoding -> UTF-8
Vim
1 | ## 查看文件是否含有BOM头 |
Atom
Atom编辑器默认不可使用UTF-8 BOM