字符编码问题在 Python 中一直是个巨坑,几乎 100% 的 Python 开发者都踩过此坑,写爬虫你会遇到,写Web应用的会遇到,做数据分析的时候会遇到···,网上有针对此问题的各种文章分析,但从没有一篇文章能从本质上说清楚编码错误的问题
有人说,始终保持统一的字符编码就可以避免错误了,但是,现实往往很残酷,你不得不跟各种系统、各种平台打交道,而不同平台有不同的编码格式。
有人说,使用 Python3 就可以避免问题了,遗憾的是,Python3照样有问题,尽管概率上可能会小一点。
我在公众号(Python之禅)写过类似的文章分析字符编码错误的原因,但不够系统,这次,我在 GitChat 发起了一场 Chat,想说说字符编码的前世今生。
如果你想彻底弄清楚字符编码那回事儿,不妨参与一下,我定了一个程序员的情怀价 10.24 元,现在已经有 64人 报名,报名成功后,你将收到一篇高质量文章,还有今晚微信群解答大家的问题,另外有半小时的自由交流时间,欢迎来聊。
