"\xE4\xC5\xCC\xC9\xD3\xD8" 不是有效的utf-8。使用python测试:
"\xE4\xC5\xCC\xC9\xD3\xD8"
>>> "\xE4\xC5\xCC\xC9\xD3\xD8".decode("utf-8") ... UnicodeDecodeError: 'utf8' codec can't decode bytes in position 0-2: invalid data
如果您正在寻找避免在数据库中解码错误的方法,那么cp1252编码(也称为“windows-1252”也称为“windows西欧”)是最允许的编码—每个字节值都是有效的代码点。
当然,它不会再理解真正的utf-8,也不会理解任何其他非cp1252编码,但听起来你不太关心这个问题吗?