社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

一周十大热门主题

DeepSeek官方发布Agent接入手册 https://github.com/deepsee...

2026必看AI干货!《大模型/AIGC/GPT-4/Transformer/DL/KG/NLP/C...

马斯克翻车了！一边告OpenAI，一边偷偷蒸馏ChatGPT

DeepSeek V4发布！硬刚ChatGPT 5.5！两种AI哲学背后是你不容错过的未来！

python中很常用的62个内置函数整理。

【报告】ChatGPT专题二：OpenAI《The State of Enterprise AI》2...

纸书 50 美元，作者把全本扔上 GitHub

推荐 3 个 GitHub 画图 Skill，一句话生成流程图、架构图。

GitHub 40k Star！这个开源神器，让 AI 调用直接省下一半 Token

关注

Py学习 » Python

python 编码问题

yi4534 • 8 年前 • 2147 次点击

#encoding='utf-8' 
import tstEncode
import chardet


strsrc = 'abcd在1efg'
rt1= chardet.detect(strsrc)
print rt1

strsrc = strsrc.decode(rt1['encoding'])
strsrc =strsrc.encode('GBK','ignore')
rt1= chardet.detect(strsrc)
print rt1

为什么这个编码会这样： {'confidence': 0.73, 'language': '', 'encoding': 'Windows-1252'} {'confidence': 0.73, 'language': '', 'encoding': 'ISO-8859-1'}

本应该有的结果不是：前是 UTF-8 后面得到的应该为GBK才对啊！求解

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/2222

文章 [ 1 ] | 最新文章 8 年前

• 1 楼

Py站长 8 年前

strsrc = 'abcd在1efg' 中的 1e 是特殊字符，会有问题。

另外，最好不要在代码里有中文并且转码转来转去的。各种问题的。统一用utf-8就好了。

相关转码的文章在这里 http://in355hz.iteye.com/blog/1860787

# coding=utf-8

import chardet

strsrc = "abcd在在在在1fg"

rt1 = chardet.detect(strsrc)
print rt1

import urllib

rawdata = urllib.urlopen('http://chardet.readthedocs.io/en/latest/usage.html').read()
print chardet.detect(rawdata)

登录后回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)