社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
私信  •  关注

Anon Coward

Anon Coward 最近创建的主题
Anon Coward 最近回复了
4 年前
回复了 Anon Coward 创建的主题 » Python-修复用错误编码保存的波斯语文本文件

文件可能是用cp1256编码的,也就是Windows-1256,Windows中用于波斯语和乌尔都语的代码页。要创建该文件的UTF-8版本,只需在该代码页中读取该文件,然后用UTF-8写出:

with open("source.srt", "rt", encoding="cp1256") as f:
    data = f.read()

with open("fixed.srt", "wt", encoding="utf_8_sig") as f:
    f.write(data)
5 年前
回复了 Anon Coward 创建的主题 » python:如何将字符串转换为url安全字符串?

从技术上讲,要将字符串编码为url安全值,只需通过urllib的解析器运行它:

import urllib.parse
print(urllib.parse.quote(value))

但是,您要求自定义转换。您可以使用一些内置字符串和正则表达式库来执行此操作:

import re
print(re.sub("[^a-z0-9-]", "", value.lower().replace(" ", "-")))

如果你想允许超过 a-z , 0-9 - 作为“valid”,则需要扩展正则表达式。