社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

使用python从lemmatize单词集中删除符号的任何方法

Jim jason • 3 年前 • 1119 次点击  

我从下面的代码中得到了一个lemmatize输出,输出单词由“:,,!,()”符号组成

output_H3 = [lemmatizer.lemmatize(w.lower(), pos=wordnet.VERB) for w in processed_H3_tag]

输出:-

  • [' 隐藏 ', ' show() ', ' 方法: “,”jquery“,”幻灯片“,” 元素: ', “LaunchedW3学校” 今天 ']

预期产出:-

  • [' 隐藏 ', ' 显示 ', ' 方法 “,”jquery“,”幻灯片“,” 元素 ', “LaunchedW3学校” 今天 ']
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/129511
 
1119 次点击  
文章 [ 1 ]  |  最新文章 3 年前
Richard Dodson
Reply   •   1 楼
Richard Dodson    3 年前

正则表达式可以帮助:

import re 

output = [
    "hide()",
    "show()",
    "methods:",
    "jquery",
    "slide",
    "elements:",
    "launchedw3schools",
    "today!",
]


>>> import pprint
>>> expected = [re.sub(r'[:,?!()]', '', e) for e in output]
>>> pprint.pprint(expected)
['hide',
 'show',
 'methods',
 'jquery',
 'slide',
 'elements',
 'launchedw3schools',
 'today']

这会将您的非所需字符列表中的任何字符替换为零。