社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

一周十大热门主题

#AI落地项目合集##LLM实战项目大全#GitHub揽获62.-20250825145732

【报告】AIGC专题三：2025字节跳动：深度布局AIGC，竞逐新一轮技术浪潮（附PDF下载）

上海交大团队研发HFML混合机器学习框架，定向筛选高熵钠电正极材料：从AI预测、实验验证到百公斤中试

即梦推出“智能多帧”功能，突破AI视频长镜头创作瓶颈；谷歌：Gemini每次回答消耗能量相当于微波炉...

GPT-5系统提示词被泄露，ChatGPT自己也“承认”了

量化前沿速递：机器学习[20250824]

MIT最新报告：全球95%企业AI惨败！九成员工偷用ChatGPT续命

(from 饼干哥哥) GitHub 上 17 个优秀的 Cla-20250826081440

【精选报告】AIGC专题一：量子位智库：2025中国AIGC应用全景图谱（附PDF下载）

突发 | 奥特曼交出ChatGPT指挥棒！女CEO接掌大权，OpenAI 权力大洗牌

私信 • 关注

Justin

Justin 最近创建的主题

0

在单个ExternalPythonOperator中使用气流动态任务映射输出

Python • Justin • 2 年前

0

Python moto无法匹配有效的Eventbridge模式

Python • Justin • 3 年前

2

React项目在GitHub页面上显示空白页面

Git • Justin • 3 年前

0

还有一个(可能是超级简单的)问题是Python带有用于生成图像的枕头

Python • Justin • 3 年前

1

python中属性decorator对于可变属性的有用性

Python • Justin • 5 年前

2

python 3:tkinter gui中的udp包发送/接收

Python • Justin • 5 年前

1

python-检查列是否包含列表中的值,返回值

Python • Justin • 5 年前

» Justin 创建的更多主题

Justin 最近回复了

7 年前

回复了 Justin 创建的主题 » PyCharm 2021.3是uber rekt(黑色文本!)

打开样式菜单的快捷方式是 控制键 + ` (这是通常在下面的backtick键。) 电子稳定控制系统 ).

它会打开“切换”菜单,提供配色方案和外观的选项。

颜色方案设置控制主代码编辑器窗格的颜色。“外观”设置控制整个界面的颜色(如果颜色方案是默认的,则包括代码编辑器)。

5 年前

回复了 Justin 创建的主题 » 如何在外键django管理中使用详细名称?

试试这个,

Educational_AttainmentID_Father = models.ForeignKey(EducationalAttainment, on_delete=models.CASCADE,null=True,blank=True, verbose_name="EducationalAttainment")

6 年前

回复了 Justin 创建的主题 » 我如何在python中搜索给定的句子并从结果中获取最常用的单词?[关闭]

我会做更多的研究,并尝试自己先这样做,以便您可以问更多的具体问题,您的方法和代码,您正在工作。

目前还不清楚您希望使用什么文本来识别前5个最常见的单词(即google搜索结果页面中的文本、作为搜索一部分返回的网站上的实际文本等),也不清楚您的分析中会考虑多少结果。

话虽如此,我还是建议调查一下:

对于从web中提取文本,我建议您查看图书馆beautifulsoup4。您可以通过在终端中键入以下内容来安装它:

pip install beautifulsoup4

至于词频,你可以使用nltk来分析你用beautifuldsoup返回的文本,得到词频,或者进行其他基于文本的分析。您可以通过在终端中键入以下内容来安装NLTK:

pip install nltk

如果您反对使用nltk进行文本分析,那么可以使用内置库执行类似的操作,以获取某些文本中最常见的单词的计数:

# import your libraries
import re
from collections import Counter

# clean text from google retrieved with beautiful soup
text_from_google = 'This is some example text I use where I use the word 
example more than once for example'
text = text_from_google.lower().split()

# create a function to return the top n words in text
def get_top_words(text, num_words):

    # basic pre-processing to remove punctuation
    punc_filter = re.compile('.*[A-Za-z0-9].*')
    filtered_text = [word for word in text if punc_filter.match(word)]

    word_counts = Counter(filtered_text)

    return word_counts.most_common(num_words)

# get the top words
top_words = get_top_words(text, 5)

for word in top_words:
    print('The word {} was found {} times'.format(word[0], word[1]))

» Justin 创建的更多回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号