文本挖掘(Text Mining,TM),又称自然语言处理(Nature Language Processing,NLP),指从文本数据中提取有价值的信息,是数据挖掘中的一种方法,也是大数据时代的前沿领域。目前,文本挖掘不仅仅应用于人机对话系统、推荐算法及商业领域,学术圈也不例外;如果在知网以“文献挖掘”为主题进行检索,你会发现文本挖掘技术已经广泛应用到了各个科研领域当中。
下图为“文本挖掘”在知网学检索科领域结果分析
语言研究、经济管理、政策分析、新闻媒体舆情分析、生物医药等研究中都可以看到文本挖掘的身影,从海量的文本数据中挖掘有效的数据信息已成为了热门的研究方向;2020年,教育部印发通知增设“
交叉学科”门类,表明多学科交叉融合将成为加速科研发展的重大趋势。
让文本挖掘赋能你的研究,还不快上车?
你可能想说:我也想学,但是什么数据挖掘听上去很难?!别担心,本次小募邀请到了数据分析领域——张文彤老师为大家带来《Python数据分析-玩转文本挖掘》课程!
文彤老师拥有
20+年的数据分析/统计软件商业培训经验,通俗易懂是他突出的教学风格;《Python数据分析-玩转文本挖掘》是从实际应用的角度出发,不会过多的强调编程技巧。课程中选用了武侠小说、大众点评抓取结果、微博语料数据等多个实际案例进行教学,学习完本课程后,学员将能够独立使用Python环境完成中文文本挖掘的各种工作。
*温馨提示:由于微信对视频大小的限制,本视频为压缩版,想要看清晰版的试听课,可以点击小程序卡片在课程目录中观看更多“试听课”哦!
✔ 张文彤老师拥有20+年数据分析/统计软件培训经验,并著有10+本数据分析类教材,授课风格简明易懂,跟着张老师学,助你高效掌握文本挖掘;✔ 课程将会从基本的分词、词袋模型、分布式表示等概念开始,详细讲解传统(基于字典)思路与现代(基于统计模型)思路,多角度介绍中文文本挖掘技术的多个方面;✔ 课程结合多实际案例进行教学,助学员独立使用Python环境完成中文文本挖掘的各种工作。
● 懂点儿Python但不懂数据分析,或懂点儿数据分析却又不懂Python,希望能够成为IT圈和统计分析圈的跨界人才。
● 需要懂得Python语言的基本编程知识,包括:✔ 列表、字典、元组等基本的Python数据结构。● 课程中数据管理主要以Pandas数据框为核心展开,建议学员优先学习张文彤老师主讲的《Python数据分析:玩转Pandas》教程。
同时报名两门课程更划算哦,点击文中小程序卡片,查看详情页组合包优惠。● 需要有统计分析和统计模型的基本知识,如:回归分析、聚类分析等基本概念。
(助教工作时间:周一至周日 9:00-18:00)