中国民航大学与拓尔思联合举办的人工智能专业全栈能力综合实训面向全体人工智能专业大三学生,为期18天。实训紧贴行业最新发展,设置了数据分析与机器学习、深度学习、大模型与智能体开发等核心模块,涵盖算法设计、模型训练、调优及部署等关键环节,帮助同学们在真实场景中掌握AI技术的全流程应用。
本期课程主要围绕四个项目展开讨论,分别是短视频用户行为分析、淘宝用户行为分析、加利福尼亚房价预测和哪吒情感分析。详细介绍了每个项目的具体操作步骤、数据处理方法和分析思路。
以短视频平台为业务场景,分析用户行为数据,优化内容推荐策略,提升用户留存率和活跃度,该方向是核心业务需求,涉及用户增长、推荐算法、商业变现等多个模块。
数据集介绍:包含七列数据,分别是序号、user ID、视频ID、视频类型、点赞行为、转发行为和时间。
数据处理:分析用户活跃时段,计算点击率和转发率。
推荐策略:使用协同过滤算法,构建用户视频互动矩阵,计算用户相似度进行推荐。
冷启动策略:对新用户和新视频进行默认推荐,基于视频类型和高活跃度用户。
AB测试:通过对照组和实验组的留存率差异评估推荐策略的有效性。
数据预处理:导入数据,查看和处理缺失值、重复值,转换数据类型。
行为分析:计算PV、UV、总订单数等指标,分析跳出率、复购率和用户偏好。
时间序列分析:分析用户在不同时间段的浏览和购买行为,探究转化路径。
用户画像:使用RFM模型或聚类方法对用户进行分类,分析用户特点。
数据预处理:导入数据,进行描述性统计和数据可视化。
特征选择和构建:通过热力图等方法选择相关性高的特征,进行特征缩放。
建模:选择决策树模型进行预测,调参优化模型,评估模型效果。
数据预处理:导入数据,进行情感分析和评分分布转换。
关键词提取:使用TF-IDF方法提取关键词,绘制雷达图和词云图。
时间序列分析:分析不同时间的评分变化趋势,评估电影的用户反馈。
中国民航大学携手拓尔思开展人工智能综合实训
中航大实训特辑 | Python数据分析-企业真实案例分享
中航大实训特辑 | Python数据分析-数据分析思维
中航大实训特辑 | Python数据分析-数据可视化