Topic Modelling tutorial

对于数据的敏感,来自对数据的统计,今天我们将基于LDA模型找一篇中文报道找出它的主题,并进行词云绘制 LDA(Latent Dirichlet Allocation) 在 LDA 中,建模过程围绕三件事展开:文本语料库、文档集合、D 和文档中的单词 W。因此,该算法试图通过以下方式从该语料库中发现

Lee 发布于 2024-03-22

kaggel:宇宙飞船泰坦尼克号(随机决策树)

kaggle Kaggle是一个在线数据科学竞赛平台,它聚集了来自世界各地的数据科学家和机器学习爱好者。Kaggle提供各种数据集,用户可以使用这些数据集来练习数据分析和机器学习技能,并通过参与竞赛来解决问题。这些竞赛通常由公司、研究机构或其他组织发起,涉及各种实际问题,如预测房价、识别图片中的物体

Lee 发布于 2024-03-14