判断题
数据挖掘中会遇到各种各样的误解,典型的有对数据挖掘存在不恰当的期望、在数据挖掘应用过程中脱离业务、使用不准确或不完整的数据进行数据挖掘而得出错误结论等。
正确(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)
判断题 决策树模型采用两种树枝修剪方法,分别是事前修剪方法和事后修剪方法。事前修剪方法,从一个“充分生长”树中,修剪掉多余的树枝(分支)。
判断题 数据分布的统计分析方法包括分箱、直方图分析、聚类分析、机遇熵的离散化和通过“自然划分”的数据分段等。
判断题 当数据集过大时,受数据挖掘算法的复杂度或空间复杂度的限制,需要对数据集抽样才能对其进行有效的分析处理,抽样的方式包括,随机抽样、分层抽样、等轴抽样法、整群抽样法、渐进抽样法。