数据挖掘实验报告

更新时间:2023-10-31 14:05:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

数据仓库与数据挖掘实验

一、聚类算法测算数据集,如下图所示的数据集:

1.对mfeat-fac数据集进行测算 (1)创建Analysis Services chf项目

打开Business Intelligence Development Studio,选择“文件”—“新建”命令,新建一个Analysis Services 项目。在“名称”文本框中将新项目命名为Analysis Services chf,单击“确定”按钮。

(2)创建数据源Chenhongfei

在右侧解决方案资源管理器中,右键单击“数据源”项,从弹出的快捷菜单中选择“新建数据源”命令。系统将打开数据源向导。单击“新建”按钮,向Adventure Works数据库添加连接。系统将打开“连接管理器”对话框,连接到数据库chenhongfei,单击“确定”按钮。单击“下一步”按钮进入“模拟信息”页,选择“默认值”。具体如下图所示

(3)创建数据源视图Chenhongfei

在解决方案资源管理器中,右键单击“数据源视图”,从弹出的快捷菜单中选择“新建数据源视图”命令,系统将打开数据源视图向导。在“欢迎使用数据源视图向导”页上,单击“下一步”按钮。选择dbo.cc1视图,然后右击,将它包括在新数据源视图中,如下图所示:

(4)创建挖掘结构Cc1

在解决方案资源管理器中,右键单击“挖掘结构”,在弹出的快捷菜单中选择“新建挖掘结构”命令,系统将打开数据挖掘向导。在“欢迎使用数据向导”页上,单击“下一步”按钮。在“选择定义方法”页上,确认已选中“从现有关系数据库或数据仓库”,单击“下一步”按钮。在“选择数据挖掘技术”页的

“你要使用何种数据挖掘技术?”下拉列表中选择“Microsoft聚类分析”选项,如下图所示:

单击“下一步”按钮,在随后出现的“选择数据源视图”页上,请注意已默认选中Chenhongfei。单击“选择数据源视图”页上的“下一步”按钮,在“指定表类型”页上,选择cc1表右边“事例”列中的复选框,单击“下一步”按钮。随后出现“指定定型数据”页。然后单击列0的右边“键”列中的复选框。并且其他的选中相应的“输入”复选框。如下图所示

接着如下图所示设置挖掘结构的相关参数,在“挖掘模型”选

项卡上单击鼠标右键,从弹出的快捷菜单中选择“设置算法参数”命令,系统将打开“算法参数”对话框,如下图所示:

选择“挖掘模型查看器”选项卡,程序问是否建立部署项目,

选择“是”。在接下来的“处理挖掘模型”页上,单击“运行”按钮,出现“处理进度”页,处理进度完成之后,单击“关闭”按钮,建模完成。如下图所示:

最后选择“挖掘模型查看器”选项卡,由cc1数据集得到的聚类分析结果,如下图所示:

2.对mfeat-fou数据集进行测算 (1) 创建Analysis Services chf项目

打开Business Intelligence Development Studio,选择“文件”—“新建”命令,新建一个Analysis Services 项目。在“名称”文本框中将新项目命名为Analysis Services chf,单击“确定”按钮。

(2)创建数据源Chenhongfei

在右侧解决方案资源管理器中,右键单击“数据源”项,从弹出的快捷菜单中选择“新建数据源”命令。系统将打开数据源向导。单击“新建”按钮,向Adventure Works数据库添加连接。系统将打开“连接管理器”对话框,连接到数据库chenhongfei,单击“确定”按钮。单击“下一步”按钮进入“模拟信息”页,选择“默认值”。

(3)创建数据源视图Chenhongfei 1

在解决方案资源管理器中,右键单击“数据源视图”,从弹出的快捷菜单中选择“新建数据源视图”命令,系统将打开数据源视图向导。在“欢迎使用数据源视图向导”页上,单击“下一步”按钮。选择dbo.cc2视图,然后右击,将它包括在新数据源视图中,如下图所示:

(4)创建挖掘结构Cc2

在解决方案资源管理器中,右键单击“挖掘结构”,在弹出的快捷菜单中选择“新建挖掘结构”命令,系统将打开数据挖掘向导。在“欢迎使用数据向导”页上,单击“下一步”按钮。在“选择定义方法”页上,确认已选中“从现有关系数据库或数据仓库”,单击“下一步”按钮。在“选择数据挖掘技术”页的“你要使用何种数据挖掘技术?”下拉列表中选择“Microsoft聚类分析”选项,单击“下一步”按钮,在随后出现的“选择数据源视图”页上,请注意已默认选中Chenhongfei 1。单击“选择数据源视图”页上的“下一步”按钮,在“指定表类型”页上,选择cc2表右边“事例”列中的复选框,单击“下一步”按钮。随后出现“指定定型数据”页。然后单击列0的右边“键”列中的复选框。并且其他的选中相应的“输入”复选框。如下图所示

接着如下图所示设置挖掘结构的相关参数,在“挖掘模型”

选项卡上单击鼠标右键,从弹出的快捷菜单中选择“设置算法参数”命令,系统将打开“算法参数”对话框,如下图所示:

选择“挖掘模型查看器”选项卡,程序问是否建立部署项目,选择“是”。在接下来的“处理挖掘模型”页上,单击“运行”按钮,出现“处理进度”页,处理进度完成之后,单击“关闭”按钮,建模完成。最后选择“挖掘模型查看器”选项卡,由cc2数据集得到的聚类分析结果,如下图所示:

3. 对mfeat-kar数据集进行测算 (1) 创建Analysis Services chf项目

打开Business Intelligence Development Studio,选择“文件”—“新建”命令,新建一个Analysis Services 项目。在“名称”文本框中将新项目命名为Analysis Services chf,单击“确定”按钮。

(2)创建数据源Chenhongfei

在右侧解决方案资源管理器中,右键单击“数据源”项,从弹出的快捷菜单中选择“新建数据源”命令。系统将打开数据源向导。单击“新建”按钮,向Adventure Works数据库添加连接。系统将打开“连接管理器”对话框,连接到数据库chenhongfei,单击“确定”按钮。单击“下一步”按钮进入“模拟信息”页,选择“默认值”。

(3)创建数据源视图Chenhongfei 2

在解决方案资源管理器中,右键单击“数据源视图”,从弹出的快捷菜单中选择“新建数据源视图”命令,系统将打开数据源视图向导。在“欢迎使用数据源视图向导”页上,单击“下一步”按钮。选择dbo.cc3视图,然后右击,将它包括在新数据源视图中,如下图所示:

(4)创建挖掘结构Cc3

在解决方案资源管理器中,右键单击“挖掘结构”,在弹出的快捷菜单中选择“新建挖掘结构”命令,系统将打开数据挖掘向导。在“欢迎使用数据向导”页上,单击“下一步”按钮。在“选择定义方法”页上,确认已选中“从现有关系数据库或数据仓库”,单击“下一步”按钮。在“选择数据挖掘技术”页的“你要使用何种数据挖掘技术?”下拉列表中选择“Microsoft聚类分析”选项,单击“下一步”按钮,在随后出现的“选择数据源视图”页上,请注意已默认选中Chenhongfei 2。单击“选择数据源视图”页上的“下一步”按钮,在“指定表类型”页上,

选择cc3表右边“事例”列中的复选框,单击“下一步”按钮。随后出现“指定定型数据”页。然后单击列0的右边“键”列中的复选框。并且其他的选中相应的“输入”复选框。如下图所示

接着如下图所示设置挖掘结构的相关参数,在“挖掘模型”

选项卡上单击鼠标右键,从弹出的快捷菜单中选择“设置算法参数”命令,系统将打开“算法参数”对话框,选择“挖掘模型查看器”选项卡,程序问是否建立部署项目,选择“是”。在接下来的“处理挖掘模型”页上,单击“运行”按钮,出现“处理进度”页,处理进度完成之后,单击“关闭”按钮,建模完成。最

后选择“挖掘模型查看器”选项卡,由cc3数据集得到的聚类分析结果,如下图所示:

4.对mfeat-mor数据集进行测算 (1) 创建Analysis Services chf项目

打开Business Intelligence Development Studio,选择“文件”—“新建”命令,新建一个Analysis Services 项目。在“名称”文本框中将新项目命名为Analysis Services chf,单击“确定”按钮。

(2)创建数据源Chenhongfei

在右侧解决方案资源管理器中,右键单击“数据源”项,从弹出的快捷菜单中选择“新建数据源”命令。系统将打开数据源向导。单击“新建”按钮,向Adventure Works数据库添加连接。系统将打开“连接管理器”对话框,连接到数据库chenhongfei,单击“确定”按钮。单击“下一步”按钮进入“模拟信息”页,

选择“默认值”。

(3)创建数据源视图Chenhongfei 3

在解决方案资源管理器中,右键单击“数据源视图”,从弹出的快捷菜单中选择“新建数据源视图”命令,系统将打开数据源视图向导。在“欢迎使用数据源视图向导”页上,单击“下一步”按钮。选择dbo.cc4视图,然后右击,将它包括在新数据源视图中,如下图所示:

(4)创建挖掘结构Cc4

在解决方案资源管理器中,右键单击“挖掘结构”,在弹出的快捷菜单中选择“新建挖掘结构”命令,系统将打开数据挖

掘向导。在“欢迎使用数据向导”页上,单击“下一步”按钮。在“选择定义方法”页上,确认已选中“从现有关系数据库或数据仓库”,单击“下一步”按钮。在“选择数据挖掘技术”页的“你要使用何种数据挖掘技术?”下拉列表中选择“Microsoft聚类分析”选项,单击“下一步”按钮,在随后出现的“选择数据源视图”页上,请注意已默认选中Chenhongfei 3。单击“选择数据源视图”页上的“下一步”按钮,在“指定表类型”页上,选择cc4表右边“事例”列中的复选框,单击“下一步”按钮。随后出现“指定定型数据”页。然后单击列0的右边“键”列中的复选框。并且其他的选中相应的“输入”复选框。如下图所示

接着如下图所示设置挖掘结构的相关参数,在“挖掘模型”选

项卡上单击鼠标右键,从弹出的快捷菜单中选择“设置算法参数”命令,系统将打开“算法参数”对话框,选择“挖掘模型查看器”选项卡,程序问是否建立部署项目,选择“是”。在接下来的“处理挖掘模型”页上,单击“运行”按钮,出现“处理进度”页,处理进度完成之后,单击“关闭”按钮,建模完成。最后选择“挖掘模型查看器”选项卡,由cc4数据集得到的聚类分析结果,如下图所示:

5.对mfeat-pix数据集进行测算 (1) 创建Analysis Services chf项目

打开Business Intelligence Development Studio,选择“文件”—“新建”命令,新建一个Analysis Services 项目。在“名称”文本框中将新项目命名为Analysis Services chf,单击“确定”按钮。

(2)创建数据源Chenhongfei

在右侧解决方案资源管理器中,右键单击“数据源”项,从弹出的快捷菜单中选择“新建数据源”命令。系统将打开数据源向导。单击“新建”按钮,向Adventure Works数据库添加连接。系统将打开“连接管理器”对话框,连接到数据库chenhongfei,单击“确定”按钮。单击“下一步”按钮进入“模拟信息”页,选择“默认值”。

(3)创建数据源视图Chenhongfei 4

在解决方案资源管理器中,右键单击“数据源视图”,从弹出的快捷菜单中选择“新建数据源视图”命令,系统将打开数据源视图向导。在“欢迎使用数据源视图向导”页上,单击“下一步”按钮。选择dbo.cc5视图,然后右击,将它包括在新数据源视图中,如下图所示:

析结果,如下图所示:

二、对50不同性别的人的身高、体重、腰围进行统计,然后用聚类分析测算数据集

(1) 创建Analysis Services chf项目

打开Business Intelligence Development Studio,选择“文件”—“新建”命令,新建一个Analysis Services 项目。在“名称”文本框中将新项目命名为Analysis Services chf,单击“确定”按钮。

(2)创建数据源Chenhongfei

在右侧解决方案资源管理器中,右键单击“数据源”项,从弹出的快捷菜单中选择“新建数据源”命令。系统将打开数据源向导。单击“新建”按钮,向Adventure Works数据库添加连接。系统将打开“连接管理器”对话框,连接到数据库chenhongfei,单击“确定”按钮。单击“下一步”按钮进入“模拟信息”页,选择“默认值”。

(3)创建数据源视图Chenhongfei 6

在解决方案资源管理器中,右键单击“数据源视图”,从弹出的快捷菜单中选择“新建数据源视图”命令,系统将打开数据源视图向导。在“欢迎使用数据源视图向导”页上,单击“下一步”按钮。选择dbo.people视图,然后右击,将它包括在新数据源视图中,如下图所示:

(5)创建挖掘结构People

在解决方案资源管理器中,右键单击“挖掘结构”,在弹出的快捷菜单中选择“新建挖掘结构”命令,系统将打开数据挖掘向导。在“欢迎使用数据向导”页上,单击“下一步”按钮。在“选择定义方法”页上,确认已选中“从现有关系数据库或数据仓库”,单击“下一步”按钮。在“选择数据挖掘技术”页的“你要使用何种数据挖掘技术?”下拉列表中选择“Microsoft聚类分析”选项,单击“下一步”按钮,在随后出现的“选择数据源视图”页上,请注意已默认选中Chenhongfei 6。单击“选择数据源视图”页上的“下一步”按钮,在“指定表类型”页上,选择people表右边“事例”列中的复选框,单击“下一步”按钮。随后出现“指定定型数据”页。然后单击列0的右边“键”列中的复选框。并且其他的选中相应的“输入”复选框。如下图

所示

接着如下图所示设置挖掘结构的相关参数,在“挖掘模型”选项卡上单击鼠标右键,从弹出的快捷菜单中选择“设置算法参数”命令,系统将打开“算法参数”对话框,将第一行的值设置为2。

选择“挖掘模型查看器”选项卡,程序问是否建立部署项目,选择“是”。在接下来的“处理挖掘模型”页上,单击“运行”按钮,出现“处理进度”页,处理进度完成之后,单击“关

闭”按钮,建模完成。最后选择“挖掘模型查看器”选项卡,由cc6数据集得到的聚类分

三、从一个3输入、2输出的系统中获得了10条历史数据,如下表所示。另外,最后2条数据是系统的输入,不知道其对应的输出。请使用SQL Server 2005 的神经网络功能预测最后两条数据的输出。

本文来源:https://www.bwwdw.com/article/uid2.html

Top