UCI数据集
“UCI数据集”相关的资料有哪些?“UCI数据集”相关的范文有哪些?怎么写?下面是小编为您精心整理的“UCI数据集”相关范文大全或资料大全,欢迎大家分享。
uci数据集大致情况翻译
来源:http://archive.ics.uci.edu/ml/datasets.html?format=&task=&att=&area=&numAtt=&numIns=&type=&sort=nameUp&view=list
Table View List View 206 Data Sets
1. Abalone: Predict the age of abalone from physical measurements 鲍鱼DataSet:根据物理度量,预测鲍鱼的年龄。
2. Abscisic Acid Signaling Network: The objective is to determine the set of
boolean rules that describe the interactions of the nodes within this plant
signaling network. The dataset includes 300 separate boolean pseudodynamic simulations using an asynchronous update scheme.
目标是测定
uci数据集大致情况翻译
来源:http://archive.ics.uci.edu/ml/datasets.html?format=&task=&att=&area=&numAtt=&numIns=&type=&sort=nameUp&view=list
Table View List View 206 Data Sets
1. Abalone: Predict the age of abalone from physical measurements 鲍鱼DataSet:根据物理度量,预测鲍鱼的年龄。
2. Abscisic Acid Signaling Network: The objective is to determine the set of
boolean rules that describe the interactions of the nodes within this plant
signaling network. The dataset includes 300 separate boolean pseudodynamic simulations using an asynchronous update scheme.
目标是测定
《UCI数据集和源代码》
《UCI数据集和源代码》
UCI数据集是一个常用的标准测试数据集,下载地址在 http://www.ics.uci.edu/~mlearn/MLRepository.html 我的主页上也有整理好的一些UCI数据集(arff格式): http://lamda.nju.edu.cn/yuy/files/download/UCI_arff.zip
在看别人的论文时,别人使用的数据集会给出数据集的出处或下载地址(除非是很机密的数据,例如与国家安全有关)。如果你看的论文没有给出数据集的出处,请立即停止看这篇论文,并且停止看刊发这篇论文的期刊上的所有文章。因为可以断定这些文章质量很差。
关于源代码,网上有很多公开源码的算法包,例如最为著名的Weka,MLC++等。Weka还在不断的更新其算法,下载地址:
http://www.cs.waikato.ac.nz/ml/weka/
很多的机器学习的经典算法都在里面。而且公布源程序,易于修改。
如果作者没有公布源程序,可以到作者主页找找,也可以写信给作者要,一般论文开头都会有作者的email地址。写信的时候要注意要很有礼貌,否则作者,尤其是著名学者,很有可能不会理睬。如果算法简单,可以自己实现。
关于论文的下
uci数据集大致情况翻译
来源:http://archive.ics.uci.edu/ml/datasets.html?format=&task=&att=&area=&numAtt=&numIns=&type=&sort=nameUp&view=list
Table View List View 206 Data Sets
1. Abalone: Predict the age of abalone from physical measurements 鲍鱼DataSet:根据物理度量,预测鲍鱼的年龄。
2. Abscisic Acid Signaling Network: The objective is to determine the set of
boolean rules that describe the interactions of the nodes within this plant
signaling network. The dataset includes 300 separate boolean pseudodynamic simulations using an asynchronous update scheme.
目标是测定
r语言uci乳房肿块数据分析挖掘报告
一. 收集数据
数据由UCI机器学习数据仓库的一个数据集得到,数据集名称为“Breast Cancer Wisconsin (Diagnostic) Data Set ”,包括乳房肿块镇抽吸活检图像的数字化的多项测度值,这些值代表出现在数字化图像中的细胞核的特征。
乳腺癌数据包括569例细胞活检案例,每个案例有32个特征。一个特征是识别号码,一个特征是癌症诊断结果,其他30个特征是数值型的实验室测量结果。
癌症诊断结果用编码“M”表示恶性,用编码“B”表示良性。
30个数值型测量结果由数字化细胞核的10个不同特征的均值、标准差、最大值构成,这10个特征包括:
a) radius (mean of distances from center to points on the perimeter) b) texture (standard deviation of gray-scale values) c) perimeter d) area
e) smoothness (local variation in radius lengths) f) compactness (perimeter^2 / area - 1.0)
g) co
WEKA对UCI乳腺癌数据数据挖掘实验报告(附代码数据)
【原创】WEKA对UCI乳腺癌数据数据挖掘实
验报告(附代码数据)
【原创】 定制撰写数据分析可视化项目案例调研报告 有问题到淘宝找“大数据部落”就可以了
WEKA 对wisconsin-breast-cancer数据挖掘分析报告 一、 数据集
实验采用UCI数据集中的Wisconsin医学院的William 博士提供的乳腺癌的数据样本。所有数据来自真实临床案例,每个案例有10个属性。其中前九个属性是检测指标,每个属性值用1到10的整数表示,1表示检测指标最正常,10表示最不正常。第十个属性是分类属性,指示该肿瘤是否为恶性。数据集中的肿瘤性质是通过活检得出的结果。 肿块厚度 Clump_Thickness integer [1,10] 细胞大小的均匀性 Cell_Size_Uniformity integer [1,10] 细胞形状的均匀性 Cell_Shape_Uniformity integer [1,10] 边缘粘性 Marginal_Adhesion integer [1,10] 单上皮细胞的大小 Single_Epi_Cell_Size integer [1,10] 裸核 Bare_Nuclei i
汽车数据集(cars dataset)_数据挖掘_科研数据集
This was the 1983 ASA Data Exposition dataset. The dataset was collected by Ernesto Ramos and David Donoho and dealt with automobiles. Data on mpg, cylinders, displacement, etc. (8 variables) for 406 different cars. The dataset includes the names of the cars.
汽车数据集(cars dataset)
数据摘要:
This was the 1983 ASA Data Exposition dataset. The dataset was collected by Ernesto Ramos and David Donoho and dealt with
automobiles. Data on mpg, cylinders, displacement, etc. (8 variables) for 406 different cars. The dataset includes the names
中国地区SRTM数据集
中国地区SRTM数据集 简介
SRTM(Shuttle Radar Topography Mission),即航天飞机雷达地形测图任务,美国太空总署(NASA)和国防部国家测绘局(NIMA)以及德国与意大利航天机构共同合作完成联合测量,由美国发射的“奋进”号航天飞机上搭载SRTM系统完成。本次测图任务从2000年2月11日开始至22日结束,共进行了11天总计222小时23分钟的数据采集工作,获取北纬60度至南纬56度之间总面积超过1.19亿平方公里的雷达影像数据,覆盖地球80%以上的陆地表面。
SRTM系统获取的雷达影像的数据量约9.8万亿字节,经过两年多的数据处理,制成了数字地形高程模型(DEM)。SRTM产品2003年开始公开发布,经历多修订,目前最新的版本为V4.1版本。
数据覆盖范围
SRTM的覆盖范围从南纬56°到北纬60°范围,约占全球面积的80%(119.56 M km2),覆盖范围见图1,在覆盖区内有99.968%的区域获得了数据,约50,000 km2的区域数据缺失(都位于美国境内)。在覆盖区内大部分区域都有重复覆盖,具体数值见表1. 表1 SRTM数据覆盖范围 比例 99.968% 94.59% 49.25%
多维数据集培训教程
多
维
数
据
集
培
训
教
程
吴思远编2015年12月
安装Analysis Services多维建模教程示例数据和项目可使用本主题中提供的说明和链接来安装Analysis Services 教程中使用的所有数据和项目文件。
步骤1:安装SQL Server 软件
本教程中的课程假定您已安装以下软件。所有以下软件都使用SQL Server 安装介质进行安装。为了简化部署,您可以在一台计算机上安装所有功能。若要安装这些功能,请运行SQL Server 安装程序并从“功能选择”页中选择它们。
?数据库引擎
?Analysis Services
Analysis Services 仅在以下版本中提供:Evaluation、Enterprise、Business
Intelligence、Standard。
请注意,SQL Server Express 版本不包括Analysis Services。。
默认情况下,Analysis Services 将作为多维实例安装,您可以通过在安装向导的“服
务器配置”页中选择“表格服务器模式”来覆盖此实例。如果要同时运行两种服务器模式,请在同一台计算机上重新运行SQL Server 安装程序,以在另一模式中再安装一个Analysis Serv
数据挖掘试卷 题集
数据挖掘复习题集
1. 名词解释及简答 数据矩阵 闭频繁项集, 极大频繁项集 四分位数极差 聚类分析
聚类算法DBSCAN中的密度可达与密度相连
简述数据清理的任务
简述k-means聚类与k-中心点聚类的相似与不同之处
2. 填空题
(1) 计算sin(45o)的Matlab命令是 (2) 假设x=10,计算
?2ex?0.5?1的Matlab命令是
?(3) Matlab中清除显示内容的命令是 (4) Matlab中清除变量y的命令是
(5) Matlab中有矩阵a=[1 2 3; 4 5 6; 7 8 9],执行a(2,:)=[]后,a的值为 。 (6) Matlab中绘制曲线的基本命令是 。
(7) 数据质量涉及许多因素,包括 , , ,时效性,可信性和可解释性。 (8) 属性的类型由该属性可能具有的值的集合决定,属性类型包括 , ,序数
的或数值的。
(9) KDD 过程包括: , 数据集成, 数据选择, 数据变换, 数据挖掘, 模式评估,
和 。
(10) 一个模式是有趣的,如果它是 , 在某种程度上在新