三九宝宝网宝宝百科宝宝知识

什么叫做数据挖掘

03月05日 编辑 39baobao.com

[什么叫做年金 ?]年金,就是一系列在相等时间间隔上进行支付的款项。现实生活中,年金运用广泛,典型地,比如零存整取的银行存款/住房按揭的分期摊还/消费信贷的分期付款以及保险领域中的养老金给付...+阅读

数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。 并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,则是信息检索(information retrieval)领域的任务。虽然这些任务是重要的,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此,数据挖掘技术也已用来增强信息检索系统的能力。

数据挖掘是做什么的

数据挖掘(Data Mining)的定义是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。

数据挖掘能做以下七种不同事情:

· 分类 (Classification)

· 估计(Estimation)

· 预测(Prediction)

· 相关性分组或关联规则(Affinity grouping or association rules)

· 聚类(Clustering)

· 描述和可视化(Description and Visualization)

· 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)

什么是数据挖掘简述其作用和应用

数据挖掘(Data Mining),就是从存放在数据库,数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。 1)数据挖掘能做以下七种不同事情(分析方法): 数据挖掘· 分类 (Classification) · 估值(Estimation) · 预言(Prediction) · 相关性分组或关联规则(Affinity grouping or association rules) · 聚集(Clustering) · 描述和可视化(Description and Visualization) · 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等) 2)数据挖掘分类 以上七种数据挖掘的分析方法可以分为两类:直接数据挖掘;间接数据挖掘 · 直接数据挖掘 目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以理解成数据库中表的属性,即列)进行描述。

· 间接数据挖掘 目标中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种关系 。 · 分类、估值、预言属于直接数据挖掘;后三种属于间接数据挖掘 3)各种分析方法的简介 · 分类 (Classification) 首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。 例子: a. 信用卡申请者,分类为低、中、高风险 b. 故障诊断:中国宝钢集团与上海天律信息技术有限公司合作,采用数据挖掘技术对钢材生产的全流程进行质量监控和分析,构建故障地图,实时分析产品出现瑕疵的原因,有效提高了产品的优良率。 注意: 类的个数是确定的,预先定义好的 · 估值(Estimation) 估值与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出;分类 数据挖掘的类别是确定数目的,估值的量是不确定的。

例子: a. 根据购买模式,估计一个家庭的孩子个数 b. 根据购买模式,估计一个家庭的收入 c. 估计real estate的价值 一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的连续变量的值,然后,根据预先设定的阈值,进行分类。例如:银行对家庭贷款业务,运用估值,给各个客户记分(Score 0~1)。然后,根据阈值,将贷款级别分类。 · 预言(Prediction) 通常,预言是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用于对未知变量的预言。从这种意义上说,预言其实没有必要分为一个单独的类。预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道预言准确性是多少。 例子: 海南航空引入领先的数据挖掘工具马克威分析系统,分析客流、燃油等变化趋势,以航线收益为主题进行数据挖掘,制定精细的销售策略,有效提高了企业收益。

· 相关性分组或关联规则(Affinity grouping or association rules) 决定哪些事情将一起发生。 例子: a. 超市中客户在购买A的同时,经常会购买B,即A =>B(关联规则) b. 客户在购买A后,隔一段时间,会购买B (序列分析) · 聚集(Clustering) 聚集是对记录分组,把相似的记录在一个聚集里。聚集和分类的区别是聚集不依赖于预先定义好的类,不需要训练集。 例子: a. 一些特定症状的聚集可能预示了一个特定的疾病 b. 租VCD类型不相似的客户聚集,可能暗示成员属于不同的亚文化群 聚集通常作为数据挖掘的第一步。例如,"哪一种类的促销对客户响应最好?",对于这一 类问题,首先对整个客户做聚集,将客户分组在各自的聚集里,然后对每个不同的聚集,回答问题,可能效果更好。

c. 中国移动采用先进的数据挖掘工具马克威分析系统,对用户wap上网的行为进行聚类分析,通过客户分群,进行精确营销。 · 描述和可视化(Des cription and Visualization) 来源:网界网论坛 是对数据挖掘结果的表示方式。

以下为关联文档:

什么叫做耻骨分离有什么表现怎么解决什么叫做耻骨分离有什么表现怎1、什么叫做耻骨分离 正常的耻骨(就是大腿中间的骨头),是靠耻骨韧带连接在一起的,所以叫做耻骨联合。 怀孕后,由于孕激素的作用,耻骨韧带会松弛,耻骨之间距离会增大,可达到9mm左右。...

什么叫做入侵检测?什么叫做入侵检测中文名入侵检测外文名IntrusionDetection特点入侵检测是防火墙的合理补充违反安全策略的行为1基本简介2分类情况异常检测3入侵分类2)基于网络AlertsApplianceAttacksCERTCIRT...

什么叫做通告?通告的含义 通告是行政机关和企事业单位在一定范围内公布应当遵守或周知的事项时使用的公文。 通告的特点 通告除具有公开性和告知性特点外,还具有如下特点: 1.强制性。通告公...

什么叫做营销1、从概念上讲 营销是一种现代经营思想,其核心是以消费者需求为导向,消费者或客户需求什么就生产销售什么。这是一种由外向内的思维方式。 销售主要是以固有产品或服务来吸引...

什么叫做生活?生活,这是人们常挂在嘴边的一个名词。可是,究竟什么才是生活呢?恐怕没有多少人能一下概括出来。近日的我郁闷到慌,思索了“生活”许多,终于理出了一点儿头绪。当然,也不知对与否,管...

什么叫做空间?空间主要可以分物理空间和心理空间两种 恋人之间要是谈论空间通常指的是心理空间 具体主要体现在,简单举例和你分享一下: 空间1“独处”——对方需要偶尔的独处一下(也有人认为...

请问什么叫做法先王?什么叫做法后王?它们之间的主要区别是什么在一个时期内,有人认为,孟轲主张“法先王”,荀况主张“法后王”,这是二人之间的一个主要的不同。这个说法是不对的。 荀况对于齐国和秦国的霸业的评价,可以帮助我们理解他所讲的...

什么叫做太岁中国人一般都知道“谁敢在太岁头上动土”这句话,但却很少有人知道“太岁”是何物。“太岁”到底是什么东西?据专家介绍,太岁是一种黏菌,是介于生物和真菌之间的一种原质体生物,既...

清代叫做都铺的现在叫做什么清代叫做都铺的现在叫做什么,古代胡麻现在叫什么:哇塞,能提这样的问题。清代县一下行政单位是门学问。 县城为一级单位。下属东南西北四城,称为隅、或称坊.城外靠近东南西北四城...

推荐阅读
图文推荐