文章列表
 
您正在查看 "数据挖掘(bi)" 分类下的文章

2009-12-02 17:03

WEKA( developed at the University of Waikato in New Zealand 新西兰怀卡托大学)http://www.cs.waikato.ac.nz/~ml/weka/index.html

与此开源项目对应的书为《Data Mining Practical Machine Learning Tools and Techniques Second Edition 》,该书下载地址http://www.itpub.net/showthread.php?s=&threadid=731436,另外本书已有中文版《数据挖掘,实用

 
2009-08-12 10:26
logistic回归又称logistic回归分析,主要在流行病学中应用较多,比较常用的情形是探索某疾病的危险因素,根 据危险因素预测某疾病发生的概率,等等。例如,想探讨胃癌发生的危险因素,可以选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群肯定有不同的体征和 生活方式等。这里的因变量就是是否胃癌,即“是”或“否”,为两分类变量,自变量就可以包括很多了,例如年龄、性别、饮食习惯、幽门螺杆菌感染等。自变量 既可以是连续的,也可以是分类的。通过logistic回归分析,就可以大致了解到底
 
2009-07-13 17:23

developerWorks
 
2009-07-09 16:53
最近在学习Oracle的数据挖掘,发现网上这方面的资料很少,还是自己动手整理一下吧

Data Mining PL/SQL Packages

Oracle数据挖掘支持监督(supervised)和无人监督的数据挖掘。监督数据挖掘预测目标值根据历史数据。无监督数据挖掘发现未知领域或不确定目标。

用于监督的函数:
Classification
Regression
Attribute Importance

用于无人监督的函数:
Clustering
Association
Feature Extraction
Anomaly Detection (one-class classification)

有三种包
DBMS_DA

 
2009-07-09 16:43

    数据仓库,数据库或者其它信息库中隐藏着许多可以为商业、科研等活动的决策提供所需要的知识。分类与预测是两种数据分析形式,它们可以用来抽取能够描述重 要数据集合或预测未来数据趋势的模型。分类方法(Classification)用于预测数据对象的离散类别(Categorical Label);预测方法(Prediction )用于预测数据对象的连续取值。

分类技术在很多领域都有应用,例如可以通过客户分类构造一个分类模型来对银行贷款进行风险评估;当前的市场营销中很重要的一个特点是强调客户细分。 客户类别分析的功能

 
2009-07-09 16:43
1 数据挖掘概述

随着数据库技术的迅速发展,数据存量大量增加着,但是挖掘海量数据的背后隐藏着的知识的手段远远不足。从而导致了“数据爆炸但知识贫乏”的现象。计算机技 术的另一领域人工智能(Artificial Intelligence)自1956年诞生之后取得了重大进展。该领域目前的研究热点是机器学习——用计算机模拟人类学习的一门科学。

用数据库管理系统来存储数据,用机器学习的方法来分析数据,挖掘大量数据背后的知识,这两者的结合促成了数据挖掘的产生。实际上,数据挖掘是一门交叉学 科,涉及到机器

 
2009-05-04 15:31
999年我毕业于国内一个211大学正规本科,先后呆过几个大型的国内软件公司,一直做政府的项目, 10年来几乎用过所有的报表软件,可以说10年来报表软件领域的创新让我不得不佩服中国软件企业的创新和推广能力,让我对中国软件业的前途还是提起了不少的信心.

下面按照从使用的时间一一做点评(独家之言).
99年到02年那会,没有什么报表工具可以使用,java工具只有国外的StyleReport和JReport, 最老牌的水晶报表(CrytalReport)还没有java版本,我们当时的项目这几个工具基本都用过. 先点评者几个:

水晶报表(Cry
 
2009-04-29 17:12

什么是T检验

  T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。

 
2009-04-23 14:49
正交设计
无论是试制新产品、改造旧工艺或寻找合理的产品配方,都需要做试验。凡是做试验,就存在如何安排试验方案和如何分析试验结果的问题。试验安排得好,试验次 数少,周期也短,就能得到满意结果;安排不好,次数多,费工、费时、费料,结果还不一定满意。尤其在多因素多水平的试验中,如何把试验安排和数据处理两者 结合起来,一方面要使得试验次数少,还要得到能够反映
 
2009-04-22 14:06
http://zh.wikipedia.org/w/index.php?title=%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&variant=zh-cn

正态分布
normal distribution)又名高斯分布(Gaussian distribution),是一个在数学物理
 
 
   
 
 
文章分类
 
   
 
文章存档
 
     
 
最新文章评论
  

<strong><a href="http://xianrongtea.taobao.com/">tea</a></strong>
 

品茶,品茶农茶,自产自销,口味正宗,囡囡茶业。http://xianrongtea.taobao.com/
 

jQuery!
 

不错
 

谢谢分享,总算明白了。
   
帮助中心 | 空间客服 | 投诉中心 | 空间协议
©2012 Baidu