数据挖掘与R语言

出版社:机械工业出版社
出版日期:2013-4
ISBN:9787111407003
作者:(葡)Luis Torgo
页数:216页

作者简介

“如果你想学习如何用一款统计专家和数据挖掘专家所开发的免费软件包,那就选这本书吧。本书包括大量实际案例,它们充分体现了R软件的广度和深度。”
—— Bernhard Pfahringer, 新西兰怀卡托大学
本书利用大量给出必要步骤、代码和数据的具体案例,详细描述了数据挖掘的主要过程和技术,广泛涵盖数据大小、数据类型、分析目标、分析工具等方面的各种具有挑战性的问题。
本书的支持网站(http://www.liaad.up.pt/~ltorgo/DataMiningWithR/)给出了案例研究的所有代码、数据集以及R函数包。
本书特色
通过仔细选择的案例涵盖了主要的数据挖掘技术。
给出的代码和方法可以方便地复制或者改编后应用于自己的问题。
不要求读者具有R、数据挖掘或统计技术的基础知识。
包含R和MySQL基础知识的简介。
提供了对数据挖掘技术的特性、缺点和分析目标的基本理解。

书籍目录

出版者的话
推荐序
中文版序
译者序
前言
致谢
第1章简介
1.1如何阅读本书
1.2R简介
1.2.1R起步
1.2.2R对象
1.2.3向量
1.2.4向量化
1.2.5因子
1.2.6生成序列
1.2.7数据子集
1.2.8矩阵和数组
1.2.9列表
1.2.10数据框
1.2.11构建新函数
1.2.12对象、类和方法
1.2.13管理R会话
1.3MySQL简介
第2章预测海藻数量
2.1问题描述与目标
2.2数据说明
2.3数据加载到R
2.4数据可视化和摘要
2.5数据缺失
2.5.1将缺失部分剔除
2.5.2用最高频率值来填补缺失值
2.5.3通过变量的相关关系来填补缺失值
2.5.4通过探索案例之间的相似性来填补缺失值
2.6获取预测模型
2.6.1多元线性回归
2.6.2回归树
2.7模型的评价和选择
2.8预测7类海藻的频率
2.9小结
第3章预测股票市场收益
3.1问题描述与目标
3.2可用的数据
3.2.1在R中处理与时间有关的数据
3.2.2从CSV文件读取数据
3.2.3从网站上获取数据
3.2.4从MySQL数据库读取数据
3.3定义预测任务
3.3.1预测什么
3.3.2预测变量是什么
3.3.3预测任务
3.3.4模型评价准则
3.4预测模型
3.4.1如何应用训练集数据来建模
3.4.2建模工具
3.5从预测到实践
3.5.1如何应用预测模型
3.5.2与交易相关的评价准则
3.5.3模型集成:仿真交易
3.6模型评价和选择
3.6.1蒙特卡罗估计
3.6.2实验比较
3.6.3结果分析
3.7交易系统
3.7.1评估最终测试数据
3.7.2在线交易系统
3.8小结
第4章侦测欺诈交易
4.1问题描述与目标
4.2可用的数据
4.2.1加载数据至R
4.2.2探索数据集
4.2.3数据问题
4.3定义数据挖掘任务
4.3.1问题的不同解决方法
4.3.2评价准则
4.3.3实验方法
4.4计算离群值的排序
4.4.1无监督方法
4.4.2有监督方法
4.4.3半监督方法
4.5小结
第5章微阵列样本分类
5.1问题描述与目标
5.1.1微阵列实验背景简介
5.1.2数据集ALL
5.2可用的数据
5.3基因(特征)选择
5.3.1基于分布特征的简单过滤方法
5.3.2ANOVA过滤
5.3.3用随机森林进行过滤
5.3.4用特征聚类的组合进行过滤
5.4遗传学异常的预测
5.4.1定义预测任务
5.4.2模型评价标准
5.4.3实验过程
5.4.4建模技术
5.4.5模型比较
5.5小结
参考文献
主题索引
数据挖掘术语索引
R函数索引

内容概要

Luís Torgo
葡萄牙波尔图大学计算机科学系副教授,现在在LIAAD实验室从事研究工作。他是APPIA会员,同时还是OBEGEF的创办会员。


 数据挖掘与R语言下载 精选章节试读 更多精彩书评



发布书评

 
 


精彩书评 (总计2条)

  •     数据挖掘入门到精通—R语言视频教程课程观看地址:http://www.xuetuwuyou.com/course/59课程介绍一、课程所用软件:R 3.2.2(64位) RStudio二、课程涉及到的技术点:1)R语言的基本语法、函数2)R中实用性很强的包3)模式识别、分类预测算法原理及其实现三、课程学习目标:本课程讲解理论的同时结合大量的案例,让学习者可以快速掌握数据挖掘技能,并利用R数据处理、画图、实现据挖掘模型的建立。学习完本课程,学习者能达到以下目标:1)掌握基本R用法;2)用R进行描述性统计分析、进行数据处理和数据可视化;3)缺失值的清洗能力;4)用R语言建立数据挖掘模型;四、课程大纲:第一章:基本概念介绍第1课、数据挖掘、R语言概念介绍第2课、软件安装和数据的读、写、修改 第3课、基本概念讲解(向量、矩阵、因子、数据框、列表) 第4课、基本图形的讲解和绘制 第二章:实用软件包介绍及应用第5课、plyr包主函数讲解第6课、plyr包辅助函数讲解第7课、Ggpolt2介绍 第8课、Ggpolt2实践第9课、reshape2包的讲解和实际操作 第10课、课缺失值的处理 第三章:算法讲解及应用第11课、knn原理简介 第12课、knn算法实际操作 第13课、决策树的理论讲解 第14课、决策树实操 第15课、人工神经网络的介绍1 第16课、人工神经网络介绍2 第17课、人工神经网络实操1 第18课、人工神经网络实操2 第19课、支持向量机原理介绍第20课、支持向量机的实操
  •     本书虽然很薄,却无疑是一本需要仔细琢磨的书。书中使用四个例子来完成对对数据挖掘这一类工作所涉及到的各个方面。四个例子按照由浅入深的顺序排列,并且每个例子的侧重点均不相同。所以在前言中有提到,如果读者是新人,那么就从头到尾的读,如果读者已经对各类概念有所了解,那么可以从不同的例子中找到自己关心的知识点进行阅读。书里面没有涉及大量的数学概念,均是很好理解的一些基本常识。所以数学不好的读者基本上可以读得下去。略有不足:* 书中大量使用了作者提供的程序包。这让本书中使用的方法很难直接应用到实际工作中。而且因为篇幅有限,又没有对作者使用的程序包的实现进行讲解,所以本书只限于对知识领域的学习和了解,而无法作为一本可以直接“复制黏贴的代码参考书”。

精彩短评 (总计33条)

  •     看了第一章……还是放柜子里堆灰吧……
  •     作为基础进阶相当合适。
  •     本书相当适于实践。翻译的不错,就是印刷有点一般。
  •     一开始直接看例子,昨天又翻出来把R简介那章看了看,又有了一点新的收获
  •     看到各种没用过的函数和包,但例子太简单了
  •     //Data Mining with R中文版//某些翻译有问题
  •     过于简单,重点是用r建的模型的完整性
  •     主要是举例子,分几个章节,讲的比较详细。
  •     妈的,这本破书太水了,目测 R in a Nutshell 才是经典。
  •     坑很多,不适合R初学者,掌握基本的R操作和数据挖掘算法后再来读还可以。
  •     只有区区几个project…要不就是简单的OLS要不就是看得醉人的option…太水
  •     嗯学一下思路就好( ̄◇ ̄;)function什么的还是直接参考R网站比较靠谱儿……
  •     清洗数据,探索性分析。
  •     没有想象得那么好,讲了很多基础的技巧
  •     相当一般,从数据挖掘的角度。买这本书的唯一收获是如何使用r语言来进行数据挖掘。
  •     书质量很好,值得耐心的读下去
  •     不错的案例书,函数式编程就是美
  •     这本书翻译得不是很好,讲得也不是很清楚。
  •     怎么说呢,基于case的学习方式右自己的缺点,但是清晰和可操作性弥补了这些不足。这本书最好动手玩一玩代码,挺好的。
  •     入门级吧,举了几个实际例子,还凑合吧 想学R和数据挖掘,还得多看看其他教材
  •     适合中级学者,书中有很多有意义的案例,更有意思的是介绍了R软件和MySQL对接批量处理数据。
  •     先上四星 其实只是对里面的实例挺感兴趣的 ..
  •     比起其他的R的教程 这个可用度还蛮高的
  •     量化交易未来趋势
  •     翻译的不太好
  •     没读完
  •     仅限思考原理,参考实现思路。
  •     内容不是很多,就四个小型案例,不过数据分析的很细致~
  •     在書店翻了,這書篇幅雖不多,但幾個主題都寫得蠻詳細。
  •     通过案例讲解R语言,实用。
  •     案例详细
  •     翻译差,其实书挺好的
  •     经典!要用6个月研读清楚。
 

农业基础科学,时尚,美术/书法,绘画,软件工程/开发项目管理,研究生/本专科,爱情/情感,动漫学堂PDF下载,。 PDF下载网 

PDF下载网 @ 2024