文章 2017-05-02 来自:开发者社区

《数据科学:R语言实战》一导读

前 言 数据科学:R语言实战R是为数据操作及统计计算提供语言及环境的软件包,同样也能够用图表表示产生的统计数据。 R具有以下特性: 语法简洁,可对数据执行操作; 附带的工具可通过本地和互联网以多种格式加载和存储数据; 语言一致,可对内存中的数据集进行操作; 具有用于数据分析的内置和开源工具; 采用生成实时图形和将图示存储到磁盘的方法。 目 录 第1章 模式的数据挖掘 1.1 聚类分析1....

文章 2017-05-02 来自:开发者社区

《数据科学:R语言实战》一2.3 总结

本节书摘来自异步社区《数据科学:R语言实战》一书中的第2章,第2.3节,作者 【美】Dan Toomey(丹·图米),更多章节内容可以访问云栖社区“异步社区”公众号查看 2.3 总结 本章,我们探讨了确定数据序列的不同模式。通过使用eclat函数查找数据集模式,以便寻找人口中的相似模式。使用TraMineR查找购物篮中的项目频集。使用apriori规则确定购物篮中的项目关联。使用TraMineR....

文章 2017-05-02 来自:开发者社区

《数据科学:R语言实战》一2.2 问题

本节书摘来自异步社区《数据科学:R语言实战》一书中的第2章,第2.2节,作者 【美】Dan Toomey(丹·图米),更多章节内容可以访问云栖社区“异步社区”公众号查看 2.2 问题 实际问题 怎样不将白种人计入eclat结果内? 描述序列图表中出现的不同转换期。 在TraMineRmvad数据摘要中,地区响应中有显著差异,您能猜出原因吗? 什么时候做、怎样做以及为什么这样做? 描述seq...

文章 2017-05-02 来自:开发者社区

《数据科学:R语言实战》一1.5 总结

本节书摘来自异步社区《数据科学:R语言实战》一书中的第1章,第1.5节,作者 【美】Dan Toomey(丹·图米),更多章节内容可以访问云栖社区“异步社区”公众号查看 1.5 总结 本章探讨了聚类分析、异常检测及关联规则。“聚类分析”部分使用了K-means聚类、K-medoids聚类、分层聚类、期望最大化及密度估计。“异常检测”部分通过使用内置R函数发现了异常值,并开发出自己的专用R函数。“....

文章 2017-05-02 来自:开发者社区

《数据科学:R语言实战》一1.4 问题

本节书摘来自异步社区《数据科学:R语言实战》一书中的第1章,第1.4节,作者 【美】Dan Toomey(丹·图米),更多章节内容可以访问云栖社区“异步社区”公众号查看 1.4 问题 实际问题 如何决定是否使用K-means或K-medoids? 设计箱线图的意义是什么?为什么那样设计? 对于密度图,请描述生成于iris数据异常值中的底层数据。 对于市场数据集中的其他项目,有哪些抽取规则? ...

文章 2017-05-02 来自:开发者社区

《数据科学:R语言实战》一1.3 关联规则

本节书摘来自异步社区《数据科学:R语言实战》一书中的第1章,第1.3节,作者 【美】Dan Toomey(丹·图米),更多章节内容可以访问云栖社区“异步社区”公众号查看 1.3 关联规则 关联规则说明了两个数据集之间的关联。此规则常用于购物篮分析。一组事务中的每个事务(购物袋)可能包含多个不同项目,那么如何能够让产品销售有关联呢?常见关联如下所示。 支持度:这是事务同时包含A和B的百分比。 置.....

文章 2017-05-02 来自:开发者社区

《数据科学:R语言实战》一1.2 异常检测

本节书摘来自异步社区《数据科学:R语言实战》一书中的第1章,第1.2节,作者 【美】Dan Toomey(丹·图米),更多章节内容可以访问云栖社区“异步社区”公众号查看 1.2 异常检测 我们可以使用R编程来检测数据集中的异常。异常检测可用于入侵检测、欺诈检测、系统健康状态等不同领域。在R编程中,这些被称为异常值。R编程允许用多种方法对异常值进行检测: 统计测试; 基于深度的方法; 基于偏差的.....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

X
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等