文章 2017-06-23 来自:开发者社区

《数据分析实战:基于EXCEL和SPSS系列工具的实践》一3.4 数据量太大了怎么办

本节书摘来华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第3章 ,第3.4节,纪贺元 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.4 数据量太大了怎么办 早期做培训的时候,很少有学员来问我数据量的事情,因为大家的数据量都比较小,这几年来不同了,经常有学员来问我:老师,作者的数据有300多万,怎么办?还有学员说,我们要做客户画像,数据量有1000多万....

文章 2017-06-23 来自:开发者社区

《数据分析实战:基于EXCEL和SPSS系列工具的实践》一3.3.3 数据间逻辑的排查

本节书摘来华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第3章 ,第3.3.3节,纪贺元 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.3.3 数据间逻辑的排查 重复值、空行(列)、缺失值这些都是比较明显的错误,而数据之间的逻辑关系则是比较隐蔽的问题。案例文件3.9给出了对啤酒饮用习惯进行调查后所记录的数据,先来看看年龄和学历这两组数据,单独看这两组....

文章 2017-06-23 来自:开发者社区

《数据分析实战:基于EXCEL和SPSS系列工具的实践》一3.3.2 缺失值的填充和分析

本节书摘来华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第3章 ,第3.3.2节,纪贺元 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.3.2 缺失值的填充和分析 数据中的缺失值产生的原因很多,有的是原始数据中就没有,有的是漏了,有的则是因种种原因没有收集;还有填写者故意不填的,例如市场调查的问卷中,涉及收入、对竞争对手如何看待等敏感性问题时,就经常....

文章 2017-06-23 来自:开发者社区

《数据分析实战:基于EXCEL和SPSS系列工具的实践》一3.3.1 重复、空行、空列数据删除

本节书摘来华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第3章 ,第3.3.1节,纪贺元 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.3.1 重复、空行、空列数据删除 以案例文件3.1为例,如何对数据进行重复值的排查呢?可综合运用三种方法进行删除,其中,EXCEL提供了两种方法,不过都是直接删除,而SPSS中的重复值处理可以先标识然后再删除,相对更....

文章 2017-06-22 来自:开发者社区

《数据分析实战:基于EXCEL和SPSS系列工具的实践》一3.3 耗时耗力的数据整理过程

本节书摘来华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第3章 ,第3.3节,纪贺元 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.3 耗时耗力的数据整理过程 数据的整理往往是一个痛苦的耗时耗力的过程,有人曾经以做饭菜来打比方:做过饭菜的人都知道,下油锅炒菜的时间其实并不长,几分钟就够了,而做菜之前的买菜、泡菜(用水浸泡菜去除农药)、洗菜、切菜、配菜....

文章 2017-06-22 来自:开发者社区

数据分析实战:基于EXCEL和SPSS系列工具的实践》一3.2 用“逐步推进法”推测需要的数据

本节书摘来华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第3章 ,第3.2节,纪贺元 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.2 用“逐步推进法”推测需要的数据 在与客户接触的过程中,我们发现了一种比较简单的方法:逐步推进法。通过该方法可以推测需要的数据。逐步推进法一般包括几个步骤:一是总量,二是结构,三是时间序列,四是颗粒度。下面以我做过的一....

文章 2017-06-22 来自:开发者社区

《数据分析实战:基于EXCEL和SPSS系列工具的实践》一3.1 数据采集的几条重要原则

本节书摘来华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第3章 ,第3.1节,纪贺元 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.1 数据采集的几条重要原则 3.1.1 要足够“复杂”先说一个跟客户接触的例子。一个国企学员课间休息时来问我:“老师,我们领导经常批评我,说我们写的工作报告(数据报告)太简单了,你能看看我们写的报告吗?”我到他电脑前面看....

文章 2017-06-22 来自:开发者社区

《数据分析实战:基于EXCEL和SPSS系列工具的实践》一第3章

本节书摘来华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第3章 ,第3.1节,纪贺元 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 第3章 数据采集与整理巧妇难为无米之炊,对于数据分析而言,数据收集是极其重要的一步。我曾经听到有人说过,只要有数据,分析嘛,总归做得出来的,我个人基本同意这个观点。但大多数情况下,我们面临的都不是现成的数据,需要有一个企业外....

文章 2017-06-22 来自:开发者社区

《数据分析实战:基于EXCEL和SPSS系列工具的实践》一2.3 在分析需求和模型之间搭起桥梁

本节书摘来华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第2章 ,第2.3节,纪贺元 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.3 在分析需求和模型之间搭起桥梁 我们在现实工作中面临的都是实际的需求,这些需求往往乍一看跟数据分析并没有多少关系,例如:成本上升了,对价格如何影响?如何降低物流成本?工厂里面做实验,有的时候成功有的时候失败,原因何在?....

文章 2017-06-22 来自:开发者社区

《数据分析实战:基于EXCEL和SPSS系列工具的实践》一2.2 选择称手的软件工具

本节书摘来异步社区《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第2章 ,第2.2节,纪贺元 著 更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.2 选择称手的软件工具 数据分析的工具有很多种(大约有十多种),每种都有其优势和长处,也有它的缺陷。根据作者的经验,还真没有一种工具软件能够包打天下。当然从逻辑上讲也应该是这样的,如果存在一个“万能”的软件,那么其他的软件肯....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

友盟+

友盟+,国内领先的第三方全域数据智能服务商。以“数据智能,驱动业务增长”为使命,基于卓越的技术与算法能力,结合实时更新的全域数据资源,覆盖191个行业分类、输出300+应用或行业的分析指标,通过AI赋能的一站式互联网数据产品与服务体系,帮助企业实现深度用户洞察、实时业务决策和持续业务增长。 截至2019年6月已累计为180万移动应用和815万家网站提供近九年的专业数据服务典型客户包括:中国移动、CCTV、人民日报客户端、今日头条、飞常准、喜马拉雅、唱吧、美拍、斗鱼、智慧树等。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问