问答 2022-08-15 来自:开发者社区

数据清理中的数据集成是什么啊?

数据清理中的数据集成是什么啊?

问答 2022-07-31 来自:开发者社区

进行数据清理和数据集成的数据放在哪儿呢?

进行数据清理和数据集成的数据放在哪儿呢?

问答 2022-07-25 来自:开发者社区

如何理解数据预处理功能中的数据清理功能和数据集成功能啊?

如何理解数据预处理功能中的数据清理功能和数据集成功能啊?

文章 2022-07-07 来自:开发者社区

②数据预处理之数据清理,数据集成,数据规约,数据变化和离散化

数据规约是指在保证原始数据信息不丢失的前提下,减少分析使用的数据量,数据规约中最常使用的方式是维规约。维规约的含义是从将原先高维的数据合理的压缩成低维数据,从而减少数据量,常用的方法为特征的提取, LDA 和 PCA 降维。特征的提取为从海量数据中选择与挖掘目标相关的属性成一个子表,不包含无关的属性,比如关于泰坦尼克号生产数据的数据挖掘中,船客 Name 与幸存率是无关的,就可以不放入子表中。P....

②数据预处理之数据清理,数据集成,数据规约,数据变化和离散化
文章 2022-07-07 来自:开发者社区

①数据预处理之数据清理,数据集成,数据规约,数据变化和离散化

本来这些储备知识,我想在后续的实际算法案例中进行解释,但是考虑到很多的小伙伴在学习的过程中都是逐步推进的,需要一定的时间去理解和应用,所以前期我们需要把所有的东西都准备好,这样就可以保证后续的算法实践游刃有余。数据清理我们一般看到的数据都是较为干净的数据,也就是结构化的数据,但是有时候在日志信息中,需要我们去提取出结构化的数据进行处理,这个时候就需要用到数据清理了。数据清理用到的工具1、Pyth....

①数据预处理之数据清理,数据集成,数据规约,数据变化和离散化

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。作为阿里巴巴数据中台的建设者,DataWorks从2009年起不断沉淀阿里巴巴大数据建设方法论,同时与数万名政务/金融/零售/互联网/能源/制造等客户携手,助力产业数字化升级。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问