《CDP企业数据云平台从入门到实践》——CDP之数据储存(1)
CDP 之数据存储一、 数据存储概览Cloudera Runtime 提供了不同类型的存储组件,您可以根据您的数据要求使用这些组件。Apache Hadoop HDFS 是一个用于存储大量数据的分布式文件系统。Apache Ozone 是一个针对大数据工作负载优化的可扩展、冗余和分布式对象存储。Apache Kudu 完善了 Apache Hadoop 的存储层,支持对数据进行快速分析。1. H....
《CDP企业数据云平台从入门到实践》——CDP之数据储存(2)
《CDP企业数据云平台从入门到实践》——CDP之数据储存(1) https://developer.aliyun.com/article/1226442?groupCode=ClouderaCDP二、 管理数据存储您可以考虑各种选项来优化数据存储,例如通过纠删码增加存储空间、使用编解码器压缩数据、在 HDFS 集群中平衡数据等。1. 优化数据存储1) 跨 DataNode 的磁盘平衡数据HDFS....
《CDP企业数据云平台从入门到实践》——CDP之数据储存(3)
《CDP企业数据云平台从入门到实践》——CDP之数据储存(2) https://developer.aliyun.com/article/1226409?spm=a2c6h.13148508.setting.14.12f54f0eNj6eW12. 优化性能您可以考虑以下选项来优化 HDFS 集群的性能:在 DataNode 上交换磁盘驱动器、缓存数据、为主机指定机架、自定义 HDFS、使用 Ha....
《CDP企业数据云平台从入门到实践》——CDP之数据储存(4)
《CDP企业数据云平台从入门到实践》——CDP之数据储存(3) https://developer.aliyun.com/article/1226404?groupCode=ClouderaCDP三、 数据保护可以通过防止意外删除文件和备份 HDFS 元数据来确保数据保护。1. 备份 HDFS 元数据HDFS 元数据以树的形式表示 HDFS 目录和文件的结构和属性。您可以在不影响NameNode....

《CDP企业数据云平台从入门到实践》——CDP之数据储存(5)
《CDP企业数据云平台从入门到实践》——CDP之数据储存(4) https://developer.aliyun.com/article/1226399?groupCode=ClouderaCDP2. Ozone 安全架构Apache Ozone 是一种可扩展的分布式高性能对象存储,针对大数据工作负载进行了优化,可以处理数十亿个不同大小的对象。使用 Apache Spark、Apache YAR....

《CDP企业数据云平台从入门到实践》——CDP之数据储存(6)
《CDP企业数据云平台从入门到实践》——CDP之数据储存(5) https://developer.aliyun.com/article/1226385?groupCode=ClouderaCDP2) Ozone 授权授权是指定对 Ozone 资源的访问权限的过程。用户通过身份验证后,授权使您能够指定用户在 Ozone 集群中可以执行的操作。例如,您可以允许用户读取卷、存储桶和密钥,同时限制他们....

《CDP企业数据云平台从入门到实践》——CDP之数据储存(7)
《CDP企业数据云平台从入门到实践》——CDP之数据储存(6) https://developer.aliyun.com/article/1226380?groupCode=ClouderaCDP五、 Apache Kudu 存储1. Kudu 架构1) 超快的列式存储与大多数现代分析数据存储一样,Kudu 在内部按列而不是行组织其数据。列式存储允许高效的编码和压缩。例如,只有几个唯一值的字符串....

《CDP企业数据云平台从入门到实践》——CDP之数据储存(8)
《CDP企业数据云平台从入门到实践》——CDP之数据储存(7) https://developer.aliyun.com/article/1226375?groupCode=ClouderaCDP2. 管理 Kudu 的安全1) Kudu 安全注意事项Kudu 包括安全功能,允许加强 Kudu 集群以防止未经授权的用户访问。Kudu 使用 Kerberos 的强身份验证和 Ranger 的授权。....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。