阿里云文档 2025-03-24

通过Spark SQL读DLF管理的数据

数据湖构建 DLF(Data Lake Formation)提供了统一的元数据管理、统一的权限与安全管理、便捷的数据入湖能力以及一键式数据探索能力,您可以在云原生数据仓库 AnalyticDB MySQL 版中通过Spark SQL访问DLF中的元数据。

阿里云文档 2025-01-10

使用SQL查询存在数据延迟问题

问题现象在新增或更新数据后,使用SQL查询数据时无法立即获取最新数据,存在一定的延迟现象。可能原因在为数据表创建多元索引后,使用SQL查询数据时,如果多元索引包含SQL中涉及的所有数据列,则SQL引擎将自动选择该多元索引进行数据查询。更多信息,请参见索引选择策略。索引选择策略而多元索引中的数据可能存...

阿里云文档 2024-11-15

RDS SQL Server冷热数据分离最佳实践

本文介绍了通过RDS云盘实现数据存储结构优化和冷热数据分离的实践方案。适用于数据量庞大、对成本敏感或对数据访问性能有分层需求等业务场景。冷热数据分离不仅能有效降低存储成本,还能确保关键数据的快速访问,优化资源利用。通过将低频访问的冷数据归档至成本更低的对象存储服务OSS,同时将高频访问的热数据保留在云盘上,从而达到数据管理的成本效益和高效率。

文章 2024-10-13 来自:开发者社区

Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce

章节内容 上一节我们完成了如下的内容: 编写一个 SQL 脚本生成数据 启动我们的依赖服务:HDFS、Hive、YARN Sqoop 将数据 全量 导入 Hive 查看MapReduce状态、查看HDFS结果 背景介绍 这里是三台公网云服务器,每台 2C4G,搭建一个Hadoop的学习环境,供我学习。 之前已经在 VM 虚...

Hadoop-23 Sqoop 数据MySQL到HDFS(部分) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
文章 2024-10-13 来自:开发者社区

Hadoop-22 Sqoop 数据MySQL到HDFS(全量) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce

章节内容 上节我们完成了: Sqoop 介绍 Sqoop 下载配置环境等 Sqoop 环境依赖:Hadoop、Hive、JDBC 等环境补全 背景介绍 这里是三台公网云服务器,每台 2C4G,搭建一个Hadoop的学习环境,供我学习。 之前已经在 VM 虚拟机上搭建过一次,但是没留下笔记,这次趁着前几天薅羊毛的3台机器,赶紧尝试在...

Hadoop-22 Sqoop 数据MySQL到HDFS(全量) SQL生成数据 HDFS集群 Sqoop import jdbc ETL MapReduce
阿里云文档 2024-08-16

通过Spark SQL读写AWS S3外表

本文主要介绍如何在云原生数据仓库 AnalyticDB MySQL 版(AnalyticDB for MySQL)中使用Spark SQL读写AWS S3中的数据。

阿里云文档 2024-06-13

如何通过SQL聚合指标数据进行模型训练

智能巡检功能用于对业务日志进行自动化、智能化、自适应的异常巡检。本文介绍通过SQL聚合指标数据进行模型训练的操作步骤。

文章 2024-04-30 来自:开发者社区

数据分享|SQL Server、Visual Studio、tableau对信贷风险数据ETL分析、数据立方体构建可视化

原文链接:https://tecdat.cn/?p=34085 分析师:Zuyuan Wang 追求信贷规模的扩张,往往会导致贷款逾期率的不断增加,如何在当今社会运用数据识别用户特征进行风险管控成为了银行放贷的重点依据(点击文末“阅读原文”获取完整数据)。 解决方案 ...

数据分享|SQL Server、Visual Studio、tableau对信贷风险数据ETL分析、数据立方体构建可视化

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

数据库

分享数据库前沿,解构实战干货,推动数据库技术变革

+关注