文章 2024-07-27 来自:开发者社区

如何安全的大数据量表在线进行DDL操作

本文为博主原创,转载请注明出处   随着业务的需要,工作中需要对生产数据库的一些表做一些DDL操作,由于生产数据库表的数据量都是几千万, 而且生产数据库的表还在不断的进行新增和查询操作。应用中需要对生产数据库的表添加一个字段,由于考虑到数据量 大,而且表数据还在不断新增,以及进行查询等操作,为了不影响业务和数据,需要考虑在生产数据表添加字段时,不影响 正常业务,即...

如何安全的大数据量表在线进行DDL操作
文章 2024-07-27 来自:开发者社区

linux命令-查看当前目录当前目录剩余空间以及目录文件大小和个数(pg清理大数据量表)

文章目录一、查看当前目录当前目录剩余空间以及目录文件大小和个数(pg清理大数据量表) linux当前目录剩余空间怎么查看只查看当前目录下文件大小查看当前目录下及子目录文件大小二、查看当前目录下及子目录文件个数只查看文件夹下的文件个数(当前目录的文件数)查看文件夹下的文件个数(当前目录的文件和子文件夹的文件数)三、 linux查看磁盘空间linux看目录容量定位,lin...

问答 2023-10-29 来自:开发者社区

大数据计算MaxCompute临时表,这种场景如何实现新增数据的id在全量表的id赋值呢?

我们的场景是从ftp数据源读取文本数据然后插入到大数据计算MaxCompute临时表,处理之后加入到全量表~ 这种场景如何实现新增数据的id在全量表的id赋值呢?

问答 2023-09-26 来自:开发者社区

你好,大数据计算MaxCompute也就是这个ODS全量表里面也要建分区是吗?按什么形式建立了?

你好,大数据计算MaxCompute也就是这个ODS全量表里面也要建分区是吗?按什么形式建立了?

问答 2022-04-15 来自:开发者社区

我在大数据开发套件上用group by。我对一张表A做group by成表B,结果表B比原来表A的行数要少了,但是物理存储量表B却是表A的10倍,请问这个什么原因? 问题现状详见附件,期待您的答复,谢谢

我在大数据开发套件上用group by。我对一张表A做group by成表B,结果表B比原来表A的行数要少了,但是物理存储量表B却是表A的10倍,请问这个什么原因? 问题现状详见附件,期待您的答复,谢谢

文章 2022-02-17 来自:开发者社区

作为后端开发如何设计数据库系列文章(二)设计大数据量表结构

上篇文章讲解了传统数据库的一些设计注意点。本篇为第二篇,在大数据量的情况下,如何去提前设计这个表结构,来达到一个比较好的效果。对于团队,对于后续的维护和扩展都带来更大的便利。 自增id 自增id还是可以有,但是不是必须的了。但是建议还是每张表中有一个自增id。 为什么,还是那句话,做数据查询,迁移,排序的时候,有着天然的一些优势。 唯一标识 这个标识无论是token,还是其他例如订单的订单号或者....

文章 2022-02-16 来自:开发者社区

索引的妙用 - 大数据量表自连接效率问题

前几天遇到个问题,在SQL SERVER中做了一个复杂的view,由于这个view要用到一个数据量很大的表格来查询历史记录,因此用到了自连接。但是运行下来速度很慢,需要3分多种。后来找到了原因,原来是没有给连接键加上索引。现总结如下:如果一个表格数据量很大,需要自连接时,最好给连接的字段加上索引。索引加好以后运行下来一看,才5秒。简直不能比啊!呵呵,所以看来,索引的作用还是很大的。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

大数据计算 MaxCompute

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

+关注