文章 2024-10-14 来自:开发者社区

大数据-115 - Flink DataStream Transformation 多个函数方法 FlatMap Window Aggregations Reduce

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完) HDFS(已更完) MapReduce(已更完) Hive(已更完) Flume(已更完) Sqoop(已更完) Zookeeper(已更完) HBase(已更完) Redis (已更完) Kafka(已更完) ...

大数据-115 - Flink DataStream Transformation 多个函数方法 FlatMap Window Aggregations Reduce
问答 2024-08-14 来自:开发者社区

在大数据计算MaxCompute中内存是map和reduce或者join阶段的内存吗?

在大数据计算MaxCompute中内存是map和reduce或者join阶段的内存吗?

问答 2024-07-11 来自:开发者社区

在大数据计算MaxCompute是如何设置map和reduce个数的?

在大数据计算MaxCompute是如何设置map和reduce个数的?

问答 2024-06-16 来自:开发者社区

MaxCompute的SQL作业如何增加reduce端的并行度

MaxCompute的SQL作业如何增加reduce端的并行度

文章 2024-06-10 来自:开发者社区

MaxCompute产品使用合集之如何增加Reduce任务的个数

问题一:在大数据计算MaxCompute中,同一个project大量的请求,会有计算瓶颈吗? 我们目前的MaxCompute是按量付费的,同一个project大量的请求,会有计算瓶颈吗?sql之间会互相影响吗? 参考答案: 理论上不会。 关于本问题的更多回答可点击进行查看: https://developer.ali...

问答 2024-05-19 来自:开发者社区

大数据计算MaxCompute这个小reduce任务执行近6分钟这么久可能是啥原因?

大数据计算MaxCompute这个小reduce任务执行近6分钟这么久可能是啥原因?

问答 2024-03-30 来自:开发者社区

大数据计算MaxCompute M 开头的就是 Map 阶段,R 开头的就是 reduce 阶段吗?

大数据计算MaxCompute M 开头的就是 Map 阶段,R 开头的就是 reduce 阶段吗?

问答 2023-12-03 来自:开发者社区

在大数据计算MaxCompute中,如何增加reduce个数?

grouping sets只生成了一个reduce,导致任务运行很慢,如何增加reduce个数?https://logview.aliyun.com/logview/?h=http://service.cn.maxcompute.aliyun-inc.com/api&p=sm_cdp&i=20231129090609633geq83eb2fwr3&token=czZYRXl...

问答 2023-07-30 来自:开发者社区

大数据计算MaxCompute我这个reduce很慢,设置什么参数,可以提高reduce速度?

问题1:大数据计算MaxCompute我这个reduce很慢,设置什么参数,可以提高reduce速度?SET odps.stage.reducer.num = 2000;set odps.sql.reducer.instances = 2000;这样设置可以吗?问题2:这个参数调优的话,应该设置为多少

文章 2023-07-29 来自:开发者社区

大数据面试题:Hive count(distinct)有几个reduce,海量数据会有什么问题

参考答案:count(distinct)只有1个reduce。为什么只有一个reducer呢,因为使用了distinct和count(full aggreates),这两个函数产生的mr作业只会产生一个reducer,而且哪怕显式指定set mapred.reduce.tasks=100000也是没用的。当使用count(distinct)处理海量数据(比如达到一亿以上)时,会使得运行速度变得很....

大数据面试题:Hive count(distinct)有几个reduce,海量数据会有什么问题

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

大数据计算 MaxCompute

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等