阿里云文档 2024-12-25

如何管理日志服务中的OSS-HDFS投递作业(新版)

您可以在数据投递概览页面管理OSS-HDFS投递任务,包括查看OSS-HDFS投递任务的基础信息、统计报表,修改配置并重启任务、删除OSS-HDFS投递任务等操作。

文章 2024-09-03 来自:开发者社区

通过日志聚合将作业日志存储在HDFS中

作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.启用日志聚合功能   在默认情况下,Hadoop将所有日志存储在运行作业任务的节点上。在特定时间段后应用程序日志会被自动删除。可以配置日志聚合功能,将日志存储在HDFS中来长久保留日志信息。   日志聚合意味着一旦作业完成,Hadoop会自动聚合运行作业任务的所有节点的作业日志,并将它们移动到HDFS。日志记录是一个与YA...

通过日志聚合将作业日志存储在HDFS中
文章 2024-08-26 来自:开发者社区

美团 Flink 大作业部署问题之Checkpoint Replicate Service 跨 HDFS 集群的副本制作是如何实现的

问题一:为什么使用 distcp 跨机房复制 Checkpoint 不是一个好的选择? 为什么使用 distcp 跨机房复制 Checkpoint 不是一个好的选择? 参考回答: 使用 distcp 跨机房复制 Checkpoint 不是一个好的选择,因为 distcp 会为每个复制任务启动一个重的 mapreduce 作业,而 Checkpoint ...

美团 Flink 大作业部署问题之Checkpoint Replicate Service 跨 HDFS 集群的副本制作是如何实现的
文章 2024-08-26 来自:开发者社区

美团 Flink 大作业部署问题之HDFS 在 Flink 作业中面临什么压力

问题一:HDFS 在 Flink 作业中面临哪些压力? HDFS 在 Flink 作业中面临哪些压力? 参考回答: HDFS 在 Flink 作业中面临的压力主要来源于两个方面:一是随着业务增长导致的正常负载增加;二是大作业部署和 Checkpoint 期间带来的瞬时 RPC 请求高峰,可能导致 NameNode 的 RPC Call Queue 打满...

阿里云文档 2024-02-21

通过SparkUI或HDFSShell查看计算引擎作业运行日志

计算引擎作业提交成功后,您可以通过SparkUI界面或者HDFS Shell工具查看作业运行状态。

文章 2022-02-17 来自:开发者社区

[python作业AI毕业设计博客]大数据Hadoop工具python教程1-HDFS Hadoop分布式文件系统

Hadoop分布式文件系统(HDFS:Hadoop Distributed File System)是基于Java的分布式文件系统分布式,可扩展和可移植的文件系统,旨在跨越大型商用服务器集群。 HDFS的设计基于谷歌文件系统GFS(https://ai.google/research/pubs/pub51)。与许多其他分布式文件系统一样,HDFS拥有大量数据并提供对许多客户端的透明访问。 HDF....

[python作业AI毕业设计博客]大数据Hadoop工具python教程1-HDFS Hadoop分布式文件系统

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云存储

阿里云存储基于飞天盘古2.0分布式存储系统,产品多种多样,充分满足用户数据存储和迁移上云需求。

+关注