阿里云文档 2025-04-01

如何创建OSS-HDFS投递任务

OSS-HDFS服务(JindoFS服务)是一个云原生数据湖存储功能。基于统一的元数据管理能力,完全兼容HDFS文件系统接口,满足大数据和AI等领域的数据湖计算场景。日志服务支持将数据投递到OSS-HDFS。本文介绍创建OSS-HDFS投递任务的操作步骤。

阿里云文档 2024-12-30

通过OSS-HDFS服务审计日志分析热点访问数据

为了有效地管理和分析OSS-HDFS服务的审计日志,您需要将审计日志导入日志服务SLS,然后通过SLS内置的查询分析能力对收集的审计日志进行分析,获取OSS-HDFS服务不同时间段内的访问量变化,分析频繁访问的数据、检测异常访问行为等信息。本教程用于演示如何通过SLS分析OSS-HDFS服务热点访问数据。

阿里云文档 2024-12-27

如何授予RAM用户操作OSS-HDFS投递的权限

当您操作OSS-HDFS投递任务时,需对RAM用户进行授权。

阿里云文档 2024-12-25

如何管理日志服务中的OSS-HDFS投递作业(新版)

您可以在数据投递概览页面管理OSS-HDFS投递任务,包括查看OSS-HDFS投递任务的基础信息、统计报表,修改配置并重启任务、删除OSS-HDFS投递任务等操作。

文章 2024-09-03 来自:开发者社区

通过日志聚合将作业日志存储在HDFS中

作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任。 一.启用日志聚合功能   在默认情况下,Hadoop将所有日志存储在运行作业任务的节点上。在特定时间段后应用程序日志会被自动删除。可以配置日志聚合功能,将日志存储在HDFS中来长久保留日志信息。   日志聚合意味着一旦作业完成,Hadoop会自动聚合运行作业任务的所有节点的作业日志,并将它们移动到HDFS。日志记录是一个与YA...

通过日志聚合将作业日志存储在HDFS中
阿里云文档 2024-06-12

导出OSS-HDFS服务审计日志

OSS-HDFS服务端记录了客户端请求的查询、修改、删除文件元数据的操作审计日志。 您可以通过审计日志,了解OSS-HDFS服务操作审计、访问统计以及异常请求等情况。

文章 2022-11-24 来自:开发者社区

2-网站日志分析案例-日志采集:Flume-Kafka-Flume-HDFS

2-网站日志分析案例-日志采集:Flume-Kafka-Flume-HDFShadoop2.7.3+ kafka_2.11-2.1.0环境安装虚拟机安装安装hadoop参考:https://blog.csdn.net/m0_38139250/article/details/121155903安装zookeeper参考:https://blog.csdn.net/m0_38139250/artic....

2-网站日志分析案例-日志采集:Flume-Kafka-Flume-HDFS
文章 2022-11-22 来自:开发者社区

网站流量日志 Flume收集--hdfs--基于文件闲置策略滚动| 学习笔记

开发者学堂课程【大数据分析之企业级网站流量运营分析系统开发实战(第二阶段):网站流量日志 Flume 收集--hdfs--基于文件闲置策略滚动】学习笔记,与课程紧密联系,让用户快速学习知识。课程地址:https://developer.aliyun.com/learning/course/694/detail/12186网站流量日志 Flume 收集--hdfs--基于文件闲置策略滚动内容介绍:....

网站流量日志 Flume收集--hdfs--基于文件闲置策略滚动| 学习笔记
文章 2022-09-20 来自:开发者社区

Hadoop运行模式(四)、配置历史服务器、配置日志的聚集、删除HDFS上已经存在的文件、集群启动/停止方式总结、配置mapred-site.xml、配置yarn-site.xml

@[toc]3.Hadoop运行模式3.6配置历史服务器为了查看程序的历史运行情况,需要配置一下历史服务器。具体配置步骤如下:3.6.1配置mapred-site.xml配置前记得将yarn关闭[summer@hadoop103 hadoop-3.1.3]$ sbin/stop-yarn.sh[summer@hadoop102 hadoop]$ vim mapred-site.xml在该文件里面....

Hadoop运行模式(四)、配置历史服务器、配置日志的聚集、删除HDFS上已经存在的文件、集群启动/停止方式总结、配置mapred-site.xml、配置yarn-site.xml
文章 2022-04-16 来自:开发者社区

flume学习(三):flume将log4j日志数据写入到hdfs

在第一篇文章中我们是将log4j的日志输出到了agent的日志文件当中。配置文件如下: [plain] view plaincopy tier1.sources=source1   tier1.channels=channel1   tier1.sinks=sink1      tier1.sources.s...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云存储

阿里云存储基于飞天盘古2.0分布式存储系统,产品多种多样,充分满足用户数据存储和迁移上云需求。

+关注