问答 2021-12-02 来自:开发者社区

请教各位大佬,flink读取hdfs文件时的疑问

flink读取hdfs文件时,FileInputFormat.java类中,acceptFile()方法默认过滤掉了以"_"和"."开头的文件,那如果读入了in-progress文件和.pending文件, 在执行open()方法时,突然in-progress或.pending文件状态发生了改变而导致原来的文件路径消失,会不会出现什么问题?或者是有没有可能出现这种情况? *来自志愿者整理的fl.....

问答 2021-10-22 来自:开发者社区

HDFS的读取流程描述是怎样的?

HDFS的读取流程描述是怎样的?

问答 2021-01-31 来自:开发者社区

我用flink批量读取hdfs里的csv文件然后写到ES总是运行一会就出错,不知道该从哪#Flink

我用flink批量读取hdfs里的csv文件然后写到ES总是运行一会就出错,不知道该从哪里排查#Flink

问答 2020-06-09 来自:开发者社区

Spark读取HA模式HDFS Caused by: java.net.Unkn?报错

Spark版本:1.6.1 Hadoop版本:2.6.2 HDFS模式为:HA(正常使用,没有任何问题) fs.defaultFS hdfs://masters dfs.nameservices masters 使用Spark读取HDFS文件,报错Caused by: java.net.UnknownHostException: masters ...

问答 2020-06-09 来自:开发者社区

用java读取hdfs的.lzo_deflate文件报错?报错

linux环境没有问题,hadoop环境、配置也没有问题,并且通过hdoop fs -text 指令能正常打开该压缩文件。但是用java读取就报错了,请大神帮忙看看,谢谢 代码如下: public static void main(String[] args) { String uri = "/daas/****/MBLDPI3G.2016081823_10.1471532401822.l...

问答 2020-06-06 来自:开发者社区

Spark中的hadoopFile无法读取HDFS上的文件:报错

SparkConf conf = new SparkConf().setAppName("test");         JavaSparkContext sc = new JavaSparkContext(conf);         JavaPairRDD tempRDD =...

问答 2020-05-29 来自:开发者社区

问大家,flink批处理读取多路径hdfs文件有什么好的办法吗?我是每读一个,union#Flink

问大家,flink批处理读取多路径hdfs文件有什么好的办法吗?我是每读一个,union一下,但是处理速度特别慢,同样的资 源和代码,spark8分钟处理完,flink得30分钟,发现flink从hdfs里读取数据特别慢,10多秒,才1M #Flink

问答 2020-05-29 来自:开发者社区

flink 如何读取持续更新的hdfs文件, 比如原来有个文件我已经读了,但后来这个文件#Flink

flink 如何读取持续更新的hdfs文件, 比如原来有个文件我已经读了,但后来这个文件有了更新我就需要重新读,hdfs上的文件每隔一段时间会被重新覆写 #Flink

问答 2019-06-06 来自:开发者社区

flink用IDEA本地运行可以读取HDFS数据,然后把项目打包提交到flink集群,无法读取HDFS数据,出现以下错误,这是为何?

The program finished with the following exception: org.apache.flink.client.program.ProgramInvocationException: Job failed. (JobID: 74a2d820909fee963c4dea371b5c236c) at org.apache.flink.client.pr...

文章 2018-12-09 来自:开发者社区

Spark HadoopRDD读取HDFS文件

Spark HadoopRDD读取HDFS文件 更多资源 SPARK 源码分析技术分享(bilibilid视频汇总套装视频): https://www.bilibili.com/video/av37442139/ github: https://github.com/opensourceteams/spark-scala-maven csdn(汇总视频在线看): https://blog....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云存储

阿里云存储基于飞天盘古2.0分布式存储系统,产品多种多样,充分满足用户数据存储和迁移上云需求。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问