阿里云文档 2024-10-14

实时计算Flink和Paimon实现流批一体

本文演示了使用实时计算Flink版和EMR Serverless Spark构建Paimon数据湖分析流程。该流程包括将数据写入OSS、进行交互式查询以及执行离线数据Compact操作。EMR Serverless Spark完全兼容Paimon,通过内置的DLF元数据与其他云产品(例如,实时计算Flink版)实现元数据互通,形成完整的流批一体化解决方案。它支持灵活的任务运行方式和参数配置,满足实...

问答 2024-08-26 来自:开发者社区

flink里pyspark ,通过 spark-submit 这种方式提交作业,报错依赖缺失 咋办?

麻烦想问一下pyspark ,通过 spark-submit 这种方式提交作业,但报错依赖缺失 能否帮忙解决一下哈

问答 2024-07-31 来自:开发者社区

在Flink CDC中,flinsql读spark表的timestamp类型字段报这个错,这个咋解决

[ERROR] Could not execute SQL statement. Reason:java.lang.IllegalArgumentException: Unexpected type: INT64在Flink CDC中,flinsql读spark表的timestamp类型字段报这个错,这个咋解决啊?

问答 2024-07-29 来自:开发者社区

为什么选择从Kafka + Spark Streaming转向Flink?

为什么选择从Kafka + Spark Streaming转向Flink?

问答 2024-07-27 来自:开发者社区

要在DataWorks上同时使用EMR Spark和Flink应用,应该怎么选择技术架构?

要在DataWorks上同时使用EMR Spark和Flink应用,应该怎么选择技术架构?

文章 2024-07-16 来自:开发者社区

实时计算 Flink版产品使用问题之使用Spark ThriftServer查询同步到Hudi的数据时,如何实时查看数据变化

问题一:flink cdc哪个版本有sqlserverCatalog,能根据表名拿到对应的字段和字段类型? flink cdc哪个版本有sqlserverCatalog,能根据表名拿到对应的字段和字段类型? 参考答案: 你指的是flink-connector-jdbc吧,这个是连接器的特性,1.17的好像就支持了 ...

实时计算 Flink版产品使用问题之使用Spark ThriftServer查询同步到Hudi的数据时,如何实时查看数据变化
问答 2024-06-17 来自:开发者社区

Apache Flink 和 Apache Spark Streaming在完整性推理方面有何不同?

Apache Flink 和 Apache Spark Streaming 在完整性推理方面有何不同?

文章 2024-06-16 来自:开发者社区

实时计算 Flink版产品使用问题之同步到Hudi的数据是否可以被Hive或Spark直接读取

问题一:Flink CDC这个应该在哪里配? Flink CDC这个应该在哪里配?mysql 的超时我已经改成30s了 参考答案: 要么找DBA改一下,要么自己去看有没有参数改,我们是10分钟,有的...

实时计算 Flink版产品使用问题之同步到Hudi的数据是否可以被Hive或Spark直接读取
文章 2024-06-12 来自:开发者社区

EMR Serverless Spark:结合实时计算 Flink 基于 Paimon 实现流批一体

简介 EMR Serverless Spark 版是开源大数据平台 E-MapReduce 基于 Spark 提供的一款全托管、一站式的数据计算平台。它为用户提供任务开发、调试、发布、调度和运维等全方位的产品化服务,显著简化了大数据计算的工作流程,使用户能更专注于数据分析和价值提炼。 实时计算 Flink 版是阿里云提供的全托管 Serverless Flink 云服...

EMR Serverless Spark:结合实时计算 Flink 基于 Paimon 实现流批一体
文章 2024-05-31 来自:开发者社区

分布式计算框架比较:Hadoop、Spark 与 Flink

在大数据处理领域,Hadoop、Spark 和 Flink 是三个非常重要的分布式计算框架,它们各自有着独特的特点和优势。 Hadoop 是分布式计算的先驱框架。它主要由 HDFS(分布式文件系统)和 MapReduce(计算框架)组成。Hadoop 擅长处理大规模的批量数据处理任务,具有高度的可扩...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等