文章 2023-06-12 来自:开发者社区

【大数据学习篇11】广告点击流实时统计

1.数据集分析        本需求采用Java程序模拟生成用户广告点击数据,通过Kafka的生产者发布用户广告点击数据形成实时数据流,数据流中的每一条数据代表一个用户点击广告的行为,当Kafka生产者程序运行时会产出源源不断的用户广告点击流数据。1596006895171,16,6,tianjin        单....

【大数据学习篇11】广告点击流实时统计
文章 2023-06-12 来自:开发者社区

【大数据学习篇7】小试牛刀统计并且分析天猫数据(上)

本项目基于搭建大数据环境,通过将数据存放在HDFS上,从HDFS中获取数据,然后根据实际需求通过Spark或Spark SQL对数据进行读取分析,将分析结果存储到HBase表中,最终通过 ECharts数据可视化工具基于Python Web平台实现数据可视化。订单号、成交金额、付款金额、订单时间、付款时间、退款1、统计每个省的订单总额2、统计每个省的退款总额3、统计全国订单总额4、统计前10名省....

【大数据学习篇7】小试牛刀统计并且分析天猫数据(上)
文章 2023-06-12 来自:开发者社区

【大数据学习篇3】HDFS命令操作与MR单词统计

1. HDFS命令使用[root@master bin]# su hd[hd@master bin]$ #查看/目录[hd@master bin]$ hdfs dfs -ls /5#在/目录创建一个为test名字的文件夹[hd@master bin]$ hdfs dfs -mkdir /test#查看/目录[hd@master bin]$ hdfs dfs -ls Found 1 itemsdr....

【大数据学习篇3】HDFS命令操作与MR单词统计

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute学习相关内容

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问