文章 2024-05-26 来自:开发者社区

【指标计算】Spark 计算指定用户与其他用户购买的相同商品

@[toc] 需求说明 计算某一个指定用户与其他用户购买的共同商品,假设用户 user01 购买了商品 1、2、3,那么需要找出其他购买过商品 1 或 2 或 3 的用户。 需求分析 1.指定用户 获取指定用户所购买的商品 2.其他用户 判断其他用户所购买的商品是否被指定用户购买 需求实现 获取指定用户 user01 与其他用户购买过的相同商品。 import o...

【指标计算】Spark 计算指定用户与其他用户购买的相同商品
文章 2023-12-20 来自:开发者社区

【大数据技术】Spark+Flume+Kafka实现商品实时交易数据统计分析实战(附源码)

需要源码请点赞关注收藏后评论区留言私信~~~Flume、Kafka区别和侧重点1)Kafka 是一个非常通用的系统,你可以有许多生产者和消费者共享多个主题Topics。相比之下,Flume是一个专用工具被设计为旨在往HDFS,HBase等发送数据。它对HDFS有特殊的优化,并且集成了Hadoop的安全特性。如果数据被多个系统消费的话,使用kafka;如果数据有多个生产者场景,或者有写入Hbase....

【大数据技术】Spark+Flume+Kafka实现商品实时交易数据统计分析实战(附源码)
文章 2022-02-16 来自:开发者社区

Spark-ML-01-小试spark分析离线商品信息

任务 一个在线商品购买记录数据集,约40M,格式如下: Jack,iphone cover,9,99 Jack,iphone cover,9,99 Jack,iphone cover,9,99 Jack,iphone cover,9,99 完成统计: 1.购买总次数 2.客户总个数 3.总收入 4.最畅销的商品 代码 import java.util.Collections...

文章 2017-08-01 来自:开发者社区

用Spark分析Amazon的8000万商品评价(内含数据集、代码、论文)

尽管数据科学家经常通过分布式云计算来处理数据,但是即使在一般的笔记本电脑上,只要给出足够的内存,Spark也可以工作正常(在这篇文章中,我使用2016年MacBook Pro / 16GB内存,分配给Spark 8GB内存)。 此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步。 亚马逊的商品评论和评分是一个非常重要的业务。 亚马逊上的客户经常基于这些评论做出购买决定,并且单.....

文章 2017-02-19 来自:开发者社区

【Spark Summit East 2017】商品集群上的时间演化图处理

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps。 本讲义出自Anand Iyer在Spark Summit East 2017上的演讲,主要介绍了构建于通用数据流框架上的时间演化图处理系统Tegra.....

文章 2017-01-27 来自:开发者社区

用Spark分析Amazon的8000万商品评价(内含数据集、代码、论文)

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps。 亚马逊的商品评论和评分是一个非常重要的业务。 亚马逊上的客户经常基于这些评论做出购买决定,并且单个不良评论可以导致潜在购买者重新考虑。 几年前,我写.....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注