文章 2022-10-21 来自:开发者社区

大数据开发面试知识点总结(三)

Spark考点总结参考:大数据面试杀招——Spark高频考点,必知必会!_Alice菌的博客-CSDN博客一、你是怎么理解Spark,它的特点是什么?        Spark是一个基于内存的,用于大规模数据处理(离线计算、实时计算、快速查询(交互式查询))的统一分析引擎。        它内部的组成模块,包含Spa....

大数据开发面试知识点总结(三)
文章 2022-10-21 来自:开发者社区

大数据开发面试知识点总结(二)

七、Sqoop实战1 Mysql数据导入HDFS上.1. 全量导入:将mysql表中全部数据都导入HDFS,如果HDFS中存在这个目录的话就会报错,默认存储的HDFS目录是  /user/root/XXX.bin/sqoop  import       (在sqoop的安装目录内,import表名是导入)--connect jdbc:mysql:....

大数据开发面试知识点总结(二)
文章 2022-10-21 来自:开发者社区

大数据开发面试知识点总结

一、HDFS1.基本操作:查看所有命令 hadoop fs1、查看所有目录及其文件 hadoop fs -ls /2、hdfs文件系统创建目录 hadoop fs -mkdir /input(用于测试代码)2.1、hdfs文件系统创建目录(批量)hadoop fs -mkdir -p /inout/tmp 在input文件夹内创建tmp文件夹3、hdfs文件系统创建文件 hadoop fs -t....

大数据开发面试知识点总结
文章 2022-09-11 来自:开发者社区

大数据面试需要掌握的知识点

1、kafka的message包括哪些信息一个Kafka的Message由一个固定长度的header和一个变长的消息体body组成header部分由一个字节的magic(文件格式)和四个字节的CRC32(用于判断body消息体是否正常)构成。当magic的值为1的时候,会在magic和crc32之间多一个字节的数据:attributes(保存一些相关属性,比如是否压缩、压缩格式等等);如果mag....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Java面试那些事儿

手把手带您学习Java,开启编程之路。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等