【代码编辑源码】【office风格界面源码】【qgis2.18.9源码】spark on yarn 源码-皮皮网

【代码编辑源码】【office风格界面源码】【qgis2.18.9源码】spark on yarn 源码

时间:2024-12-29 07:45:31 来源：负69的源码计算过程

1.在windows中spark的本地模式如何配置
2.Spark on Yarn ä¸ºä»ä¹åºç°ååè¶çcontainerè¢«kill

spark on yarn 源码

在windows中spark的本地模式如何配置

1、在Spark中采用本地模式启动pyspark的命令主要包含以下参数：master：这个参数表示当前的pyspark要连接到哪个master，如果是local[*]，就是代码编辑源码使用本地模式启动pyspark，其中，中括号内的office风格界面源码星号表示需要使用几个CPU核心(core)。

2、肯定第一步是配置spark环境：包括linux系统的安装，java，ssh，Hadoop，Scala，spark的qgis2.18.9源码安装与环境变量设置。虽说简单，但对于初学者说，尤其是党章知识选粹源码没有使用过linux系统的，还是有些挑战。其中遗漏一些细节问题，都会出错。疯狂加粉源码

3、SparkonYarn模式备注：Yarn的连接信息在Hadoop客户端的配置文件中指定。通过spark-env.sh中的环境变量HADOOPCONFDIR指定Hadoop配置文件路径。

4、最后的PhysicalPlanexecution阶段用Spark代替HadoopMapReduce。通过配置Shark参数，Shark可以自动在内存中缓存特定的RDD，实现数据重用，进而加快特定数据集的检索。

Spark on Yarn ä¸ºä»ä¹åºç°ååè¶çcontainerè¢«kill

ä¸ä¸ªExecutorå¯¹åºä¸ä¸ªJVMè¿ç¨ã ä»Sparkçè§åº¦çï¼Executorå ç¨çåååä¸ºä¸¤é¨åï¼ ExecutorMemory å MemoryOverhead ãå¶ä¸ï¼ ExecutorMemory ä¸ºJVMè¿ç¨çJavaå åºåï¼ MemoryOverhead ä¸ºJVMè¿ç¨ä¸é¤Javaå ä»¥å¤å ç¨çç©ºé´å¤§å°ï¼åæ¬æ¹æ³åºï¼æ°¸ä¹ä»£ï¼ãJavaèææºæ ãæ¬å°æ¹æ³æ ãJVMè¿ç¨æ¬èº«æç¨çååãå å¤ååï¼Direct Memoryï¼çã

spark.driver.memory å spark.executor.memory åå«è®¾ç½®SparkçDriveråExecutorç ExecutorMemory .

spark.yarn.executor.memoryOverhead å spark.yarn.driver.memoryOverhead åå«è®¾ç½®SparkçDriveråExecutorç MemoryOverhead .

å¦å¤ï¼Sparkä¼å¤§éåéå å¤ååï¼å å¤ååé»è®¤æå¤§å¯ä»¥å ExecutorMemory ä¸æ ·ï¼å¯ä»¥éè¿javaOptionsä½¿ç¨ MaxDirectMemorySize éç½®æå¤§å¼ã

å å¤ååæå¤§å¯ä»¥å ExecutorMemory ä¸æ ·ï¼ä½æ¯å å¤åååå MemoryOverhead éå¶ï¼æä»¥å½ MaxDirectMemorySize , ExecutorMemory å MemoryOverhead è®¾ç½®ä¸åçæ¶ï¼ä¼åºç°containerååè¶éï¼è¢«Yarn killçæåµã

æ¯å¦ï¼ ExecutorMemory ä¸º8Gï¼ MemoryOverhead ä¸º4Gï¼ MaxDirectMemorySize æ²¡æè®¾ç½®ï¼æ¤æ¶yarnè®¤ä¸ºä¸ä¸ªcontaineræå¤§å¯ä»¥ä½¿ç¨Gååï¼ä½æ¯å å¤ååæå¤§å¯ä»¥ä½¿ç¨8Gï¼å¯¼è´containeræå¤§å¯ä»¥ä½¿ç¨è¶è¿Gåå(å ååå+ å å¤åå)ï¼æ¯Gå¤§ï¼ æç»è¢«Yarn killæã

åççè®¾ç½®è§åä¸º: ExecutorMemory + MemoryOverhead > ExecutorMemory + MaxDirectMemorySize

æä»¥ï¼Sparkåºç¨å ç¨éç¾¤ååçæ»å¤§å°ä¸º:

åæ°è°ä¼å»ºè®®ï¼

æ¯ä¸ªExecutorè¿ç¨çååè®¾ç½®4G~8Gè¾ä¸ºåéã

æ¯ä¸ªExecutorçCPU coreæ°éè®¾ç½®ä¸º2~4ä¸ªè¾ä¸ºåéã

ä»¥ä¸æ¯é¨åå»ºè®®çåæ°è®¾ç½®:

【代码编辑源码】【office风格界面源码】【qgis2.18.9源码】spark on yarn 源码

推荐资讯

本周热点