Hadoop Notes

Note1

问题描述

Yarn不能同时运行多个application

问题分析

经观察ResourceManager UI

与执行命令

HADOOP_USER_NAME=hdfs ./bin/spark-submit --master yarn --deploy-mode cluster --driver-memory 2g --executor-memory 2g --executor-cores 1 --queue default examples/src/main/python/pi.py 10

发现单个application申请的资源(内存、CPU)超过单个node上最大资源一半,导致没有足够资源供其余application运行,所以多个application同时运行时,后提交的application会等待有足够的资源时再运行。

解决方法

在Ambari中设置YARN的Memory和CPU

调整执行命令中的内存大小,使之不超过YARN配置中设置的大小,合理安排内存,Memory for Node / Application Memory = Num of Application

Note2

问题描述

HST Agent 无法启动

hst-agent.log

INFO 2017-09-30 11:55:06,287 security.py:178 - Server certificate not exists, downloading
INFO 2017-09-30 11:55:06,287 security.py:191 - Downloading server cert from https://slave2:9440/cert/ca/
ERROR 2017-09-30 11:55:06,345 ServerAPI.py:84 - GET https://slave2:9441/api/v1/hst_agents/slave2 failed. (SSLError(1, u'[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:579)'),)

原因

未注册并配置SmartSense Account