与HortonWorks或Cloudera不同,AWS EMR似乎没有提供任何图形用户界面来更改各种hadoop生态系统框架的xml配置。
登录到我的EMR namenode并快速
find \ -iname yarn-site.xml
我发现它位于/etc/hadoop/conf.empty/yarn-site.xml
,而capacity-scheduler位于/etc/hadoop/conf.empty/capacity-scheduler.xml
。
但请注意这些是如何在conf.empty下的,我怀疑这些可能不是yarn-site和capacity-scheduler xmls的实际位置。
我知道我可以在创建集群时更改这些配置,但我需要知道的是如何能够在不拆分集群的情况下更改它们。
我只是想尝试一下调度属性之类的,并尝试不同的调度程序,以确定哪些可能适用于我的spark应用程序。
提前感谢!
发布于 2017-04-17 05:32:51
那么,yarn-site.xml
和capacity-scheduler.xml
确实位于正确的位置(/etc/hadoop/conf.empty/
),并且在运行的集群上,在主节点上编辑它们并重新启动YARN RM守护进程将更改调度程序。
在启动新集群时,您可以使用EMR Configurations API
更改适当的值。http://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-configure-apps.html
例如:在配置中为电子病历在capacity-scheduler and yarn-site classifications
中指定适当的值,以便在相应的XML文件中更改这些值。
编辑:2019年9月4日:使用Amazon EMR版本5.21.0及更高版本,您可以覆盖群集配置,并为正在运行的群集中的每个实例组指定其他配置分类。您可以使用Amazon EMR控制台、AWS命令行界面(AWS CLI)或AWS SDK来执行此操作。
请参阅https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-configure-apps-running-cluster.html
https://stackoverflow.com/questions/43404236
复制相似问题