我一直在使用PaperMill定期执行我的python记事本。要执行计算密集型笔记本,我需要连接到运行在EMR集群中的远程内核。
在木星笔记本的情况下,我可以通过使用jupyter notebook --gateway-url=http://my-gateway-server:8888
启动Jupyter服务器来做到这一点,并且我能够在远程内核上执行我的代码。但是如何让本地python代码(通过PaperMill)使用远程内核呢?在内核管理器中进行什么更改以连接到远程内核?
我能找到的一个相关答案是这里。这建议将端口转发到远程服务器,并使用来自服务器的连接文件初始化KernelManager。我无法做到这一点,因为blockingkernelmanager
已经不在Ipython.zmp中了,我也更喜欢HTTP连接,就像jupyter那样。
发布于 2020-02-06 04:09:18
Hacky方法-设置一个shell脚本来执行以下操作:
hadoop
用户在EMR主节点上创建python环境如果集群主节点每次都是相同的,则步骤1和步骤2是一次要求。
--稍微好一点的方法:
我正在为不同的用例使用这两种方法,它们目前看来都很好。
https://stackoverflow.com/questions/59977601
复制