[每周知识碎片] 2
使用DistributedDataParallel ,在Ctrl C 退出后留下许多僵尸进程,kill之后显卡掉了,类似情况1, 2解决方法:使用ps aux|grep python查看python进程,然后按照顺序执行kill -9 PIDpytorch GPU显存优化策略https://www.jiqizhixin.com/articles/2018-10-17-...
·
解决方法:使用
ps aux|grep python
查看python进程,然后按照顺序执行
kill -9 PID
- pytorch GPU显存优化策略
- logger同时写入文件和控制台
https://discuss.pytorch.org/t/multiprocessing-failed-with-torch-distributed-launch-module/33056
- DDL(distributed data parallel) 中的rank和world size
https://pytorch.org/tutorials/intermediate/dist_tuto.html#initialization-methods
- ssh key 免密登录linux服务器
win cmd下输入命令:
ssh-keygen -t rsa
产生公钥(id_rsa.pub)和密钥(id_rsa)
然后将公钥上传到linux服务器的.ssh文件夹(没有需要创建),通过命令
cat id_rsa.pub >> authorized_keys
生成ssh key
更多推荐
已为社区贡献9条内容
所有评论(0)