lightning/pl_examples/multi_node_examples/README.md

# Multi-node example   

This demo launches a job using 2 GPUs on 2 different nodes (4 GPUs total).
To run this demo do the following:

1. Log into the jumphost node of your SLURM-managed cluster.  
2. Create a conda environment with Lightning and a GPU PyTorch version.   
3. Choose a script to submit    

#### DDP  
Submit this job to run with distributedDataParallel (2 nodes, 2 gpus each)
```bash
sbatch ddp_job_submit.sh YourEnv
```

#### DDP2  
Submit this job to run with a different implementation of distributedDataParallel.
In this version, each node acts like DataParallel but syncs across nodes like DDP.
```bash
sbatch ddp2_job_submit.sh YourEnv
```
cleaned up demos 2019-10-05 18:21:12 +00:00			`# Multi-node example`
Update README.md 2019-09-14 13:55:42 +00:00
Update README.md 2019-10-05 21:37:17 +00:00			`This demo launches a job using 2 GPUs on 2 different nodes (4 GPUs total).`
			`To run this demo do the following:`
Update README.md 2019-09-14 13:55:42 +00:00
cleaned up demos 2019-10-05 18:28:08 +00:00			`1. Log into the jumphost node of your SLURM-managed cluster.`
			`2. Create a conda environment with Lightning and a GPU PyTorch version.`
cleaning up demos (#313) * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos 2019-10-05 20:39:05 +00:00			`3. Choose a script to submit`

			`#### DDP`
			`Submit this job to run with distributedDataParallel (2 nodes, 2 gpus each)`
			```bash
			`sbatch ddp_job_submit.sh YourEnv`
			```

			`#### DDP2`
			`Submit this job to run with a different implementation of distributedDataParallel.`
			`In this version, each node acts like DataParallel but syncs across nodes like DDP.`
Updated distributed Demos (#215) * added simple cluster template * added simple cluster template * added simple cluster template * added simple cluster template * added simple cluster template * added simple cluster template * added simple cluster template * added simple cluster template * added simple cluster template * added simple cluster template * sets correct backend for possible combinations of gpu inputs * sets correct backend for possible combinations of gpu inputs * simple slurm example * simple slurm example * simple slurm example 2019-09-08 22:17:33 +00:00			```bash
cleaning up demos (#313) * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos * cleaning up demos 2019-10-05 20:39:05 +00:00			`sbatch ddp2_job_submit.sh YourEnv`
cleaning up demos (#312) * cleaning up demos * Update job_submit.sh * Update README.md 2019-10-05 18:48:22 +00:00			```