Handle the case with no queries in `GPUStatsMonitor` (#9014)

Co-authored-by: Michele Sanna <{ID}+{username}@users.noreply.github.com> Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> Co-authored-by: Carlos Mocholi <carlossmocholi@gmail.com>
2021-08-21 05:22:33 +02:00 · 2021-08-21 05:22:33 +02:00 · 9ff0c22e43
parent e1442d247e
commit 9ff0c22e43
2 changed files with 34 additions and 0 deletions
--- a/pytorch_lightning/callbacks/gpu_stats_monitor.py
+++ b/pytorch_lightning/callbacks/gpu_stats_monitor.py
@ -187,6 +187,9 @@ class GPUStatsMonitor(Callback):
        return [cuda_visible_devices[device_id].strip() for device_id in device_ids]
    def _get_gpu_stats(self, queries: List[str]) -> List[List[float]]:
        if not queries:
            return []
        """Run nvidia-smi to get the gpu stats"""
        gpu_query = ",".join(queries)
        format = "csv,nounits,noheader"
--- a/tests/callbacks/test_gpu_stats_monitor.py
+++ b/tests/callbacks/test_gpu_stats_monitor.py
@ -63,6 +63,37 @@ def test_gpu_stats_monitor(tmpdir):
        assert any(f in h for h in met_data.dtype.names)
@RunIf(min_gpus=1)
 def test_gpu_stats_monitor_no_queries(tmpdir):
    """
    Test GPU logger doesn't fail if no "nvidia-smi" queries are to be performed.
    """
    model = BoringModel()
    gpu_stats = GPUStatsMonitor(
        memory_utilization=False,
        gpu_utilization=False,
        intra_step_time=True,
        inter_step_time=True,
    )
    trainer = Trainer(
        default_root_dir=tmpdir,
        max_epochs=1,
        limit_train_batches=2,
        limit_val_batches=0,
        log_every_n_steps=1,
        gpus=1,
        callbacks=[gpu_stats],
    )
    with mock.patch("pytorch_lightning.loggers.tensorboard.TensorBoardLogger.log_metrics") as log_metrics_mock:
        trainer.fit(model)
    assert log_metrics_mock.mock_calls[2:] == [
        mock.call({"batch_time/intra_step (ms)": mock.ANY}, step=0),
        mock.call({"batch_time/inter_step (ms)": mock.ANY}, step=1),
        mock.call({"batch_time/intra_step (ms)": mock.ANY}, step=1),
    ]
@pytest.mark.skipif(torch.cuda.is_available(), reason="test requires CPU machine")
 def test_gpu_stats_monitor_cpu_machine(tmpdir):
    """