lightning/.azure/gpu-benchmarks.yml

# Python package
# Create and test a Python package on multiple Python versions.
# Add steps that analyze code, save the dist with the build record, publish to a PyPI-compatible index, and more:
# https://docs.microsoft.com/azure/devops/pipelines/languages/python

trigger:
  tags:
    include: ["*"]
  branches:
    include:
      - "master"
      - "release/*"
      - "refs/tags/*"

pr:
  branches:
    include:
      - "master"
      - "release/*"
  paths:
    include:
      - ".azure/gpu-benchmarks.yml"
      - "requirements/fabric/**"
      - "requirements/pytorch/**"
      - "src/lightning/fabric/**"
      - "src/lightning/pytorch/**"
      - "tests/parity_fabric/**"
      - "tests/parity_pytorch/**"
    exclude:
      - "requirements/*/docs.txt"
      - "*.md"
      - "**/*.md"

schedules:
  - cron: "0 0 * * *" # At the end of every day
    displayName: Daily midnight benchmark
    branches:
      include:
        - "master"

jobs:
  - job: benchmarks
    timeoutInMinutes: "90"
    cancelTimeoutInMinutes: "2"
    pool: lit-rtx-3090
    variables:
      DEVICES: $( python -c 'print("$(Agent.Name)".split("_")[-1])' )
    container:
      # TODO: Upgrade to Python 3.11
      image: "pytorchlightning/pytorch_lightning:base-cuda-py3.10-torch2.2-cuda12.1.0"
      options: "--gpus=all --shm-size=32g"
    strategy:
      matrix:
        "pkg: Fabric":
          PACKAGE_NAME: "fabric"
        "pkg: Pytorch":
          PACKAGE_NAME: "pytorch"
    workspace:
      clean: all

    steps:
      - bash: |
          echo "##vso[task.setvariable variable=CUDA_VISIBLE_DEVICES]$(DEVICES)"
          cuda_ver=$(python -c "import torch ; print(''.join(map(str, torch.version.cuda.split('.')[:2])))")
          echo "##vso[task.setvariable variable=TORCH_URL]https://download.pytorch.org/whl/cu${cuda_ver}/torch_stable.html"
        displayName: "set env. vars"

      - bash: |
          echo $CUDA_VISIBLE_DEVICES
          echo $TORCH_URL
          whereis nvidia
          nvidia-smi
          which python && which pip
          python --version
          pip --version
          pip list
        displayName: "Image info & NVIDIA"

      - bash: pip install -e .[dev] --find-links ${TORCH_URL}
        env:
          FREEZE_REQUIREMENTS: "1"
        displayName: "Install package"

      - bash: |
          set -e
          python requirements/collect_env_details.py
          python -c "import torch ; mgpu = torch.cuda.device_count() ; assert mgpu == 2, f'GPU: {mgpu}'"
        displayName: "Env details"

      - bash: |
          pip install -q -r .actions/requirements.txt
          python .actions/assistant.py copy_replace_imports --source_dir="./tests" \
            --source_import="lightning.fabric,lightning.pytorch" \
            --target_import="lightning_fabric,pytorch_lightning"
        displayName: "Adjust tests"

      - bash: python -m pytest parity_$(PACKAGE_NAME) -v --durations=0
        env:
          PL_RUNNING_BENCHMARKS: "1"
          PL_RUN_CUDA_TESTS: "1"
        workingDirectory: tests/
        displayName: "Testing: benchmarks"

      - bash: bash run_standalone_tasks.sh
        workingDirectory: tests/parity_fabric
        # without succeeded this could run even if the job has already failed
        condition: and(succeeded(), eq(variables['PACKAGE_NAME'], 'fabric'))
        env:
          PL_RUN_CUDA_TESTS: "1"
        displayName: "Testing: fabric standalone tasks"
        timeoutInMinutes: "10"
Disable benchmark ci on PRs (#9430) Co-authored-by: Jirka <jirka.borovec@seznam.cz> 2021-09-10 11:30:44 +00:00			`# Python package`
			`# Create and test a Python package on multiple Python versions.`
			`# Add steps that analyze code, save the dist with the build record, publish to a PyPI-compatible index, and more:`
			`# https://docs.microsoft.com/azure/devops/pipelines/languages/python`

			`trigger:`
			`tags:`
precommit: unify formatting with prettier (#18605) Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-09-25 12:34:41 +00:00			`include: ["*"]`
Disable benchmark ci on PRs (#9430) Co-authored-by: Jirka <jirka.borovec@seznam.cz> 2021-09-10 11:30:44 +00:00			`branches:`
			`include:`
			`- "master"`
			`- "release/*"`
			`- "refs/tags/*"`

ci: update install lite & cut pkg dependency (#14517) * ci: update install lite * try without lite in req file * ci: install * app * init * Revert "app" This reverts commit f3f09e7888163db9730012c9efd35d8f2617a0cf. * ci: cpu * ci: gpu * pkg * env * bench * trigger * notes * prune * set version * fix version * git reset * hpu, ipu * adjust * --hard * git checkout * Apply suggestions from code review Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> Co-authored-by: Akihiro Nitta <nitta@akihironitta.com> * rc2 * L * docs * hpu Co-authored-by: awaelchli <aedu.waelchli@gmail.com> Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> Co-authored-by: Akihiro Nitta <nitta@akihironitta.com> Co-authored-by: Luca Antiga <luca.antiga@gmail.com> 2022-10-31 19:50:51 +00:00			`pr:`
			`branches:`
			`include:`
			`- "master"`
			`- "release/*"`
			`paths:`
			`include:`
ci: update gcheck name (#17690) * ci: update gcheck name * name * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * name --------- Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-05-25 16:20:43 +00:00			`- ".azure/gpu-benchmarks.yml"`
ci: separate parity/benchmarks (#17502) * ci: separet benchmarks * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * measure * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * conf * isort * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * ci * parity * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * taska * name * ... * var * ... * ... * ... * cd * reset_cudnn_benchmark * import * imports * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * models * xfail --------- Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-05-24 23:16:41 +00:00			`- "requirements/fabric/**"`
Refactor checkgroup to avoid duplicated checks (#15633) Co-authored-by: Akihiro Nitta <nitta@akihironitta.com> Co-authored-by: Jirka Borovec <6035284+Borda@users.noreply.github.com> 2022-11-11 16:38:09 +00:00			`- "requirements/pytorch/**"`
ci: separate parity/benchmarks (#17502) * ci: separet benchmarks * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * measure * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * conf * isort * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * ci * parity * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * taska * name * ... * var * ... * ... * ... * cd * reset_cudnn_benchmark * import * imports * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * models * xfail --------- Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-05-24 23:16:41 +00:00			`- "src/lightning/fabric/**"`
			`- "src/lightning/pytorch/**"`
			`- "tests/parity_fabric/**"`
			`- "tests/parity_pytorch/**"`
Fix azure path excludes (#15756) Co-authored-by: Jirka Borovec <6035284+Borda@users.noreply.github.com> 2022-11-22 01:25:01 +00:00			`exclude:`
Checkgroup config fixes (#15787) 2022-11-26 01:16:48 +00:00			`- "requirements/*/docs.txt"`
Fix azure path excludes (#15756) Co-authored-by: Jirka Borovec <6035284+Borda@users.noreply.github.com> 2022-11-22 01:25:01 +00:00			`- "*.md"`
			`- "*/.md"`
Disable benchmark ci on PRs (#9430) Co-authored-by: Jirka <jirka.borovec@seznam.cz> 2021-09-10 11:30:44 +00:00
CI: validate JSON & fix benchmark (#8567) * CI: validate JSON * as GHA * PT1.8 * 32g Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> 2021-07-28 16:09:15 +00:00			`schedules:`
			`- cron: "0 0 * * *" # At the end of every day`
			`displayName: Daily midnight benchmark`
			`branches:`
			`include:`
			`- "master"`
Parity test (#7832) Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> Co-authored-by: Jirka <jirka.borovec@seznam.cz> Co-authored-by: Jirka Borovec <Borda@users.noreply.github.com> 2021-07-20 21:23:53 +00:00
			`jobs:`
CI: validate JSON & fix benchmark (#8567) * CI: validate JSON * as GHA * PT1.8 * 32g Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> 2021-07-28 16:09:15 +00:00			`- job: benchmarks`
			`timeoutInMinutes: "90"`
			`cancelTimeoutInMinutes: "2"`
ci: update install lite & cut pkg dependency (#14517) * ci: update install lite * try without lite in req file * ci: install * app * init * Revert "app" This reverts commit f3f09e7888163db9730012c9efd35d8f2617a0cf. * ci: cpu * ci: gpu * pkg * env * bench * trigger * notes * prune * set version * fix version * git reset * hpu, ipu * adjust * --hard * git checkout * Apply suggestions from code review Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> Co-authored-by: Akihiro Nitta <nitta@akihironitta.com> * rc2 * L * docs * hpu Co-authored-by: awaelchli <aedu.waelchli@gmail.com> Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> Co-authored-by: Akihiro Nitta <nitta@akihironitta.com> Co-authored-by: Luca Antiga <luca.antiga@gmail.com> 2022-10-31 19:50:51 +00:00			`pool: lit-rtx-3090`
			`variables:`
			`DEVICES: $( python -c 'print("$(Agent.Name)".split("_")[-1])' )`
Parity test (#7832) Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> Co-authored-by: Jirka <jirka.borovec@seznam.cz> Co-authored-by: Jirka Borovec <Borda@users.noreply.github.com> 2021-07-20 21:23:53 +00:00			`container:`
Update CI to use latest PyTorch 2.2 (#19401) 2024-02-05 17:50:23 +00:00			`# TODO: Upgrade to Python 3.11`
			`image: "pytorchlightning/pytorch_lightning:base-cuda-py3.10-torch2.2-cuda12.1.0"`
ci: update install lite & cut pkg dependency (#14517) * ci: update install lite * try without lite in req file * ci: install * app * init * Revert "app" This reverts commit f3f09e7888163db9730012c9efd35d8f2617a0cf. * ci: cpu * ci: gpu * pkg * env * bench * trigger * notes * prune * set version * fix version * git reset * hpu, ipu * adjust * --hard * git checkout * Apply suggestions from code review Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> Co-authored-by: Akihiro Nitta <nitta@akihironitta.com> * rc2 * L * docs * hpu Co-authored-by: awaelchli <aedu.waelchli@gmail.com> Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> Co-authored-by: Akihiro Nitta <nitta@akihironitta.com> Co-authored-by: Luca Antiga <luca.antiga@gmail.com> 2022-10-31 19:50:51 +00:00			`options: "--gpus=all --shm-size=32g"`
ci: separate parity/benchmarks (#17502) * ci: separet benchmarks * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * measure * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * conf * isort * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * ci * parity * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * taska * name * ... * var * ... * ... * ... * cd * reset_cudnn_benchmark * import * imports * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * models * xfail --------- Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-05-24 23:16:41 +00:00			`strategy:`
			`matrix:`
precommit: unify formatting with prettier (#18605) Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-09-25 12:34:41 +00:00			`"pkg: Fabric":`
ci: separate parity/benchmarks (#17502) * ci: separet benchmarks * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * measure * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * conf * isort * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * ci * parity * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * taska * name * ... * var * ... * ... * ... * cd * reset_cudnn_benchmark * import * imports * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * models * xfail --------- Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-05-24 23:16:41 +00:00			`PACKAGE_NAME: "fabric"`
precommit: unify formatting with prettier (#18605) Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-09-25 12:34:41 +00:00			`"pkg: Pytorch":`
ci: separate parity/benchmarks (#17502) * ci: separet benchmarks * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * measure * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * conf * isort * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * ci * parity * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * taska * name * ... * var * ... * ... * ... * cd * reset_cudnn_benchmark * import * imports * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * models * xfail --------- Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-05-24 23:16:41 +00:00			`PACKAGE_NAME: "pytorch"`
Parity test (#7832) Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> Co-authored-by: Jirka <jirka.borovec@seznam.cz> Co-authored-by: Jirka Borovec <Borda@users.noreply.github.com> 2021-07-20 21:23:53 +00:00			`workspace:`
			`clean: all`

			`steps:`
precommit: unify formatting with prettier (#18605) Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-09-25 12:34:41 +00:00			`- bash: \|`
			`echo "##vso[task.setvariable variable=CUDA_VISIBLE_DEVICES]$(DEVICES)"`
			`cuda_ver=$(python -c "import torch ; print(''.join(map(str, torch.version.cuda.split('.')[:2])))")`
			`echo "##vso[task.setvariable variable=TORCH_URL]https://download.pytorch.org/whl/cu${cuda_ver}/torch_stable.html"`
			`displayName: "set env. vars"`
Future 1/n: package in src/ folder (#13293) * move: pytorch_lightning >> src/ * update setup & install * update CI * ci * update CI for examples * Self review * mypy Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> * ci * make * docs * typo * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * ci: gpu * . * hpu * typing * docs * tpu Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2022-06-15 00:54:55 +00:00
precommit: unify formatting with prettier (#18605) Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-09-25 12:34:41 +00:00			`- bash: \|`
			`echo $CUDA_VISIBLE_DEVICES`
			`echo $TORCH_URL`
			`whereis nvidia`
			`nvidia-smi`
			`which python && which pip`
			`python --version`
			`pip --version`
			`pip list`
			`displayName: "Image info & NVIDIA"`
ci: update install lite & cut pkg dependency (#14517) * ci: update install lite * try without lite in req file * ci: install * app * init * Revert "app" This reverts commit f3f09e7888163db9730012c9efd35d8f2617a0cf. * ci: cpu * ci: gpu * pkg * env * bench * trigger * notes * prune * set version * fix version * git reset * hpu, ipu * adjust * --hard * git checkout * Apply suggestions from code review Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> Co-authored-by: Akihiro Nitta <nitta@akihironitta.com> * rc2 * L * docs * hpu Co-authored-by: awaelchli <aedu.waelchli@gmail.com> Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> Co-authored-by: Akihiro Nitta <nitta@akihironitta.com> Co-authored-by: Luca Antiga <luca.antiga@gmail.com> 2022-10-31 19:50:51 +00:00
precommit: unify formatting with prettier (#18605) Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-09-25 12:34:41 +00:00			`- bash: pip install -e .[dev] --find-links ${TORCH_URL}`
			`env:`
			`FREEZE_REQUIREMENTS: "1"`
			`displayName: "Install package"`
Upgrade GPU CI to PyTorch 1.13 (#15583) Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> Co-authored-by: Jirka <jirka.borovec@seznam.cz> 2022-11-12 14:58:37 +00:00
precommit: unify formatting with prettier (#18605) Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-09-25 12:34:41 +00:00			`- bash: \|`
			`set -e`
			`python requirements/collect_env_details.py`
			`python -c "import torch ; mgpu = torch.cuda.device_count() ; assert mgpu == 2, f'GPU: {mgpu}'"`
			`displayName: "Env details"`
Future 1/n: package in src/ folder (#13293) * move: pytorch_lightning >> src/ * update setup & install * update CI * ci * update CI for examples * Self review * mypy Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> * ci * make * docs * typo * [pre-commit.ci] auto fixes from pre-commit.com hooks for more information, see https://pre-commit.ci * ci: gpu * . * hpu * typing * docs * tpu Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2022-06-15 00:54:55 +00:00
precommit: unify formatting with prettier (#18605) Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-09-25 12:34:41 +00:00			`- bash: \|`
			`pip install -q -r .actions/requirements.txt`
			`python .actions/assistant.py copy_replace_imports --source_dir="./tests" \`
			`--source_import="lightning.fabric,lightning.pytorch" \`
			`--target_import="lightning_fabric,pytorch_lightning"`
			`displayName: "Adjust tests"`
Upgrade GPU CI to PyTorch 1.13 (#15583) Co-authored-by: Carlos Mocholí <carlossmocholi@gmail.com> Co-authored-by: Jirka <jirka.borovec@seznam.cz> 2022-11-12 14:58:37 +00:00
precommit: unify formatting with prettier (#18605) Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-09-25 12:34:41 +00:00			`- bash: python -m pytest parity_$(PACKAGE_NAME) -v --durations=0`
			`env:`
			`PL_RUNNING_BENCHMARKS: "1"`
			`PL_RUN_CUDA_TESTS: "1"`
			`workingDirectory: tests/`
			`displayName: "Testing: benchmarks"`
tests: switch imports for fabric (#16592) 2023-02-01 20:34:38 +00:00
precommit: unify formatting with prettier (#18605) Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com> 2023-09-25 12:34:41 +00:00			`- bash: bash run_standalone_tasks.sh`
			`workingDirectory: tests/parity_fabric`
			`# without succeeded this could run even if the job has already failed`
			`condition: and(succeeded(), eq(variables['PACKAGE_NAME'], 'fabric'))`
			`env:`
			`PL_RUN_CUDA_TESTS: "1"`
			`displayName: "Testing: fabric standalone tasks"`
			`timeoutInMinutes: "10"`