lightning/pytorch_lightning/trainer/training_tricks_mixin.py

import torch
import logging
from pytorch_lightning.callbacks import GradientAccumulationScheduler


class TrainerTrainingTricksMixin(object):

    def clip_gradients(self):
        if self.gradient_clip_val > 0:
            model = self.get_model()
            torch.nn.utils.clip_grad_norm_(model.parameters(), self.gradient_clip_val)

    def print_nan_gradients(self):
        model = self.get_model()
        for param in model.parameters():
            if (param.grad is not None) and torch.isnan(param.grad.float()).any():
                logging.info(param, param.grad)

    def configure_accumulated_gradients(self, accumulate_grad_batches):
        self.accumulate_grad_batches = None

        if isinstance(accumulate_grad_batches, dict):
            self.accumulation_scheduler = GradientAccumulationScheduler(accumulate_grad_batches)
        elif isinstance(accumulate_grad_batches, int):
            schedule = {1: accumulate_grad_batches}
            self.accumulation_scheduler = GradientAccumulationScheduler(schedule)
        else:
            raise TypeError("Gradient accumulation supports only int and dict types")
Refactor (#407) * moved dp, ddp outside of trainer * added main mixins * finished major mixin refactor * flake8 * finished major mixin refactor * finished major mixin refactor * finished major mixin refactor * finished major mixin refactor * finished major mixin refactor * finished major mixin refactor * finished major mixin refactor 2019-10-22 01:16:51 +00:00			`import torch`
change print to logging (#457) * change print to logging * always use logging.info * use f-strings * update code style * set logging configs * remove unused code 2019-11-05 13:43:21 +00:00			`import logging`
Refactor (#407) * moved dp, ddp outside of trainer * added main mixins * finished major mixin refactor * flake8 * finished major mixin refactor * finished major mixin refactor * finished major mixin refactor * finished major mixin refactor * finished major mixin refactor * finished major mixin refactor * finished major mixin refactor 2019-10-22 01:16:51 +00:00			`from pytorch_lightning.callbacks import GradientAccumulationScheduler`


			`class TrainerTrainingTricksMixin(object):`

			`def clip_gradients(self):`
			`if self.gradient_clip_val > 0:`
			`model = self.get_model()`
			`torch.nn.utils.clip_grad_norm_(model.parameters(), self.gradient_clip_val)`

			`def print_nan_gradients(self):`
			`model = self.get_model()`
			`for param in model.parameters():`
filter param with no grad (#579) 2019-12-04 12:04:58 +00:00			`if (param.grad is not None) and torch.isnan(param.grad.float()).any():`
change print to logging (#457) * change print to logging * always use logging.info * use f-strings * update code style * set logging configs * remove unused code 2019-11-05 13:43:21 +00:00			`logging.info(param, param.grad)`
Refactor (#407) * moved dp, ddp outside of trainer * added main mixins * finished major mixin refactor * flake8 * finished major mixin refactor * finished major mixin refactor * finished major mixin refactor * finished major mixin refactor * finished major mixin refactor * finished major mixin refactor * finished major mixin refactor 2019-10-22 01:16:51 +00:00
			`def configure_accumulated_gradients(self, accumulate_grad_batches):`
			`self.accumulate_grad_batches = None`

			`if isinstance(accumulate_grad_batches, dict):`
			`self.accumulation_scheduler = GradientAccumulationScheduler(accumulate_grad_batches)`
			`elif isinstance(accumulate_grad_batches, int):`
			`schedule = {1: accumulate_grad_batches}`
			`self.accumulation_scheduler = GradientAccumulationScheduler(schedule)`
			`else:`
			`raise TypeError("Gradient accumulation supports only int and dict types")`