Source code for tasks.RGB.semantic_segmentation

from pathlib import Path
from typing import Optional, Callable, Union, Any, List

import numpy as np
import torch.nn as nn
import torch.optim
import torchmetrics
from pytorch_lightning.utilities import rank_zero_only

from src.datamodules.RGB.utils.output_tools import save_output_page_image
from src.datamodules.utils.misc import _get_argmax
from src.tasks.base_task import AbstractTask
from src.utils import utils
from src.tasks.utils.outputs import OutputKeys, reduce_dict

log = utils.get_logger(__name__)


[docs]class SemanticSegmentationRGB(AbstractTask):
    """
    Semantic Segmentation task for whole images that are RGB encoded, so the class is encoded in the color.
    The output for the test are also full images in the RGB format.

    :param model: The model to train, validate and test.
    :type model: nn.Module
    :param optimizer: The optimizer used during training.
    :type optimizer: torch.optim.Optimizer
    :param loss_fn: The loss function used during training, validation, and testing.
    :type loss_fn: Callable
    :param metric_train: The metric used during training.
    :type metric_train: torchmetrics.Metric
    :param metric_val: The metric used during validation.
    :type metric_val: torchmetrics.Metric
    :param metric_test: The metric used during testing.
    :type metric_test: torchmetrics.Metric
    :param confusion_matrix_val: Whether to compute the confusion matrix during validation.
    :type confusion_matrix_val: bool
    :param confusion_matrix_test: Whether to compute the confusion matrix during testing.
    :type confusion_matrix_test: bool
    :param confusion_matrix_log_every_n_epoch: The frequency of logging the confusion matrix.
    :type confusion_matrix_log_every_n_epoch: int
    :param lr: The learning rate.
    :type lr: float
    """

    def __init__(self,
                 model: nn.Module,
                 optimizer: torch.optim.Optimizer,
                 loss_fn: Optional[Callable] = None,
                 metric_train: Optional[torchmetrics.Metric] = None,
                 metric_val: Optional[torchmetrics.Metric] = None,
                 metric_test: Optional[torchmetrics.Metric] = None,
                 test_output_path: Optional[Union[str, Path]] = 'test_output',
                 predict_output_path: Optional[Union[str, Path]] = 'predict_output',
                 confusion_matrix_val: Optional[bool] = False,
                 confusion_matrix_test: Optional[bool] = False,
                 confusion_matrix_log_every_n_epoch: Optional[int] = 1,
                 lr: float = 1e-3
                 ) -> None:
        """
        Construction method for the SemanticSegmentationRGB task
        """
        super().__init__(
            model=model,
            optimizer=optimizer,
            loss_fn=loss_fn,
            metric_train=metric_train,
            metric_val=metric_val,
            metric_test=metric_test,
            test_output_path=test_output_path,
            predict_output_path=predict_output_path,
            lr=lr,
            confusion_matrix_val=confusion_matrix_val,
            confusion_matrix_test=confusion_matrix_test,
            confusion_matrix_log_every_n_epoch=confusion_matrix_log_every_n_epoch,
        )
        # self.save_hyperparameters()

[docs]    def setup(self, stage: str) -> None:
        super().setup(stage)

        if not hasattr(self.trainer.datamodule, 'get_output_filename_test'):
            raise NotImplementedError('DataModule needs to implement get_output_filename_test function')

        log.info("Setup done!")

[docs]    def forward(self, x):
        return self.model(x)

[docs]    @staticmethod
    def to_metrics_format(x: torch.Tensor, **kwargs) -> torch.Tensor:
        return _get_argmax(x, **kwargs)

    #############################################################################################
    ########################################### TRAIN ###########################################
    #############################################################################################
[docs]    def training_step(self, batch, batch_idx, **kwargs):
        input_batch, target_batch = batch
        output = super().training_step(batch=(input_batch, target_batch), batch_idx=batch_idx)
        return reduce_dict(input_dict=output, key_list=[OutputKeys.LOSS])

    #############################################################################################
    ############################################ VAL ############################################
    #############################################################################################

[docs]    def validation_step(self, batch, batch_idx, **kwargs):
        input_batch, target_batch = batch
        output = super().validation_step(batch=(input_batch, target_batch), batch_idx=batch_idx)
        return reduce_dict(input_dict=output, key_list=[])

    #############################################################################################
    ########################################### TEST ############################################
    #############################################################################################

[docs]    @rank_zero_only
    def on_test_start(self) -> None:
        # print output file list
        dataset = self.trainer.datamodule.test
        output_path = self.test_output_path
        info_filename = 'info_file_mapping.txt'

        self.write_file_mapping(output_file_list=dataset.output_file_list,
                                image_path_list=dataset.image_path_list,
                                output_path=output_path,
                                info_filename=info_filename)

[docs]    def test_step(self, batch, batch_idx, **kwargs):
        input_batch, target_batch, input_idx = batch
        output = super().test_step(batch=(input_batch, target_batch), batch_idx=batch_idx)

        if not hasattr(self.trainer.datamodule, 'get_output_filename_test'):
            raise NotImplementedError('Datamodule does not provide output info for test')

        for pred_raw, idx in zip(output[OutputKeys.PREDICTION].detach().cpu().numpy(),
                                 input_idx.detach().cpu().numpy()):
            img_name = self.trainer.datamodule.get_output_filename_test(idx)
            dest_folder = self.test_output_path / 'pred_raw'
            dest_folder.mkdir(parents=True, exist_ok=True)
            dest_filename = dest_folder / f'{img_name}.npy'
            np.save(file=str(dest_filename), arr=pred_raw)

            dest_folder = self.test_output_path / 'pred'
            dest_folder.mkdir(parents=True, exist_ok=True)
            save_output_page_image(image_name=f'{img_name}.gif', output_image=pred_raw,
                                   output_folder=dest_folder, class_encoding=self.trainer.datamodule.class_encodings)

        return reduce_dict(input_dict=output, key_list=[])

[docs]    def on_test_end(self) -> None:
        pass

    #############################################################################################
    ######################################### PREDICT ###########################################
    #############################################################################################

[docs]    @rank_zero_only
    def on_predict_start(self) -> None:
        # print output file list
        dataset = self.trainer.datamodule.predict
        output_path = self.predict_output_path
        info_filename = 'info_file_mapping.txt'

        self.write_file_mapping(output_file_list=dataset.output_file_list,
                                image_path_list=dataset.image_path_list,
                                output_path=output_path,
                                info_filename=info_filename)

[docs]    def predict_step(self, batch: Any, batch_idx: int, dataloader_idx: Optional[int] = None) -> Any:
        input_batch, input_idx = batch
        output = super().predict_step(batch=input_batch, batch_idx=batch_idx, dataloader_idx=dataloader_idx)

        if not hasattr(self.trainer.datamodule, 'get_output_filename_predict'):
            raise NotImplementedError('Datamodule does not provide output info for predict')

        for pred_raw, idx in zip(output[OutputKeys.PREDICTION].detach().cpu().numpy(),
                                 input_idx.detach().cpu().numpy()):
            img_name = self.trainer.datamodule.get_output_filename_predict(idx)
            dest_folder = self.predict_output_path / 'pred_raw'
            dest_folder.mkdir(parents=True, exist_ok=True)
            dest_filename = dest_folder / f'{img_name}.npy'
            np.save(file=str(dest_filename), arr=pred_raw)

            dest_folder = self.predict_output_path / 'pred'
            dest_folder.mkdir(parents=True, exist_ok=True)
            save_output_page_image(image_name=f'{img_name}.gif', output_image=pred_raw,
                                   output_folder=dest_folder, class_encoding=self.trainer.datamodule.class_encodings)

        return reduce_dict(input_dict=output, key_list=[])

[docs]    @staticmethod
    def write_file_mapping(output_file_list: List[str], image_path_list: List[Path],
                           output_path: Path, info_filename: str):
        assert len(output_file_list) == len(image_path_list)
        output_path.mkdir(parents=True, exist_ok=True)
        output_info_file = output_path / info_filename
        with output_info_file.open('w') as f:
            for output_filename, image_path in zip(output_file_list, image_path_list):
                f.write(f'{output_filename}\t{image_path}\n')