Spaces:

sunit333
/

demo-summary-hindi

No application file

App Files Files Community

demo-summary-hindi / Indic-BERT-v1-master /fine_tune /modules /text_classification.py

sunit333

Upload 63 files

d08dd00 verified 8 months ago

raw

history blame contribute delete

2.23 kB

	"""
	Code inspired from the Huggingface's transformer library:
	File path: transformers/examples/text-classification/run_pl_glue.py

	To handle large documents, we use head-truncation. Check the following
	paper for a detailed analysis of text classification techniques using
	bert-like models: https://arxiv.org/pdf/1905.05583.pdf
	"""

	import argparse
	import glob
	import logging
	import os
	import time

	import numpy as np
	import torch
	from torch.utils.data import DataLoader, TensorDataset

	from .base import BaseModule, create_trainer
	from .utils import mean_accuracy


	logger = logging.getLogger(__name__)


	class TextClassification(BaseModule):

	mode = 'sequence-classification'
	output_mode = 'classification'
	example_type = 'text'

	def __init__(self, hparams):
	super().__init__(hparams)

	def _eval_end(self, outputs):
	val_loss_mean = torch.stack([x['val_loss'] for x in outputs])\
	.mean().detach().cpu().item()
	preds = np.concatenate([x['pred'] for x in outputs], axis=0)
	preds = np.argmax(preds, axis=1)

	out_label_ids = np.concatenate([x['target'] for x in outputs], axis=0)
	out_label_list = [[] for _ in range(out_label_ids.shape[0])]
	preds_list = [[] for _ in range(out_label_ids.shape[0])]

	results = {**{'val_loss': val_loss_mean},
	**mean_accuracy(preds, out_label_ids)}

	ret = {k: v for k, v in results.items()}
	ret['log'] = results
	return ret, preds_list, out_label_list

	def validation_epoch_end(self, outputs: list) -> dict:
	ret, preds, targets = self._eval_end(outputs)
	logs = ret['log']
	return {'val_loss': logs['val_loss'], 'log': logs, 'progress_bar': logs}

	def test_epoch_end(self, outputs):
	ret, predictions, targets = self._eval_end(outputs)

	# Converting to the dic required by pl
	logs = ret['log']
	# `val_loss` is the key returned by `self._eval_end()`
	# but actually refers to `test_loss`
	return {'avg_test_loss': logs['val_loss'],
	'log': logs, 'progress_bar': logs}

	@staticmethod
	def add_model_specific_args(parser, root_dir):
	return parser