Spaces:

SIAT-RZJS
/

Ultrasound_Report_Generation

Sleeping

App Files Files Community

Ultrasound_Report_Generation / KMVE_RG /models /SGF_model.py

SIAT-RZJS

Upload 187 files

3b2b066 verified 10 months ago

raw

history blame contribute delete

2.2 kB

	import torch
	import torch.nn as nn
	import numpy as np

	import sys

	sys.path.append('../')
	from KMVE_RG.modules.visual_extractor import VisualExtractor
	from KMVE_RG.modules.encoder_decoder import EncoderDecoder
	from KMVE_RG.modules.new_model_utils import classfication


	class SGF(nn.Module):
	def __init__(self, args, tokenizer):
	super(SGF, self).__init__()
	self.args = args
	self.tokenizer = tokenizer
	self.visual_extractor = VisualExtractor(args)
	self.encoder_decoder = EncoderDecoder(args, tokenizer)
	self.classfication_layers = classfication(distiller_num = self.args.distiller_num)
	print('vocabulary size:', self.tokenizer.get_vocab_size())
	# self.forward = self._forward_inference

	def __str__(self):
	model_parameters = filter(lambda p: p.requires_grad, self.parameters())
	params = sum([np.prod(p.size()) for p in model_parameters])
	return super().__str__() + '\nTrainable parameters: {}'.format(params)

	def forward(self, images, targets=None, mode='train'):
	att_feats_0, fc_feats_0, _, kmve_0 = self.visual_extractor(images[:, 0])
	att_feats_1, fc_feats_1, _, kmve_1 = self.visual_extractor(images[:, 1])
	fc_feats = torch.cat((fc_feats_0, fc_feats_1), dim=1)
	att_feats = torch.cat((att_feats_0, att_feats_1), dim=1)
	kmve = torch.cat((kmve_0, kmve_1), dim=1)
	if mode == 'train':
	output, _ = self.encoder_decoder(fc_feats, att_feats, targets, mode='forward')
	kmve_output = self.classfication_layers(kmve)
	return output, kmve_output
	elif mode == 'sample':
	output, _ = self.encoder_decoder(fc_feats, att_feats, mode='sample')
	kmve_output = self.classfication_layers(kmve)
	elif mode == 'evaluate':
	output, first_sentence, first_attmap, first_sentence_probs = \
	self.encoder_decoder(fc_feats, att_feats, mode='evaluate')
	kmve_output = self.classfication_layers(kmve)
	return output, kmve_output, first_sentence, first_attmap, first_sentence_probs
	else:
	raise ValueError
	return output, kmve_output