virtual-try-on2

Sleeping

App Files Files Community

virtual-try-on2 / TryYours-Virtual-Try-On /Graphonomy-master /exp /transfer /train_cihp_from_pascal.py

wizzseen

Upload 948 files

8a6df40 verified over 1 year ago

raw

history blame

13.5 kB

	import socket
	import timeit
	from datetime import datetime
	import os
	import sys
	import glob
	import numpy as np
	from collections import OrderedDict
	sys.path.append('../../')
	sys.path.append('../../networks/')
	# PyTorch includes
	import torch
	from torch.autograd import Variable
	import torch.optim as optim
	from torchvision import transforms
	from torch.utils.data import DataLoader
	from torchvision.utils import make_grid


	# Tensorboard include
	from tensorboardX import SummaryWriter

	# Custom includes
	from dataloaders import cihp
	from utils import util,get_iou_from_list
	from networks import deeplab_xception_transfer, graph
	from dataloaders import custom_transforms as tr

	#
	import argparse

	gpu_id = 0

	nEpochs = 100 # Number of epochs for training
	resume_epoch = 0 # Default is 0, change if want to resume

	def flip(x, dim):
	indices = [slice(None)] * x.dim()
	indices[dim] = torch.arange(x.size(dim) - 1, -1, -1,
	dtype=torch.long, device=x.device)
	return x[tuple(indices)]

	def flip_cihp(tail_list):
	'''

	:param tail_list: tail_list size is 1 x n_class x h x w
	:return:
	'''
	# tail_list = tail_list[0]
	tail_list_rev = [None] * 20
	for xx in range(14):
	tail_list_rev[xx] = tail_list[xx].unsqueeze(0)
	tail_list_rev[14] = tail_list[15].unsqueeze(0)
	tail_list_rev[15] = tail_list[14].unsqueeze(0)
	tail_list_rev[16] = tail_list[17].unsqueeze(0)
	tail_list_rev[17] = tail_list[16].unsqueeze(0)
	tail_list_rev[18] = tail_list[19].unsqueeze(0)
	tail_list_rev[19] = tail_list[18].unsqueeze(0)
	return torch.cat(tail_list_rev,dim=0)

	def get_parser():
	'''argparse begin'''
	parser = argparse.ArgumentParser()
	LookupChoices = type('', (argparse.Action,), dict(__call__=lambda a, p, n, v, o: setattr(n, a.dest, a.choices[v])))

	parser.add_argument('--epochs', default=100, type=int)
	parser.add_argument('--batch', default=16, type=int)
	parser.add_argument('--lr', default=1e-7, type=float)
	parser.add_argument('--numworker',default=12,type=int)
	parser.add_argument('--freezeBN', choices=dict(true=True, false=False), default=True, action=LookupChoices)
	parser.add_argument('--step', default=10, type=int)
	parser.add_argument('--classes', default=20, type=int)
	parser.add_argument('--testInterval', default=10, type=int)
	parser.add_argument('--loadmodel',default='',type=str)
	parser.add_argument('--pretrainedModel', default='', type=str)
	parser.add_argument('--hidden_layers',default=128,type=int)
	parser.add_argument('--gpus',default=4, type=int)

	opts = parser.parse_args()
	return opts

	def get_graphs(opts):
	adj2_ = torch.from_numpy(graph.cihp2pascal_nlp_adj).float()
	adj2 = adj2_.unsqueeze(0).unsqueeze(0).expand(opts.gpus, 1, 7, 20).transpose(2, 3).cuda()
	adj2_test = adj2_.unsqueeze(0).unsqueeze(0).expand(1, 1, 7, 20).transpose(2, 3)

	adj1_ = Variable(torch.from_numpy(graph.preprocess_adj(graph.pascal_graph)).float())
	adj3 = adj1_.unsqueeze(0).unsqueeze(0).expand(opts.gpus, 1, 7, 7).cuda()
	adj3_test = adj1_.unsqueeze(0).unsqueeze(0).expand(1, 1, 7, 7)

	# adj2 = torch.from_numpy(graph.cihp2pascal_adj).float()
	# adj2 = adj2.unsqueeze(0).unsqueeze(0).expand(opts.gpus, 1, 7, 20)
	cihp_adj = graph.preprocess_adj(graph.cihp_graph)
	adj3_ = Variable(torch.from_numpy(cihp_adj).float())
	adj1 = adj3_.unsqueeze(0).unsqueeze(0).expand(opts.gpus, 1, 20, 20).cuda()
	adj1_test = adj3_.unsqueeze(0).unsqueeze(0).expand(1, 1, 20, 20)
	train_graph = [adj1, adj2, adj3]
	test_graph = [adj1_test, adj2_test, adj3_test]
	return train_graph, test_graph


	def val_cihp(net_, testloader, testloader_flip, test_graph, epoch, writer, criterion, classes=20):
	adj1_test, adj2_test, adj3_test = test_graph
	num_img_ts = len(testloader)
	net_.eval()
	pred_list = []
	label_list = []
	running_loss_ts = 0.0
	miou = 0
	for ii, sample_batched in enumerate(zip(testloader, testloader_flip)):

	inputs, labels = sample_batched[0]['image'], sample_batched[0]['label']
	inputs_f, _ = sample_batched[1]['image'], sample_batched[1]['label']
	inputs = torch.cat((inputs, inputs_f), dim=0)
	# Forward pass of the mini-batch
	inputs, labels = Variable(inputs, requires_grad=False), Variable(labels)
	if gpu_id >= 0:
	inputs, labels = inputs.cuda(), labels.cuda()

	with torch.no_grad():
	outputs = net_.forward(inputs, adj1_test.cuda(), adj3_test.cuda(), adj2_test.cuda())
	# pdb.set_trace()
	outputs = (outputs[0] + flip(flip_cihp(outputs[1]), dim=-1)) / 2
	outputs = outputs.unsqueeze(0)
	predictions = torch.max(outputs, 1)[1]
	pred_list.append(predictions.cpu())
	label_list.append(labels.squeeze(1).cpu())
	loss = criterion(outputs, labels, batch_average=True)
	running_loss_ts += loss.item()
	# total_iou += utils.get_iou(predictions, labels)
	# Print stuff
	if ii % num_img_ts == num_img_ts - 1:
	# if ii == 10:
	miou = get_iou_from_list(pred_list, label_list, n_cls=classes)
	running_loss_ts = running_loss_ts / num_img_ts

	print('Validation:')
	print('[Epoch: %d, numImages: %5d]' % (epoch, ii * 1 + inputs.data.shape[0]))
	writer.add_scalar('data/test_loss_epoch', running_loss_ts, epoch)
	writer.add_scalar('data/test_miour', miou, epoch)
	print('Loss: %f' % running_loss_ts)
	print('MIoU: %f\n' % miou)


	def main(opts):
	p = OrderedDict() # Parameters to include in report
	p['trainBatch'] = opts.batch # Training batch size
	testBatch = 1 # Testing batch size
	useTest = True # See evolution of the test set when training
	nTestInterval = opts.testInterval # Run on test set every nTestInterval epochs
	snapshot = 1 # Store a model every snapshot epochs
	p['nAveGrad'] = 1 # Average the gradient of several iterations
	p['lr'] = opts.lr # Learning rate
	p['lrFtr'] = 1e-5
	p['lraspp'] = 1e-5
	p['lrpro'] = 1e-5
	p['lrdecoder'] = 1e-5
	p['lrother'] = 1e-5
	p['wd'] = 5e-4 # Weight decay
	p['momentum'] = 0.9 # Momentum
	p['epoch_size'] = opts.step # How many epochs to change learning rate
	p['num_workers'] = opts.numworker
	model_path = opts.pretrainedModel
	backbone = 'xception' # Use xception or resnet as feature extractor,
	nEpochs = opts.epochs

	max_id = 0
	save_dir_root = os.path.join(os.path.dirname(os.path.abspath(__file__)))
	exp_name = os.path.dirname(os.path.abspath(__file__)).split('/')[-1]
	runs = glob.glob(os.path.join(save_dir_root, 'run_cihp', 'run_*'))
	for r in runs:
	run_id = int(r.split('_')[-1])
	if run_id >= max_id:
	max_id = run_id + 1
	save_dir = os.path.join(save_dir_root, 'run_cihp', 'run_' + str(max_id))

	# Network definition
	if backbone == 'xception':
	net_ = deeplab_xception_transfer.deeplab_xception_transfer_projection_savemem(n_classes=opts.classes, os=16,
	hidden_layers=opts.hidden_layers, source_classes=7, )
	elif backbone == 'resnet':
	# net_ = deeplab_resnet.DeepLabv3_plus(nInputChannels=3, n_classes=7, os=16, pretrained=True)
	raise NotImplementedError
	else:
	raise NotImplementedError

	modelName = 'deeplabv3plus-' + backbone + '-voc'+datetime.now().strftime('%b%d_%H-%M-%S')
	criterion = util.cross_entropy2d

	if gpu_id >= 0:
	# torch.cuda.set_device(device=gpu_id)
	net_.cuda()

	# net load weights
	if not model_path == '':
	x = torch.load(model_path)
	net_.load_state_dict_new(x)
	print('load pretrainedModel:', model_path)
	else:
	print('no pretrainedModel.')
	if not opts.loadmodel =='':
	x = torch.load(opts.loadmodel)
	net_.load_source_model(x)
	print('load model:' ,opts.loadmodel)
	else:
	print('no model load !!!!!!!!')

	log_dir = os.path.join(save_dir, 'models', datetime.now().strftime('%b%d_%H-%M-%S') + '_' + socket.gethostname())
	writer = SummaryWriter(log_dir=log_dir)
	writer.add_text('load model',opts.loadmodel,1)
	writer.add_text('setting',sys.argv[0],1)

	if opts.freezeBN:
	net_.freeze_bn()

	# Use the following optimizer
	optimizer = optim.SGD(net_.parameters(), lr=p['lr'], momentum=p['momentum'], weight_decay=p['wd'])

	composed_transforms_tr = transforms.Compose([
	tr.RandomSized_new(512),
	tr.Normalize_xception_tf(),
	tr.ToTensor_()])

	composed_transforms_ts = transforms.Compose([
	tr.Normalize_xception_tf(),
	tr.ToTensor_()])

	composed_transforms_ts_flip = transforms.Compose([
	tr.HorizontalFlip(),
	tr.Normalize_xception_tf(),
	tr.ToTensor_()])

	voc_train = cihp.VOCSegmentation(split='train', transform=composed_transforms_tr, flip=True)
	voc_val = cihp.VOCSegmentation(split='val', transform=composed_transforms_ts)
	voc_val_flip = cihp.VOCSegmentation(split='val', transform=composed_transforms_ts_flip)

	trainloader = DataLoader(voc_train, batch_size=p['trainBatch'], shuffle=True, num_workers=p['num_workers'],drop_last=True)
	testloader = DataLoader(voc_val, batch_size=testBatch, shuffle=False, num_workers=p['num_workers'])
	testloader_flip = DataLoader(voc_val_flip, batch_size=testBatch, shuffle=False, num_workers=p['num_workers'])

	num_img_tr = len(trainloader)
	num_img_ts = len(testloader)
	running_loss_tr = 0.0
	running_loss_ts = 0.0
	aveGrad = 0
	global_step = 0
	print("Training Network")

	net = torch.nn.DataParallel(net_)
	train_graph, test_graph = get_graphs(opts)
	adj1, adj2, adj3 = train_graph


	# Main Training and Testing Loop
	for epoch in range(resume_epoch, nEpochs):
	start_time = timeit.default_timer()

	if epoch % p['epoch_size'] == p['epoch_size'] - 1:
	lr_ = util.lr_poly(p['lr'], epoch, nEpochs, 0.9)
	optimizer = optim.SGD(net_.parameters(), lr=lr_, momentum=p['momentum'], weight_decay=p['wd'])
	writer.add_scalar('data/lr_', lr_, epoch)
	print('(poly lr policy) learning rate: ', lr_)

	net.train()
	for ii, sample_batched in enumerate(trainloader):

	inputs, labels = sample_batched['image'], sample_batched['label']
	# Forward-Backward of the mini-batch
	inputs, labels = Variable(inputs, requires_grad=True), Variable(labels)
	global_step += inputs.data.shape[0]

	if gpu_id >= 0:
	inputs, labels = inputs.cuda(), labels.cuda()

	outputs = net.forward(inputs, adj1, adj3, adj2)

	loss = criterion(outputs, labels, batch_average=True)
	running_loss_tr += loss.item()

	# Print stuff
	if ii % num_img_tr == (num_img_tr - 1):
	running_loss_tr = running_loss_tr / num_img_tr
	writer.add_scalar('data/total_loss_epoch', running_loss_tr, epoch)
	print('[Epoch: %d, numImages: %5d]' % (epoch, ii * p['trainBatch'] + inputs.data.shape[0]))
	print('Loss: %f' % running_loss_tr)
	running_loss_tr = 0
	stop_time = timeit.default_timer()
	print("Execution time: " + str(stop_time - start_time) + "\n")

	# Backward the averaged gradient
	loss /= p['nAveGrad']
	loss.backward()
	aveGrad += 1

	# Update the weights once in p['nAveGrad'] forward passes
	if aveGrad % p['nAveGrad'] == 0:
	writer.add_scalar('data/total_loss_iter', loss.item(), ii + num_img_tr * epoch)
	optimizer.step()
	optimizer.zero_grad()
	aveGrad = 0

	# Show 10 * 3 images results each epoch
	if ii % (num_img_tr // 10) == 0:
	grid_image = make_grid(inputs[:3].clone().cpu().data, 3, normalize=True)
	writer.add_image('Image', grid_image, global_step)
	grid_image = make_grid(util.decode_seg_map_sequence(torch.max(outputs[:3], 1)[1].detach().cpu().numpy()), 3, normalize=False,
	range=(0, 255))
	writer.add_image('Predicted label', grid_image, global_step)
	grid_image = make_grid(util.decode_seg_map_sequence(torch.squeeze(labels[:3], 1).detach().cpu().numpy()), 3, normalize=False, range=(0, 255))
	writer.add_image('Groundtruth label', grid_image, global_step)
	print('loss is ', loss.cpu().item(), flush=True)

	# Save the model
	if (epoch % snapshot) == snapshot - 1:
	torch.save(net_.state_dict(), os.path.join(save_dir, 'models', modelName + '_epoch-' + str(epoch) + '.pth'))
	print("Save model at {}\n".format(os.path.join(save_dir, 'models', modelName + '_epoch-' + str(epoch) + '.pth')))

	torch.cuda.empty_cache()

	# One testing epoch
	if useTest and epoch % nTestInterval == (nTestInterval - 1):
	val_cihp(net_,testloader=testloader, testloader_flip=testloader_flip, test_graph=test_graph,
	epoch=epoch,writer=writer,criterion=criterion, classes=opts.classes)
	torch.cuda.empty_cache()




	if __name__ == '__main__':
	opts = get_parser()
	main(opts)