Spaces:

harrycool12
/

Misconception1

Sleeping

App Files Files Community

Misconception1 / loss_utils.py

harrycool12

Upload 10 files

0f5c20a verified 17 days ago

raw

history blame contribute delete

3.78 kB

	import torch


	def get_local_score(q_reps, p_reps, all_scores):
	"""获取 queries 和 passages 的局部得分。

	Args:
	q_reps (torch.Tensor): queries 的表示。
	p_reps (torch.Tensor): passages 的表示。
	all_scores (torch.Tensor): 计算得到的所有 query-passage 的得分。

	Returns:
	torch.Tensor: 用于计算损失的局部得分。
	"""
	group_size = p_reps.size(0) // q_reps.size(0) # 每个 query 对应的 passages 数量
	indices = torch.arange(0, q_reps.size(0), device=q_reps.device) * group_size # 每个 query 在 all_scores 中的索引
	specific_scores = []
	for i in range(group_size):
	# 从 all_scores 中提取每个 query 对应的第 i 个 passage 的得分
	specific_scores.append(
	all_scores[torch.arange(q_reps.size(0), device=q_reps.device), indices + i] # (batch_size, group_size)
	)
	# 将所有特定得分堆叠在一起，并调整形状为 (batch_size, group_size)
	return torch.stack(specific_scores, dim=1).view(q_reps.size(0), -1)





	def _compute_similarity(q_reps, p_reps):
	"""使用内积计算 query 和 passage 表示之间的相似度。

	Args:
	q_reps (torch.Tensor): queries 的表示。
	p_reps (torch.Tensor): passages 的表示。

	Returns:
	torch.Tensor: 计算得到的相似度矩阵。
	"""
	if len(p_reps.size()) == 2:
	return torch.matmul(q_reps, p_reps.transpose(0, 1))
	return torch.matmul(q_reps, p_reps.transpose(-2, -1))


	def compute_score(q_reps, p_reps, temperature):
	"""计算 queries 和 passages 之间的得分。

	Args:
	q_reps (torch.Tensor): queries 的表示。
	p_reps (torch.Tensor): passages 的表示。
	temperature (float): 温度参数，用于调整得分。

	Returns:
	torch.Tensor: 调整后的得分。
	"""
	scores = _compute_similarity(q_reps, p_reps) / temperature # (batch_size, group_size)
	scores = scores.view(q_reps.size(0), -1) # (batch_size, group_size)
	return scores


	def compute_local_score(q_reps, p_reps, temperature):
	"""计算 queries 和 passages 的局部得分。

	Args:
	q_reps (torch.Tensor): queries 的表示。
	p_reps (torch.Tensor): passages 的表示。
	temperature (float): 温度参数，用于调整得分。

	Returns:
	torch.Tensor: 用于计算损失的局部得分。
	"""
	all_scores = compute_score(q_reps, p_reps, temperature)

	loacl_scores = get_local_score(q_reps, p_reps, all_scores)
	return loacl_scores



	def compute_loss(scores, target):
	"""使用交叉熵计算损失。

	Args:
	scores (torch.Tensor): 计算得到的得分。
	target (torch.Tensor): 目标值。

	Returns:
	torch.Tensor: 计算得到的交叉熵损失。
	"""
	cross_entropy = torch.nn.CrossEntropyLoss(reduction='mean')
	return cross_entropy(scores, target)


	def compute_no_in_batch_neg_loss(q_reps, p_reps, temperature):
	"""
	在不使用批内负样本和跨设备负样本的情况下计算损失。

	Args:
	q_reps (torch.Tensor): queries 的表示，形状为 (batch_size, dim)。
	p_reps (torch.Tensor): passages 的表示，形状为 (batch_size * group_size, dim)。
	temperature (float): 温度参数，用于调整得分。

	Returns:
	Tuple[torch.Tensor, torch.Tensor]: 返回局部得分和计算得到的损失。
	"""
	local_scores = compute_local_score(q_reps, p_reps, temperature) # (batch_size, group_size)
	local_targets = torch.zeros(local_scores.size(0), device=local_scores.device, dtype=torch.long) # (batch_size)

	loss = compute_loss(local_scores, local_targets)

	return local_scores, loss