Spaces:

JeffYang52415
/

LLMEval-Dataset-Parser

Sleeping

App Files Files Community

LLMEval-Dataset-Parser / llmdataparser /tw_legal_parser.py

JeffYang52415

feat: add tw_legal parser

dd0b07f unverified 11 months ago

raw

history blame

3.01 kB

	from dataclasses import dataclass
	from typing import Any, Final

	from llmdataparser.base_parser import HuggingFaceDatasetParser, HuggingFaceParseEntry
	from llmdataparser.prompts import TW_LEGAL_SYSTEM_PROMPT

	TW_LEGAL_VALID_ANSWERS: Final[set[str]] = {"A", "B", "C", "D"}
	TW_LEGAL_VALID_ANSWER_STR: Final[str] = ", ".join(sorted(TW_LEGAL_VALID_ANSWERS))


	@dataclass(frozen=True, kw_only=True, slots=True)
	class TWLegalParseEntry(HuggingFaceParseEntry):
	"""Custom entry class for Taiwan Legal Benchmark, with fields specific to this dataset parser."""

	raw_choices: list[str]

	@classmethod
	def create(
	cls,
	prompt: str,
	answer: str,
	raw_question: str,
	raw_choices: list[str],
	raw_answer: str,
	task_name: str,
	) -> "TWLegalParseEntry":
	if answer not in TW_LEGAL_VALID_ANSWERS:
	raise ValueError(
	f"Invalid answer_letter '{answer}'; must be one of {TW_LEGAL_VALID_ANSWER_STR}"
	)
	return cls(
	prompt=prompt,
	answer=answer,
	raw_question=raw_question,
	raw_answer=raw_answer,
	raw_choices=raw_choices,
	task_name=task_name,
	)


	class TWLegalDatasetParser(HuggingFaceDatasetParser[TWLegalParseEntry]):
	"""Parser for the Taiwan Legal Benchmark dataset."""

	_data_source = "lianghsun/tw-legal-benchmark-v1"
	_default_task = "default"
	_task_names = ["default"]
	_default_system_prompt = TW_LEGAL_SYSTEM_PROMPT

	def process_entry(
	self, row: dict[str, Any], task_name: str \| None = None, **kwargs: Any
	) -> TWLegalParseEntry:
	"""Process a single Taiwan Legal Benchmark entry."""
	# Extract choices in order
	task = task_name or self._get_current_task(row)
	raw_choices = [row["A"], row["B"], row["C"], row["D"]]
	choices = "\n".join(
	f"{chr(65 + i)}. {choice}" for i, choice in enumerate(raw_choices)
	)
	raw_question = row["question"]
	raw_answer = row["answer"]

	prompt = f"{self._system_prompt}\nQuestion: {raw_question}\n{choices}\nAnswer:"

	return TWLegalParseEntry.create(
	prompt=prompt,
	answer=raw_answer,
	raw_question=raw_question,
	raw_choices=raw_choices,
	raw_answer=raw_answer,
	task_name=task,
	)


	if __name__ == "__main__":
	# Example usage
	parser = TWLegalDatasetParser()
	parser.load()
	parser.parse()

	# Get parsed data with correct type
	parsed_data = parser.get_parsed_data

	# Print example entry
	if parsed_data:
	example = parsed_data[0]
	print("\nExample parsed entry:")
	print(f"Question: {example.raw_question}")
	print("Choices:")
	for i, choice in enumerate(example.raw_choices):
	print(f"{chr(65 + i)}. {choice}")
	print(f"Correct Answer: {example.answer}")
	print(f"Task Name: {example.task_name}")