from llm_engineering.domain.dataset import DatasetType MOCKED_RESPONSE_INSTRUCT = """ [ {"instruction": " 1", "answer": " 1"}, {"instruction": " 2", "answer": " 2"}, {"instruction": " 3", "answer": " 3"} ] """ MOCKED_RESPONSE_PREFERENCE = """ [ {"instruction": " 1", "rejected": " 1", "chosen": "Mocked extracted extracted extracted extracted extracted extracted extracted extracted extracted extracted answer 1."}, {"instruction": " 2", "rejected": " 2", "chosen": "Mocked extracted extracted extracted extracted extracted extracted extracted extracted extracted extracted answer 2."}, {"instruction": " 3", "rejected": " 3", "chosen": "Mocked extracted answer 3"} ] """ def get_mocked_response(dataset_type: DatasetType) -> str: if dataset_type == DatasetType.INSTRUCTION: return MOCKED_RESPONSE_INSTRUCT elif dataset_type == DatasetType.PREFERENCE: return MOCKED_RESPONSE_PREFERENCE else: raise ValueError(f"Invalid dataset type: {dataset_type}")