Spaces:

aelitta
/

BioMistral_gradio

Runtime error

App Files Files Community

BioMistral_gradio / llama-cpp-python /vendor /llama.cpp /kompute /test /TestOpTensorCopy.cpp

aelitta

Upload folder using huggingface_hub

4bdb245 verified 11 months ago

raw

history blame contribute delete

7.71 kB

	// SPDX-License-Identifier: Apache-2.0

	#include "gtest/gtest.h"

	#include "kompute/Kompute.hpp"
	#include "kompute/logger/Logger.hpp"

	#include "shaders/Utils.hpp"

	TEST(TestOpTensorCopy, CopyDeviceToDeviceTensor)
	{

	kp::Manager mgr;

	std::vector<float> testVecA{ 1, 2, 3 };
	std::vector<float> testVecB{ 0, 0, 0 };

	std::shared_ptr<kp::TensorT<float>> tensorA = mgr.tensor(testVecA);
	std::shared_ptr<kp::TensorT<float>> tensorB = mgr.tensor(testVecB);

	EXPECT_TRUE(tensorA->isInit());
	EXPECT_TRUE(tensorB->isInit());

	mgr.sequence()
	->eval<kp::OpTensorSyncDevice>({ tensorA, tensorB })
	->eval<kp::OpTensorCopy>({ tensorA, tensorB })
	->eval<kp::OpTensorSyncLocal>({ tensorA, tensorB });

	// Making sure the GPU holds the same vector
	EXPECT_EQ(tensorA->vector(), tensorB->vector());
	}

	TEST(TestOpTensorCopy, CopyDeviceToDeviceTensorMulti)
	{

	kp::Manager mgr;

	std::vector<float> testVecA{ 2, 3, 4 };
	std::vector<float> testVecB{ 0, 0, 0 };
	std::vector<float> testVecC{ 0, 0, 0 };

	std::shared_ptr<kp::TensorT<float>> tensorA = mgr.tensor(testVecA);
	std::shared_ptr<kp::TensorT<float>> tensorB = mgr.tensor(testVecB);
	std::shared_ptr<kp::TensorT<float>> tensorC = mgr.tensor(testVecC);

	EXPECT_TRUE(tensorA->isInit());
	EXPECT_TRUE(tensorB->isInit());
	EXPECT_TRUE(tensorC->isInit());

	mgr.sequence()
	->eval<kp::OpTensorSyncLocal>({ tensorA, tensorB, tensorC })
	->eval<kp::OpTensorCopy>({ tensorA, tensorB, tensorC });

	EXPECT_EQ(tensorA->vector(), tensorB->vector());
	EXPECT_EQ(tensorA->vector(), tensorC->vector());

	// Making sure the GPU holds the same vector
	mgr.sequence()->eval<kp::OpTensorSyncLocal>({ tensorB, tensorC });

	EXPECT_EQ(tensorA->vector(), tensorB->vector());
	EXPECT_EQ(tensorA->vector(), tensorC->vector());
	}

	TEST(TestOpTensorCopy, CopyDeviceToHostTensor)
	{

	kp::Manager mgr;

	std::vector<float> testVecA{ 3, 4, 5 };
	std::vector<float> testVecB{ 0, 0, 0 };

	std::shared_ptr<kp::TensorT<float>> tensorA = mgr.tensor(testVecA);
	std::shared_ptr<kp::TensorT<float>> tensorB =
	mgr.tensor(testVecB, kp::Tensor::TensorTypes::eHost);

	// Only calling sync on device type tensor
	mgr.sequence()->eval<kp::OpTensorSyncDevice>({ tensorA });

	EXPECT_TRUE(tensorA->isInit());
	EXPECT_TRUE(tensorB->isInit());

	mgr.sequence()->eval<kp::OpTensorCopy>({ tensorA, tensorB });

	EXPECT_EQ(tensorA->vector(), tensorB->vector());

	// Making sure the GPU holds the same vector
	mgr.sequence()->eval<kp::OpTensorSyncLocal>({ tensorB });
	EXPECT_EQ(tensorA->vector(), tensorB->vector());
	}

	TEST(TestOpTensorCopy, CopyHostToDeviceTensor)
	{

	kp::Manager mgr;

	std::vector<float> testVecA{ 4, 5, 6 };
	std::vector<float> testVecB{ 0, 0, 0 };

	std::shared_ptr<kp::TensorT<float>> tensorA =
	mgr.tensor(testVecA, kp::Tensor::TensorTypes::eHost);
	std::shared_ptr<kp::TensorT<float>> tensorB = mgr.tensor(testVecB);

	// Only calling sync on device type tensor
	mgr.sequence()->eval<kp::OpTensorSyncDevice>({ tensorA, tensorB });

	EXPECT_TRUE(tensorA->isInit());
	EXPECT_TRUE(tensorB->isInit());

	mgr.sequence()->eval<kp::OpTensorCopy>({ tensorA, tensorB });

	EXPECT_EQ(tensorA->vector(), tensorB->vector());

	// Making sure the GPU holds the same vector
	mgr.sequence()->eval<kp::OpTensorSyncLocal>({ tensorB });
	EXPECT_EQ(tensorA->vector(), tensorB->vector());
	}

	TEST(TestOpTensorCopy, CopyHostToHostTensor)
	{

	kp::Manager mgr;

	std::vector<float> testVecA{ 5, 6, 7 };
	std::vector<float> testVecB{ 0, 0, 0 };

	std::shared_ptr<kp::TensorT<float>> tensorA =
	mgr.tensor(testVecA, kp::Tensor::TensorTypes::eHost);
	std::shared_ptr<kp::TensorT<float>> tensorB =
	mgr.tensor(testVecB, kp::Tensor::TensorTypes::eHost);

	EXPECT_TRUE(tensorA->isInit());
	EXPECT_TRUE(tensorB->isInit());

	mgr.sequence()
	->eval<kp::OpTensorSyncDevice>({ tensorA })
	->eval<kp::OpTensorCopy>({ tensorA, tensorB });

	EXPECT_EQ(tensorA->vector(), tensorB->vector());

	// Making sure the GPU holds the same vector
	mgr.sequence()->eval<kp::OpTensorSyncLocal>({ tensorB });
	EXPECT_EQ(tensorA->vector(), tensorB->vector());
	}

	TEST(TestOpTensorCopy, SingleTensorShouldFail)
	{

	kp::Manager mgr;

	std::vector<float> testVecA{ 6, 7, 8 };

	std::shared_ptr<kp::TensorT<float>> tensorA =
	mgr.tensor(testVecA, kp::Tensor::TensorTypes::eHost);

	EXPECT_TRUE(tensorA->isInit());

	EXPECT_THROW(mgr.sequence()->eval<kp::OpTensorCopy>({ tensorA }),
	std::runtime_error);
	}

	TEST(TestOpTensorCopy, CopyThroughStorageTensor)
	{
	kp::Manager mgr;

	std::vector<float> testVecIn{ 9, 1, 3 };
	std::vector<float> testVecOut{ 0, 0, 0 };

	std::shared_ptr<kp::TensorT<float>> tensorIn = mgr.tensor(testVecIn);
	std::shared_ptr<kp::TensorT<float>> tensorOut = mgr.tensor(testVecOut);
	// Tensor storage requires a vector to be passed only to reflect size
	std::shared_ptr<kp::TensorT<float>> tensorStorage =
	mgr.tensor({ 0, 0, 0 }, kp::Tensor::TensorTypes::eStorage);

	mgr.sequence()
	->eval<kp::OpTensorSyncDevice>({ tensorIn, tensorOut })
	->eval<kp::OpTensorCopy>({ tensorIn, tensorStorage })
	->eval<kp::OpTensorCopy>({ tensorStorage, tensorOut })
	->eval<kp::OpTensorSyncLocal>({ tensorIn, tensorOut });

	// Making sure the GPU holds the same vector
	EXPECT_EQ(tensorIn->vector(), tensorOut->vector());
	}

	TEST(TestOpTensorCopy, CopyTensorThroughStorageViaAlgorithms)
	{
	kp::Manager mgr;

	std::vector<float> testVecIn{ 9, 1, 3 };
	std::vector<float> testVecOut{ 0, 0, 0 };

	std::shared_ptr<kp::TensorT<float>> tensorIn = mgr.tensor(testVecIn);
	std::shared_ptr<kp::TensorT<float>> tensorOut = mgr.tensor(testVecOut);
	// Tensor storage requires a vector to be passed only to reflect size
	std::shared_ptr<kp::TensorT<float>> tensorStorage =
	mgr.tensor({ 0, 0, 0 }, kp::Tensor::TensorTypes::eStorage);

	EXPECT_TRUE(tensorIn->isInit());
	EXPECT_TRUE(tensorOut->isInit());

	// Copy to storage tensor through algorithm
	std::string shaderA = (R"(
	#version 450

	layout (local_size_x = 1) in;

	// The input tensors bind index is relative to index in parameter passed
	layout(set = 0, binding = 0) buffer buf_in { float t_in[]; };
	layout(set = 0, binding = 1) buffer buf_st { float t_st[]; };

	void main() {
	uint index = gl_GlobalInvocationID.x;
	t_st[index] = t_in[index];
	}
	)");

	auto algoA = mgr.algorithm(
	{ tensorIn, tensorStorage },
	compileSource(shaderA));

	// Copy from storage tensor to output tensor
	std::string shaderB = (R"(
	#version 450

	layout (local_size_x = 1) in;

	// The input tensors bind index is relative to index in parameter passed
	layout(set = 0, binding = 0) buffer buf_st { float t_st[]; };
	layout(set = 0, binding = 1) buffer buf_out { float t_out[]; };

	void main() {
	uint index = gl_GlobalInvocationID.x;
	t_out[index] = t_st[index];
	}
	)");

	auto algoB = mgr.algorithm(
	{ tensorStorage, tensorOut },
	compileSource(shaderB));

	mgr.sequence()
	->eval<kp::OpTensorSyncDevice>({ tensorIn })
	->eval<kp::OpAlgoDispatch>(algoA)
	->eval<kp::OpAlgoDispatch>(algoB)
	->eval<kp::OpTensorSyncLocal>({ tensorOut });

	// Making sure the GPU holds the same vector
	EXPECT_EQ(tensorIn->vector(), tensorOut->vector());
	}