base_model: meta-llama/Llama-3.1-8B-Instruct
tags:
- text-generation-inference
- transformers
- unsloth
- llama
- gguf
license: apache-2.0
language:
- en
- tr
datasets:
- OzgurEnt/Kubernets_LinuxCommands_KVM_Postgresql
metrics:
- accuracy
pipeline_tag: question-answering
Uploaded model
- Finetuned by: Özgür Entegrasyon
- License: apache-2.0
- Finetuned from model : meta-llama/Llama-3.1-8B-Instruct
OZGURLUK-GPT-LinuxGeneral is a fine-tuned language model developed specifically to assist with Linux system administration, network management, and database troubleshooting. By using a custom dataset focused on technical tasks, this model excels at interpreting Linux commands and offering useful solutions. Whether you're troubleshooting a server, configuring a network, or managing databases, this model offers step-by-step guidance.
The model is available in three formats: 4-bit, 8-bit, and 16-bit. The 8-bit version strikes a balance between performance and memory usage, while the 16-bit version offers higher accuracy and precision for more demanding tasks. The 4-bit version provides a lightweight alternative optimized for low-resource environments. Additionally, the HUGG format (GGUF) ensures that the model has a smaller memory footprint with fast load times.
Dataset
The dataset used for fine-tuning OZGURLUK-GPT-LinuxGeneral was developed internally, gathering knowledge from various sources and internet databases.
A total of 56,466 question-answer pairs were collected, covering a broad range of technical domains including Kubernetes, Linux, PostgreSQL, Docker, and many others. The dataset is organized under different "ticker" headings, allowing the grouping of similar questions and answers within each domain. This enables the model to better understand the nuances of technical problem-solving and offer relevant responses tailored to users’ specific needs in system administration and other related fields.
The inclusion of diverse technical topics ensures that the model can assist with various tasks and adapt to a variety of Linux system-related challenges, providing highly accurate, domain-specific solutions.
Key Features
- Optimized for Linux: Trained with a dataset of Linux system commands, troubleshooting solutions, and network configurations.
- Multi-format Support: Choose between 4-bit, 8-bit, 16-bit, or HUGG for optimal performance based on your hardware.
- Efficient Performance: Trained using Unsloth and TRL, achieving faster training and efficient inference.
- Custom Dataset: Includes 56,466 question-answer pairs across multiple technical domains such as Kubernetes, Linux, PostgreSQL, Docker, etc.
Training Details
- Base Model: meta-llama/Llama-3.1-8B-Instruct
- Fine-tuning Method: LoRA (Low-Rank Adaptation)
- Training Hardware: Google Colab with A100 GPUs
- Dataset: Custom-developed dataset of 56,466 question-answer pairs from various technical fields (Kubernetes, Linux, PostgreSQL, Docker, etc.).
Türkçe
Yüklenen Model
- Finetuned By: Özgür Entegrasyon
- License: apache-2.0
- Eğitimde Kullanılan Model : meta-llama/Llama-3.1-8B-Instruct
OZGURLUK-GPT-LinuxGeneral, özellikle Linux sistem yönetimi, ağ yönetimi ve veritabanı sorun giderme konularında yardımcı olmak amacıyla ince ayar yapılmış bir dil modelidir. Teknik görevlerle ilgili özel bir veri seti kullanılarak eğitilmiştir, bu model Linux komutlarını yorumlamakta ve kullanışlı çözümler sunmakta oldukça başarılıdır. Sunucu sorunlarını gidermek, bir ağı yapılandırmak ya da veritabanlarını yönetmek gibi görevlerde adım adım rehberlik sunar.
Model, üç farklı formatta sunulmaktadır: 4-bit, 8-bit ve 16-bit. 8-bit versiyonu performans ve bellek kullanımını dengelerken, 16-bit versiyonu daha yüksek doğruluk ve hassasiyet sunar. 4-bit versiyonu, düşük kaynaklı ortamlar için optimize edilmiş hafif bir alternatiftir. Ayrıca, HUGG formatı (GGUF) modelin daha küçük bir bellek izine sahip olmasını ve hızlı yükleme süreleri sunmasını sağlar.
Veri Seti
OZGURLUK-GPT-LinuxGeneral modelinin ince ayar yapılmasında kullanılan veri seti, çeşitli kaynaklardan ve internet üzerindeki veritabanlarından toplanarak geliştirildi.
Toplamda 56.466 soru-cevap çifti toplanmış olup, bu veriler geniş bir teknik alan yelpazesinde yer almaktadır; bunlar arasında Kubernetes, Linux, PostgreSQL, Docker ve diğerleri yer almaktadır. Veri seti, farklı başlıklar altında düzenlenmiş olup, her başlık altında benzer sorular ve cevaplar gruplandırılmaktadır. Bu düzenleme, modelin teknik sorun çözme konusundaki incelikleri daha iyi anlamasını ve sistem yönetimi gibi alanlarda kullanıcılara özelleştirilmiş cevaplar sunmasını sağlar.
Farklı teknik konuları içeren bu veri seti, modelin çeşitli görevleri yerine getirmesine yardımcı olur ve Linux tabanlı sistemlerle ilgili çeşitli zorluklara uyum sağlamasına olanak tanır, bu sayede yüksek doğrulukla alanına özgü çözümler sunar.
Temel Özellikler
- Linux için Optimize Edildi: Linux sistem komutları, sorun giderme çözümleri ve ağ yapılandırmaları içeren bir veri seti ile eğitildi.
- Çoklu Format Desteği: Donanımınıza göre en iyi performans için 4-bit, 8-bit, 16-bit veya HUGG formatını seçebilirsiniz.
- Performans: Unsloth ve TRL kullanılarak eğitim yapıldı, bu da daha hızlı eğitim ve verimli çıkarım sağlar.
- Özel Veri Seti: Kubernetes, Linux, PostgreSQL, Docker gibi birçok teknik alanda 56.466 soru-cevap çiftini içeren özelleştirilmiş bir veri seti kullanıldı.
Eğitim Detayları
- Temel Model: meta-llama/Llama-3.1-8B-Instruct
- İnce Ayar Yöntemi: LoRA (Low-Rank Adaptation)
- Eğitim Donanımı: Google Colab with A100 GPUs
- Veri Seti: Custom-developed dataset of 56,466 question-answer pairs from various technical fields (Kubernetes, Linux, PostgreSQL, Docker, etc.).