ggml-org/llama.cpp

C++ ⭐ 111.9k 🍴 18.5k 🔥 +309 today

Orijinal Aciklama

LLM inference in C/C++

📄 MIT

Lisans

1.7k

Açık Issue

6 gün önce

Son Commit

720

İzleyici

ggml

🤖 AI Analizi (Turkce)

llama.cpp, C++ dilinde yazılmış bir büyük dil modeli (LLM) çıkarım kütüphanesidir. Bu kütüphane, minimal kurulum ve geniş bir donanım yelpazesinde en son performansla LLM çıkarımını mümkün kılar. Hem yerel hem de bulut ortamlarında çalışabilen kütüphane, Apple silicon, x86, RISC-V gibi farklı mimarileri destekler.

🎯 Hedef Kitle: Yapay zeka ve makine öğrenimi geliştiricileri, özellikle büyük dil modelleri ile çalışanlar

TEMEL OZELLIKLER

Bağımsız C/C++ implementasyonu
Apple silicon için optimize edilmiş ARM NEON, Accelerate ve Metal çerçeve desteği
x86 mimarileri için AVX, AVX2, AVX512 ve AMX desteği
RISC-V mimarileri için RVV, ZVFH, ZFH, ZICBOP ve ZIHINTPAUSE desteği
1.5-bit, 2-bit, 3-bit, 4-bit, 5-bit, 6-bit ve 8-bit tamsayı nicemleme desteği
NVIDIA GPU'ları için özel CUDA çekirdekleri, AMD GPU'ları için HIP ve Moore Threads GPU'ları için MUSA desteği
Vulkan ve SYCL arka plan desteği
CPU+GPU hibrit çıkarım desteği

💡 Kullanım Örneği

Bir makine öğrenimi mühendisi, doğal dil işleme uygulaması için büyük bir dil modelini eğitmek istiyor. llama.cpp kütüphanesini kullanarak, modeli yerel makinesinde veya bulut ortamında çalıştırabilir ve yüksek performans elde edebilir. Örneğin, 'llama-cli -m my_model.gguf' komutuyla yerel bir model dosyasını çalıştırabilir veya 'llama-cli -hf ggml-org/gemma-3-1b-it-GGUF' komutuyla Hugging Face'den doğrudan bir modeli indirebilir ve çalıştırabilir.