Ücretsiz Araç

Mac'im Çalıştırabilir Mi?

Mac'ler için kesin LLM bellek hesaplayıcı. Apple Silicon yapılandırmanız için bellek kullanımı, token üretim hızı ve uyumluluğu hesaplayın.

1. Donanımınız

Mac İşlemci

Birleşik Bellek (RAM)

macOS Sürümü

Çıkarım Çerçevesi

2. Model Seçin

Model Ara

Parametre Sayısı (Milyar)

Örn: 8B model için 8.

Kuantizasyon / Hassasiyet

Düşük hassasiyet = daha az bellek, hafif kalite kaybı.

Bağlam Penceresi (Token)

Prompt + maksimum üretilen token toplamı.

Yığın Boyutu

Paralel diziler (sohbet için 1).

Gelişmiş Mimari

Katmanlar

Gizli Boyut

Dikkat Kafaları

KV Kafaları (GQA/MQA)

Mac'iniz İçin Önerilen

Bellek Dökümü

Toplam Gereken RAM

0.0 GB

: 16 GB

Model Ağırlıkları 0.0 GB

KV Önbellek 0.0 GB

Çerçeve Yükü & Acts. 1.0 GB

macOS Rezervasyonu 2.0 GB

Mükemmel — fazlasıyla yeterli bellekle rahatça çalışır. Sohbet ve ağır bağlam için ideal.

Verim (Tahmini)

~0 t/s

İlk Token Süresi

<0.5 s

Güç Tüketimi

0 W

Tahmini Maliyet / Sa

$0.00

CO₂ / Sa

0 gCO₂e

Hızlı Başlangıç

Başlamak için terminale kopyalayıp yapıştırın:

$ mlx_lm.generate --model meta-llama/Meta-Llama-3-8B

Sıkça Sorulan Sorular

Token verimi nasıl hesaplanır?

Apple Silicon'da çıkarım hızı bellek bant genişliğiyle sınırlıdır. Çipinizin bant genişliğini yüklenen model boyutuna böler, ardından çerçeveye özgü verimlilik faktörü uygularız (MLX ≈ %85, Ollama ≈ %65, vLLM ≈ %70, SGLang ≈ %88).

macOS sürümü neden önemli?

macOS sistem için bellek ayırır. Sequoia ve Tahoe, cihaz üzerinde yapay zeka özellikleri nedeniyle Sonoma'dan daha fazla ayırır. Bu hesaplayıcı farkı hesaba katar.

Çerçeveler neden farklı miktarda RAM kullanır?

vLLM yüksek eşzamanlılık için büyük KV önbellek blokları önceden ayırır. Ollama Go çalışma zamanı yükü taşır (~600 MB). MLX ve SGLang daha yalın C++/Python arka uçlarıdır (~200 MB taban).

Kuantizasyon ne yapar?

Kuantizasyon model ağırlıklarının hassasiyetini düşürür (örn: FP16 → INT4), bellek kullanımını 2–4× azaltır. Karşılığında küçük bir kalite kaybı olur, genellikle sohbet ve kod görevleri için kabul edilebilir.

Güç ve maliyet tahminleri nasıl hesaplanır?

Güç, çipinizin yük altındaki TDP'sinden türetilir. Maliyet küresel ortalama elektrik fiyatını ($0,15/kWh), emisyonlar küresel ortalama şebeke karbon yoğunluğunu (385 g CO₂e/kWh) kullanır.

RAM'imden büyük modelleri çalıştırabilir miyim?

Teknik olarak evet — macOS SSD'nizdeki takas belleğini kullanır. Ancak verim normalin yaklaşık %10'una düşer, bu da gerçek zamanlı sohbeti kullanılamaz hale getirir.