czorgormez
Temporary user
- Katılım
- 27 Ekim 2022
- Mesajlar
- 2,752
LM studio ile lokalde 30-40b parmetreye kadar olan modelleri test ediyorum. elimdeki laptopda 6gb vramli RTX ADAA1000 ekran kartı ve 48 gb 5600mhz ramler var. yani yapay zeka için ancak giriş seviyesi sayılır modele göre 15-20 token ile 2-3 token arası üretiyor.
bu süreçte hakem olarak sonnet 4.6 thinking kullandım ve yapay zekayı yapay zekaya kırdırdım. önce sonnetden zor bir C++ programlama sorusu hazırlamasını istedim. bu soru kendi içinde hem bilgi hem de uygulama anlamında birçok trickler barındırıyor.
çıkan tüm sonuçları da gene sonnet 4.6 ile yorumlattım. teste qwen3 300b ve gemini 3.1 pro'yu da dahil ettim (tabi bunlar lokalde değil). burada en başarılı lokal 2 model gpt oss20B lokal (30 dakikada çözdü) ve GLM-4.7 flash (7-8 dakika) oldu.
özet olarak bunlar zor sorular. yavaş yavaş kendi modelimi fine tune edeyim. bana c, c++ ve pyhon yazsın bir gün doomsday gelirse ayazda kalmayalım dersek iyi eğitilmiş 30-40b parametreli modeller kodlama konusunda şu anda iş görecek. işleri çok hızlandıracak seviyeye gelmiş. tabi lokal modellerin tek avantajı internetsizlik değil. ciddi işler yaptığınız bir şirket varsa bilgilerin dışarı sızmaması. yarın öbür gün başka birine sizin kodlardan parça parça örnek vermemesi için de lokal modeller iyi. aslında gpt oss 120B var ama bunu çalıştırmak için min 64gb ekran kartı gerekiyor.
bu süreçte hakem olarak sonnet 4.6 thinking kullandım ve yapay zekayı yapay zekaya kırdırdım. önce sonnetden zor bir C++ programlama sorusu hazırlamasını istedim. bu soru kendi içinde hem bilgi hem de uygulama anlamında birçok trickler barındırıyor.
çıkan tüm sonuçları da gene sonnet 4.6 ile yorumlattım. teste qwen3 300b ve gemini 3.1 pro'yu da dahil ettim (tabi bunlar lokalde değil). burada en başarılı lokal 2 model gpt oss20B lokal (30 dakikada çözdü) ve GLM-4.7 flash (7-8 dakika) oldu.
özet olarak bunlar zor sorular. yavaş yavaş kendi modelimi fine tune edeyim. bana c, c++ ve pyhon yazsın bir gün doomsday gelirse ayazda kalmayalım dersek iyi eğitilmiş 30-40b parametreli modeller kodlama konusunda şu anda iş görecek. işleri çok hızlandıracak seviyeye gelmiş. tabi lokal modellerin tek avantajı internetsizlik değil. ciddi işler yaptığınız bir şirket varsa bilgilerin dışarı sızmaması. yarın öbür gün başka birine sizin kodlardan parça parça örnek vermemesi için de lokal modeller iyi. aslında gpt oss 120B var ama bunu çalıştırmak için min 64gb ekran kartı gerekiyor.