Çin'in Yapay Zekası DeepSeek Neden Bu Kadar Gündem Oldu?

deepseek gerçekten dünya için heyecan verici bir gelişme. şimdi deepseek'in neden bu kadar gündem olduğunu, hem de dünya için ne anlama geldiğini en basit şekilde bu olaydan habersiz insanlara bile anlatacağım bir yazı olacak bu.
1. öncelikle bilmemiz lazım ki kullandığımız ekşisözlük bile aslında bir yazılım dilinin (kodun) interaktif hale gelmiş hali. biz bu kodları günlük kullanımda görmüyoruz çünkü kullandığımız tarayıcılar aslında bu kodları derleyici görev görüyor yani etkileşimli tasarıma çeviriyor. aslında tarayıcı dediğimiz şey bir compiler. browser'lar olmasa gördüğümüz tek şey yığınla kod kümesi olurdu mesela bir site hata falan verdiğinde arayüz olmadan kod parçacıklarını görürsünüz ya da forumda falan hiç eskiden yazı yazdıysanız [img], [b] tarzı kodları bilirsiniz. yapay zekayı da bu kodlardan oluşan ama kendi bilincinin olduğu bir devasa makine gibi görebilirsiniz. siz bir input (emir) verdiğinizde (chatgpt'de bir şey sorduğunuzda) bilinçteki binlerce veri taranıyor eş zamanlı olarak. bu parallel processing, eşzamanlı işleme gerektiriyor bu işlemi de sadece ekran kartları yapabiliyor. cpu'lar ardışık işleme yaptığından yapay zeka eğitimi için verimli değil. dünyada olay burada kopuyor zaten.
2. hayatımıza oyuncu ekran kartlarıyla giren nvidia, hatırlarsınız nvidiaaaa the way it's meant to be played her oyunda görürdük açılışta. 2017'den sonra nvidia kripto para madenciliği ve 2021'den sonra yapay zeka akımıyla dünyanın en değerli şirketleri arasına girdi. fun fact aslında dünyanın en değerli şirketinin arkasında pc oyuncuları vardır :)
3. nvidia'nın yapay zeka ile yükselmesinin nedeni openai, google, microsoft ve xai gibi şirketlerin yüzbinlerce endüstriyel ekran kartı siparişi vermesi. bu ekran kartları en son tanıtılan rtx 5090'dan belki de 50-100 kat daha güçlü ee doğal olarak pahalı donanımlar. nvidia bu süreçte %200 yükseldi bu nedenle.
4. deepseek'in bu kadar ses getirmesinin nedeni rakip şirketlere kıyasla bunu çok daha mütevazı bir donanımla yapabilmesi. rakipler 150.000 tane h800 gpu kullanırken deepseek bunu 10.000 tane h100 ile başarabildi. amerikan teknoloji şirketlerinin çakılmasının nedeni artık acaba bu kadar donanıma ve enerjiye ihtiyaç kalmayacak mı endişesi. çünkü deepseek'in r1 adlı modeli evdeki 64 gb ve rtx 4090'lı bir kişisel bilgisayarda çalışabilecek kadar verimli. girdiğiniz chat.deepseek.com aslında bir uzak sunucu üzerinden çalışıyor yani deepseek'in kendi bilgisayarlarında. siz bunu yerel olarak kendiniz de kurabilip kullanabiliyorsunuz yani inanılmaz bir şey. tabii ki siteden çok daha yavaş olacak donanımdan dolayı.
5. bu nedenle nvidia, broadcom, dell, amd gibi çip üreticisi şirketler çakıldı. hatta openai'ın yeni veri merkezleri için anlaşma yaptığı enerji şirketleri bile büyük etkilendi. az donanım demek bunlara ihtiyaç kalmayacağı demek. o yüzden 1 trilyon dolar silindi borsadan. veri merkezi nedir biliyorsunuz diye varsaydım ama :) kısaca içinde 100 tane gpu barındıran bir makineden yan yana 5000 tane olduğunu düşünün. esasında endüstriyel bilgisayar. bulut merkezleri için de gpu değil de harddisk temelli düşünün kuruluyor bunlar.
6. diğer neden ise deepseek'in open-source yani açık kaynaklı olması. bunu bildiğiniz github'a girip indirip kendi bilgisayarınızda çalıştırabiliyorsunuz ve içindeki koda herkes erişebilir. gpt 4'de böyle bir şey yok opeanai'a bağımlısınız. açık kaynak demek geliştiricilerin bu modeli benimseyeceği demek openai'a ihtiyacı kalmayabilir demek. çin'den çıkan bir modelin global olarak dünyada yaygın kullanılabileceği fikrinin de abd'yi ne kadar tedirgin ettiğini belirtmeme gerek yok :) 5 yıl sonra herkes bu modeli benimsediğinde deepseek pat diye ben bunu lisanslıyorum da diyebilir.
7. son olarak gpt 4o'ya ek olarak tabii ki bu kadar az donanıma rağmen gpt 4.0'dan çok daha hızlı çalışabiliyor. benchmarklarda kafa kafaya hatta geçiyor. inputlara verdiği doğru cevap oranı, accuracy rate'i de daha yüksek. ama o kadar şey saymama rağmen en önemli özelliği bu değil.
en önemlisi çinlilerin gerçekten bir yenilik yapmış olması. bu bildiğiniz basit bir çin replikası değil. adamlar gpt 4 üzerine "reasoning thinking" eklemişler yani bir şeye cevap verirken insan kafasında düşünür ya şunu şöyle yaparsam nasıl olur, acaba olur mu ki ya diye düşünürüz. he işte bu deepthink modelinde (siteye girince aşağıdaki butondan açabiliyorsunuz) yapay zeka size beynini açıyor aslında. siz bir soru sordunuz size bu cevabı vermeden önce kafasında kurduğu aşamaları yazıya döküyor. yani bir kod sordunuz atıyorum direk atmak yerine şöyle yaptım olmadı, o yüzden şu şekle çevirdim gibi tek tek bilinçaltını yazıya döküyor. biraz ingilizceniz varsa şu videoyu izlemenizi tavsiye ederim. çok daha iyi anlayacaksınız ne demek istediğimi: