DeepSeek'in Kurucusu Liang Wenfeng Kimdir?

Son derece düşük maliyetli yapay zeka modeliyle dünya borsalarını sarsan Çin merkezli yapay zeka DeepSeek'in arkasındaki isim Liang Wenfeng hakkında bildiklerimiz.
DeepSeek'in Kurucusu Liang Wenfeng Kimdir?

çin’in perde arkasındaki yapay zeka öncüsü deepseek, en son yapay zeka (ai) modelini piyasaya sürerek amerika’nın çin inovasyonunu sınırlamak için yıllardır uyguladığı politikaları altüst etti. bu hamle, yalnızca teknoloji dünyasında değil, küresel piyasalarda da yankı uyandırdı. deepseek’in başarısı, nvidia gibi ai çip devlerinden siemens energy gibi veri merkezi ekipmanı üreticilerine kadar birçok büyük şirketin hisse değerlerinde ciddi düşüşlere neden oldu. dahası, şirketin amerikan ihracat kısıtlamalarını aşarak yenilik yapma yeteneğini göstererek, gelişmiş yarı iletkenlere ve ilgili ekipmanlara erişimin aı modellerini eğitmede sanıldığı kadar önemli olup olmadığına dair şüpheleri artırdı.

bu çalkantılı sürecin merkezinde ise deepseek’in 40 yaşındaki kurucusu liang wenfeng yer alıyor. çin sosyal medyasında zayıf ve yorgun görünümüyle esprili yorumlara maruz kalan liang, hâlâ gizemini koruyor. deepseek ile profesyonel ilişkisi olanlar, onun insan benzeri yapay genel zekâya (agi) ve bunun küresel etkilerine derin bir ilgi duyduğunu belirtiyor. bu doğrultuda hareket eden deepseek’in kurucusu, hem batı’da hem de çin’de teknoloji ilerleyişine dair yerleşik düşünceleri sarsıyor.

liang wenfeng hakkında bilgiler oldukça sınırlı. 1985 yılında, zhanjiang şehri yakınlarında yoksul bir köyde öğretmen bir ailede doğdu, üstün yetenekli bir öğrenciydi. onu tanıyan bir öğretmeni, henüz ortaokuldayken üniversite düzeyinde matematik bilgisine sahip olduğunu söylüyor. 2002 yılında, doğudaki hangzhou şehrinde bulunan zhejiang üniversitesi’ne elektronik bilgi mühendisliği bölümüne kabul edildi. aynı üniversitede, makine görüşü alanında tanınmış bir bilim insanının yanında çalışarak yapay zekayla tanıştı.

o dönemde hangzhou, internet teknolojileri için hareketli bir merkezdi ve hızla büyüyen e-ticaret devi alibaba gibi şirketlere ev sahipliği yapıyordu. liang ve birkaç sınıf arkadaşı şehirde kalarak, geleneksel finansal göstergelere dayanmaktan ziyade büyük veri kümelerini analiz ederek yatırım kararları alan nicel yatırım modelleri geliştirmeye başladılar. 2013 yılında, bu modelleri ticarileştirmek amacıyla yakebi adlı bir yatırım grubu kurdular.

iki yıl sonra, liang high-flyer adlı bir nicel hedge fonunun kurucu ortaklarından biri oldu. bu fon, çin’de finansal piyasaların serbestleştiği ve piyasa oynaklığının arttığı bir dönemde hızla büyüyen benzer fonlardan biri haline geldi. 2021’de, yönetimi altında 100 milyar yuan (14 milyar dolar) bulunduğunu iddia etti, ancak aynı yılın ikinci yarısında hızla küçüldü. nicel yatırım fonları, genellikle piyasa dalgalanmalarından kazanç sağlamakla suçlandıkları için çinli düzenleyicilerle sık sık karşı karşıya geldi. sektör uzmanlarına göre high-flyer, en agresif nicel fonlardan biri olarak biliniyor ve menkul kıymet düzenleyicilerinin sürekli hedefi haline geliyordu.

deepseek’in kökenleri, high-flyer’ın algoritmalarını geliştirme çabasına dayanıyor. 2019 yılında firma, kendi gelişmiş yapay zeka platformu “fire-flyer 1”i geliştirmek için ayrı bir birim kurarak bu girişime 200 milyon yuan yatırım yaptı. 2021’de ise 10.000 adet nvidia a100 grafik işlem birimiyle donatılmış ikinci bir sürümü başlatmak için fona 1 milyar yuan daha aktarıldı. bu durum, high-flyer’ı bir istisna haline getirdi: o dönemde çin’de bu kadar büyük bir güçlü çip stoğuna sahip sadece dört firma bulunuyordu ve bunların hepsi alibaba gibi büyük teknoloji devleriydi. deepseek, 2023 yılında bağımsız bir şirket haline getirildi.

şirket, geçen yıl mayıs ayında v2 modeline dayanan ultra ucuz bir sohbet botu piyasaya sürdüğünde pazarda ilk büyük sarsıntısını yarattı. bu hamle, çin’in yapay zeka sektöründe bir fiyat savaşını tetikleyerek alibaba, baidu, bytedance ve tencent gibi ülkenin en büyük teknoloji firmalarını kendi fiyatlarını düşürmeye zorladı.

liang’ın kendi anlatımına göre, bu hamle daha fazla kullanıcı çekmek için yapılmadı. temmuz ayında, deepseek’in yeni model yapıları üzerinde incedikçe maliyetlerinin düştüğünü söyledi ve bunun şirketi diğerlerinden ayıran bir özellik olduğunu belirtti. rakip çinli yapay zeka firmaları kendi modelleri üzerinde çalışmalar yapsalar da, amerikan ihracat kısıtlamaları nedeniyle bilgi işlem gücündeki dezavantajları onları daha çok bu teknolojiyi kullanan akıllı uygulamalar geliştirmeye yönlendirdi. birçok çinli yapay zeka şirketi, uygulamalarının temelini oluşturmak için amerikan sosyal medya şirketi meta tarafından geliştirilen büyük dil modeli ailesi llama’yı kullandı. 

liang için daha az bilgi işlem gücüyle model geliştirmek, uzun vadeli amacı doğrultusunda kritik bir adımdır. yerel medyaya yaptığı açıklamada, 'amacımız agı (genel yapay zeka) ve bunu başarmak için sınırlı kaynaklarla üstün yeteneklere sahip yeni model yapıları keşfetmemiz gerekiyor' demiştir.

batı'yı şaşırtan deepseek’in yeni modeli r1, şirketin ilerleme kaydettiğini gösteriyor. şirket, modelin eğitilme maliyetinin 6 milyon dolardan az olduğunu belirtiyor ki bu, chatgpt’nin üreticisi openaı gibi firmaların benzer modelleri için harcadığı bütçenin yalnızca küçük bir kısmı. openaı’nin ceo’su sam altman, r1’i “etkileyici” olarak nitelendirdi (ancak bunun yanında “çok daha iyi modeller” üreteceklerini söyleyerek “yeni bir rakibe sahip olmanın heyecan verici” olduğunu ekledi)

deepseek’in yükselişi, hem pekin’de hem de silikon vadisi’nde dikkat çekiyor. erken testler, r1 modelinin beklenen güçlü performansını doğrular nitelikte. ancak bazı eleştirmenler, şirketin geliştirme sürecinde kullandığı üst düzey çiplerin sayısını olduğundan az göstermiş olabileceğini öne sürerken, diğerleri bu iddiaların makul olduğunu savunuyor. ayrıca, deepseek’in modellerini amerikan yapay zeka sistemlerinin çıktılarından öğrenerek eğittiği yönünde spekülasyonlar var. openaı, bu sürece 'damıtma' adını verdiğini ve deepseek’in bu yöntemle hizmet şartlarını ihlal ettiğine dair kanıtlara sahip olduğunu iddia ediyor.

deepseek’in verimlilik kazanımları beklentileri tam anlamıyla karşılamasa bile, yine de küresel yapay zeka ekosisteminde önemli bir meydan okuma niteliği taşıyor. çin devlet medyası, şirketi ülkenin yapay zeka alanındaki rekabet gücünü artıracak stratejik bir değer olarak tanımlamakta hızlı davrandı. nitekim, deepseek’in kurucusu liang wenfeng, 20 ocak’ta çin başbakanı li qiang ve bir grup girişimciyle birlikte görüşmeye davet edildi.

buna karşın, yatırım şirketi pinpoint asset management’tan zhang zhiwei, deepseek’in başarısının, çin’in devlet destekli araştırma enstitülerinden veya devlet kontrolündeki şirketlerden değil, bağımsız bir girişim olarak ortaya çıktığını vurguluyor. liang, şirketin hisselerinin çoğunu elinde tutuyor gibi görünüyor ve devlet destekli risk sermayesi yatırımlarından uzak duruyor.

liang, çin’in son 30 yılda batı’da geliştirilen teknolojik temeller üzerine inşa eden bir “takipçi” konumunda olduğunu düşünüyor. temmuz ayında yerel medyaya verdiği bir röportajda, amerika ile çin arasındaki temel farkın “özgünlük ve taklit” olduğunu ifade etti. ona göre, nvidia’nın başarısı yalnızca kendi performansına değil, aynı zamanda batılı şirketler arasındaki güçlü teknolojik işbirliğine dayanıyor. çin’in batı’nın bilgi işlem gücünü taklit etme çabalarının, büyük devlet yatırımlarına rağmen, bu işbirliği eksikliği nedeniyle başarısız olduğunu savunuyor.