Noel'in ertesi günü, DeepSeek adlı küçük bir Çinli girişim, OpenAI ve Google gibi şirketlerin son teknoloji sohbet robotlarının yeteneklerine rakip olabilecek yeni bir yapay zeka sistemini tanıttı.
Bu tek başına bir dönüm noktası olurdu. Ancak sistemin arkasındaki DeepSeek-V3 adlı ekip daha da büyük bir adımın atıldığını açıkladı. Teknolojiyi nasıl geliştirdiklerini açıklayan bir araştırma makalesinde DeepSeek mühendisleri, önde gelen yapay zeka şirketlerinin sistemlerini eğitmek için güvendiği son derece uzmanlaşmış bilgisayar çiplerinin yalnızca bir kısmını kullandıklarını söyledi.
Bu çipler, ABD ile Çin arasındaki gergin teknoloji rekabetinin merkezinde yer alıyor. ABD hükümeti, küresel yapay zeka rekabetinde ülkenin liderliğini korumaya çalışırken, Silikon Vadisi şirketi Nvidia tarafından üretilen ve Çin'e ve diğer rakiplere satılabilen güçlü çiplerin sayısını sınırlamaya çalışıyor.
Ancak DeepSeek modelinin performansı, Amerikan hükümetinin ticaret kısıtlamalarının istenmeyen sonuçlarına ilişkin soruları gündeme getiriyor. Kontroller, Çin'deki araştırmacıları çevrimiçi olarak ücretsiz olarak kullanılabilen çok çeşitli araçlarla yaratıcı olmaya zorladı.
DeepSeek sohbet robotu, Amerikan yapay zeka şirketleri tarafından yürütülen kıyaslama testlerine göre soruları yanıtladı, mantık sorunlarını çözdü ve halihazırda piyasada bulunan herhangi bir şey kadar yetkin bir şekilde kendi bilgisayar programlarını yazdı.
Üstelik düşük maliyetle geliştirildi ve yalnızca teknoloji endüstrisindeki (hepsi de ABD merkezli) en büyük şirketlerin en gelişmiş yapay zeka sistemlerini üretmeye gücü yettiği fikrine meydan okudu. Çinli mühendisler, yeni sistemlerini oluşturmak için yalnızca yaklaşık 6 milyon dolarlık saf bilgi işlem gücüne ihtiyaç duyduklarını söyledi. Bu, teknoloji devi Meta'nın en son yapay zeka teknolojisini oluşturmak için harcadığı paradan yaklaşık on kat daha az.
Risk sermayesi şirketi Page One Ventures'ın yatırımcılarından Chris V. Nicholson, “6 milyon dolar harcayabilen şirketlerin sayısı, 100 milyon dolar veya 1 milyar dolar harcayabilen şirketlerin sayısından çok daha fazla” dedi: Yapay zeka: teknolojiler.
OpenAI, ChatGPT'nin 2022'de piyasaya sürülmesiyle yapay zeka patlamasını başlattığından beri birçok uzman ve yatırımcı, hiçbir şirketin özel çiplere yüz milyonlarca dolar harcamadan pazar liderleriyle rekabet edemeyeceği sonucuna vardı.
Dünyanın önde gelen yapay zeka şirketleri, sohbet robotlarını 16.000'e kadar, hatta daha fazla çip kullanan süper bilgisayarları kullanarak eğitiyor. DeepSeek'in mühendisleri ise Nvidia'dan yalnızca 2.000 kadar özel bilgisayar çipine ihtiyaç duyduklarını söyledi.
George Washington Üniversitesi'nde gelişmekte olan teknolojiler ve uluslararası ilişkiler konusunda uzmanlaşmış yardımcı doçent Jeffrey Ding, Çin'deki çip kısıtlamalarının DeepSeek mühendislerini “rekabetçi olmaya devam edebilmeleri için onları daha verimli eğitmeye” zorladığını söyledi.
Bu ayın başlarında Biden yönetimi, Çin'in diğer ülkelerden gelişmiş yapay zeka çipleri tedarik etmesini engellemeyi amaçlayan yeni kurallar yayınladı. Kurallar, Çinli şirketlerin son teknoloji bilgisayar çiplerini satın almasını veya üretmesini engelleyen daha önceki birkaç tur kısıtlamaya dayanıyor. Başkan Trump henüz kuralları yürürlükte mi tutacağını yoksa yürürlükten mi kaldıracağını belirtmedi.
ABD hükümeti, askeri amaçlarla kullanılabileceği endişesi nedeniyle gelişmiş çipleri Çinli şirketlerden uzak tutmaya çalıştı. Buna karşılık, Çin'deki bazı şirketler binlerce çipi stoklarken, diğerleri bunları kaçakçıların yer altı pazarından temin etti.
DeepSeek, High Flyer adlı kantitatif bir hisse senedi alım satım şirketi tarafından işletilmektedir. 2021 yılına gelindiğinde şirket, kârını önceki modellerini eğitmek için kullandığı binlerce Nvidia yongasını satın almaya aktardı. Yorum taleplerine yanıt vermeyen şirket, Çin'de en iyi üniversitelerden genç yetenekleri yüksek maaş vaadiyle ve onların en çok ilgisini çeken araştırma sorularını takip etme becerisiyle işe almasıyla tanınıyor.
Daha önceki bir DeepSeek modeli üzerinde çalışan bilgisayar mühendisi Zihan Wang, şirketin aynı zamanda teknolojiyi anlamak ve Çin üniversitelerine yönelik giriş sınavında oldukça zor olduğu bilinen Cevapla için şiirler ve sorular üretebilmek için bilgisayar bilimi geçmişi olmayan kişileri de işe aldığını söyledi.
DeepSeek tüketici ürünleri üretmediğinden mühendislerinin yalnızca araştırmaya odaklanmasına olanak tanır. Bu, teknolojisinin, tüketiciye yönelik teknolojinin hükümet bilgi kontrollerine uymasını gerektiren Çin'in yapay zeka düzenlemelerinin en katı yönü tarafından kısıtlanmadığı anlamına geliyor.
Amerika'nın önde gelen şirketleri yapay zekadaki en ileri teknolojiyi geliştirmeye devam ediyor. Aralık ayında OpenAI, o3 adı verilen ve mevcut teknolojilerden daha iyi performans gösteren yeni bir “akıl yürütme” sistemini tanıttı, ancak bu sistem henüz şirket dışında yaygın olarak kullanıma sunulmadı. Ancak DeepSeek bunun çok da geride olmadığını göstermeye devam ediyor. Bu ay kendine ait etkileyici bir argüman modeli yayınladı.
(Haberler, OpenAI ve ortağı Microsoft'u, yapay zeka sistemleriyle ilgili haber içeriğinin telif hakkını ihlal etmekle suçlayarak dava açtı. OpenAI ve Microsoft bu iddiaları reddetti.)
Hızla değişen bu küresel pazarın önemli bir parçası eski bir fikirdir: açık kaynaklı yazılım. Diğer birçok şirket gibi DeepSeek de en son yapay zeka sistemini açık kaynak haline getirdi; bu, temel kodu diğer şirketler ve araştırmacılarla paylaştığı anlamına geliyor. Bu, diğerlerinin aynı teknolojileri kullanarak kendi ürünlerini geliştirmelerine ve satmalarına olanak tanır.
Büyük Çin teknoloji şirketlerindeki çalışanlar meslektaşlarıyla işbirliği yapmakla sınırlı olsa da, San Francisco'daki Baseten'de açık kaynak üzerinde çalışan kıdemli yazılım mühendisi Yineng Zhang, “açık kaynak üzerinde çalıştığınızda, dünyanın her yerindeki yeteneklerle çalışırsınız” dedi. kaynak SGLang Projesi. DeepSeek sistemini kullanarak diğer kişi ve şirketlerin ürün geliştirmelerine yardımcı oluyor.
Açık kaynak yapay zeka ekosistemi, 2023 yılında Meta'nın LLama adlı bir yapay zeka sistemini özgürce paylaşmasıyla ivme kazandı. Birçoğu, bu topluluğun ancak Meta gibi şirketlerin (özel çiplerle dolu devasa veri merkezlerine sahip teknoloji devleri) teknolojilerini açık kaynak olarak kullanmaya devam etmesi durumunda gelişeceğini varsaydı. Ancak DeepSeek ve diğerleri kendilerinin de açık kaynak teknolojilerinin gücünü artırabileceğini gösterdi.”
Pek çok yönetici ve uzman, büyük ABD şirketlerinin teknolojilerini açık kaynak olarak sunmamaları gerektiğini çünkü bunların dezenformasyon yaymak veya başka ciddi zararlar vermek için kullanılabileceğini savundu. Bazı ABD yasa koyucuları bu uygulamayı önleme veya kısıtlama olasılığını inceledi.
Ancak diğerleri, düzenleyicilerin ABD'deki açık kaynak teknolojisinin ilerlemesini yavaşlatması durumunda Çin'in önemli bir avantaj elde edeceğini savunuyor. En iyi açık kaynak teknolojileri Çin'den gelseydi, ABD'li geliştiricilerin sistemlerini bu teknolojiler üzerine kuracaklarını öne sürüyorlar. Uzun vadede bu, Çin'i yapay zeka araştırma ve geliştirmesinin merkezi haline getirebilir.
Berkeley'deki California Üniversitesi'nden bilgisayar bilimi profesörü Ion Stoica, “Açık kaynak topluluğunun odağı Çin'e kaydı” dedi. “Bu ABD için büyük bir tehdit olabilir” çünkü Çin'in yeni teknolojilerin gelişimini hızlandırmasına olanak tanıyor.
Başkan Trump, göreve başlamasından birkaç saat sonra, Biden yönetiminin açık kaynak teknolojilerini kısıtlama tehdidinde bulunan başkanlık emrini yürürlükten kaldırdı.
Dr. Stoica ve öğrencileri yakın zamanda, belirli kıyaslama testlerinde OpenAI o1 adı verilen en son OpenAI sisteminin performansıyla eşleşebilecek Sky-T1 adlı bir yapay zeka sistemi geliştirdi. Yalnızca 450 dolarlık bilgi işlem gücüne ihtiyaç duyuyorlardı.
Bunu, Çinli teknoloji devi Alibaba'nın piyasaya sürdüğü iki açık kaynak teknolojisini temel alarak başardılar.
450 dolarlık sistemleri OpenAI teknolojisi veya DeepSeek'in yeni sistemi kadar güçlü değil. Ve kullandıkları tekniklerin önde gelen teknolojilerden daha iyi performans gösteren sistemlere yol açması pek olası değildir. Ancak proje, minimum kaynaklara sahip şirketlerin bile rekabetçi sistemler kurabileceğini gösterdi.
Toronto'da teknoloji danışmanı olan Reuven Cohen, Aralık ayının sonundan bu yana DeepSeek-V3'ü kullanıyor. Bunun OpenAI, Google ve San Francisco merkezli start-up Anthropic'in en yeni sistemleriyle karşılaştırılabilir olduğunu ve kullanımının çok daha ucuz olduğunu söylüyor.
“DeepSeek benim için para biriktirmenin bir yolu” dedi. “Bu benim gibi birinin kullanmak isteyeceği türden bir teknoloji.”
Bu tek başına bir dönüm noktası olurdu. Ancak sistemin arkasındaki DeepSeek-V3 adlı ekip daha da büyük bir adımın atıldığını açıkladı. Teknolojiyi nasıl geliştirdiklerini açıklayan bir araştırma makalesinde DeepSeek mühendisleri, önde gelen yapay zeka şirketlerinin sistemlerini eğitmek için güvendiği son derece uzmanlaşmış bilgisayar çiplerinin yalnızca bir kısmını kullandıklarını söyledi.
Bu çipler, ABD ile Çin arasındaki gergin teknoloji rekabetinin merkezinde yer alıyor. ABD hükümeti, küresel yapay zeka rekabetinde ülkenin liderliğini korumaya çalışırken, Silikon Vadisi şirketi Nvidia tarafından üretilen ve Çin'e ve diğer rakiplere satılabilen güçlü çiplerin sayısını sınırlamaya çalışıyor.
Ancak DeepSeek modelinin performansı, Amerikan hükümetinin ticaret kısıtlamalarının istenmeyen sonuçlarına ilişkin soruları gündeme getiriyor. Kontroller, Çin'deki araştırmacıları çevrimiçi olarak ücretsiz olarak kullanılabilen çok çeşitli araçlarla yaratıcı olmaya zorladı.
DeepSeek sohbet robotu, Amerikan yapay zeka şirketleri tarafından yürütülen kıyaslama testlerine göre soruları yanıtladı, mantık sorunlarını çözdü ve halihazırda piyasada bulunan herhangi bir şey kadar yetkin bir şekilde kendi bilgisayar programlarını yazdı.
Üstelik düşük maliyetle geliştirildi ve yalnızca teknoloji endüstrisindeki (hepsi de ABD merkezli) en büyük şirketlerin en gelişmiş yapay zeka sistemlerini üretmeye gücü yettiği fikrine meydan okudu. Çinli mühendisler, yeni sistemlerini oluşturmak için yalnızca yaklaşık 6 milyon dolarlık saf bilgi işlem gücüne ihtiyaç duyduklarını söyledi. Bu, teknoloji devi Meta'nın en son yapay zeka teknolojisini oluşturmak için harcadığı paradan yaklaşık on kat daha az.
Risk sermayesi şirketi Page One Ventures'ın yatırımcılarından Chris V. Nicholson, “6 milyon dolar harcayabilen şirketlerin sayısı, 100 milyon dolar veya 1 milyar dolar harcayabilen şirketlerin sayısından çok daha fazla” dedi: Yapay zeka: teknolojiler.
OpenAI, ChatGPT'nin 2022'de piyasaya sürülmesiyle yapay zeka patlamasını başlattığından beri birçok uzman ve yatırımcı, hiçbir şirketin özel çiplere yüz milyonlarca dolar harcamadan pazar liderleriyle rekabet edemeyeceği sonucuna vardı.
Dünyanın önde gelen yapay zeka şirketleri, sohbet robotlarını 16.000'e kadar, hatta daha fazla çip kullanan süper bilgisayarları kullanarak eğitiyor. DeepSeek'in mühendisleri ise Nvidia'dan yalnızca 2.000 kadar özel bilgisayar çipine ihtiyaç duyduklarını söyledi.
George Washington Üniversitesi'nde gelişmekte olan teknolojiler ve uluslararası ilişkiler konusunda uzmanlaşmış yardımcı doçent Jeffrey Ding, Çin'deki çip kısıtlamalarının DeepSeek mühendislerini “rekabetçi olmaya devam edebilmeleri için onları daha verimli eğitmeye” zorladığını söyledi.
Bu ayın başlarında Biden yönetimi, Çin'in diğer ülkelerden gelişmiş yapay zeka çipleri tedarik etmesini engellemeyi amaçlayan yeni kurallar yayınladı. Kurallar, Çinli şirketlerin son teknoloji bilgisayar çiplerini satın almasını veya üretmesini engelleyen daha önceki birkaç tur kısıtlamaya dayanıyor. Başkan Trump henüz kuralları yürürlükte mi tutacağını yoksa yürürlükten mi kaldıracağını belirtmedi.
ABD hükümeti, askeri amaçlarla kullanılabileceği endişesi nedeniyle gelişmiş çipleri Çinli şirketlerden uzak tutmaya çalıştı. Buna karşılık, Çin'deki bazı şirketler binlerce çipi stoklarken, diğerleri bunları kaçakçıların yer altı pazarından temin etti.
DeepSeek, High Flyer adlı kantitatif bir hisse senedi alım satım şirketi tarafından işletilmektedir. 2021 yılına gelindiğinde şirket, kârını önceki modellerini eğitmek için kullandığı binlerce Nvidia yongasını satın almaya aktardı. Yorum taleplerine yanıt vermeyen şirket, Çin'de en iyi üniversitelerden genç yetenekleri yüksek maaş vaadiyle ve onların en çok ilgisini çeken araştırma sorularını takip etme becerisiyle işe almasıyla tanınıyor.
Daha önceki bir DeepSeek modeli üzerinde çalışan bilgisayar mühendisi Zihan Wang, şirketin aynı zamanda teknolojiyi anlamak ve Çin üniversitelerine yönelik giriş sınavında oldukça zor olduğu bilinen Cevapla için şiirler ve sorular üretebilmek için bilgisayar bilimi geçmişi olmayan kişileri de işe aldığını söyledi.
DeepSeek tüketici ürünleri üretmediğinden mühendislerinin yalnızca araştırmaya odaklanmasına olanak tanır. Bu, teknolojisinin, tüketiciye yönelik teknolojinin hükümet bilgi kontrollerine uymasını gerektiren Çin'in yapay zeka düzenlemelerinin en katı yönü tarafından kısıtlanmadığı anlamına geliyor.
Amerika'nın önde gelen şirketleri yapay zekadaki en ileri teknolojiyi geliştirmeye devam ediyor. Aralık ayında OpenAI, o3 adı verilen ve mevcut teknolojilerden daha iyi performans gösteren yeni bir “akıl yürütme” sistemini tanıttı, ancak bu sistem henüz şirket dışında yaygın olarak kullanıma sunulmadı. Ancak DeepSeek bunun çok da geride olmadığını göstermeye devam ediyor. Bu ay kendine ait etkileyici bir argüman modeli yayınladı.
(Haberler, OpenAI ve ortağı Microsoft'u, yapay zeka sistemleriyle ilgili haber içeriğinin telif hakkını ihlal etmekle suçlayarak dava açtı. OpenAI ve Microsoft bu iddiaları reddetti.)
Hızla değişen bu küresel pazarın önemli bir parçası eski bir fikirdir: açık kaynaklı yazılım. Diğer birçok şirket gibi DeepSeek de en son yapay zeka sistemini açık kaynak haline getirdi; bu, temel kodu diğer şirketler ve araştırmacılarla paylaştığı anlamına geliyor. Bu, diğerlerinin aynı teknolojileri kullanarak kendi ürünlerini geliştirmelerine ve satmalarına olanak tanır.
Büyük Çin teknoloji şirketlerindeki çalışanlar meslektaşlarıyla işbirliği yapmakla sınırlı olsa da, San Francisco'daki Baseten'de açık kaynak üzerinde çalışan kıdemli yazılım mühendisi Yineng Zhang, “açık kaynak üzerinde çalıştığınızda, dünyanın her yerindeki yeteneklerle çalışırsınız” dedi. kaynak SGLang Projesi. DeepSeek sistemini kullanarak diğer kişi ve şirketlerin ürün geliştirmelerine yardımcı oluyor.
Açık kaynak yapay zeka ekosistemi, 2023 yılında Meta'nın LLama adlı bir yapay zeka sistemini özgürce paylaşmasıyla ivme kazandı. Birçoğu, bu topluluğun ancak Meta gibi şirketlerin (özel çiplerle dolu devasa veri merkezlerine sahip teknoloji devleri) teknolojilerini açık kaynak olarak kullanmaya devam etmesi durumunda gelişeceğini varsaydı. Ancak DeepSeek ve diğerleri kendilerinin de açık kaynak teknolojilerinin gücünü artırabileceğini gösterdi.”
Pek çok yönetici ve uzman, büyük ABD şirketlerinin teknolojilerini açık kaynak olarak sunmamaları gerektiğini çünkü bunların dezenformasyon yaymak veya başka ciddi zararlar vermek için kullanılabileceğini savundu. Bazı ABD yasa koyucuları bu uygulamayı önleme veya kısıtlama olasılığını inceledi.
Ancak diğerleri, düzenleyicilerin ABD'deki açık kaynak teknolojisinin ilerlemesini yavaşlatması durumunda Çin'in önemli bir avantaj elde edeceğini savunuyor. En iyi açık kaynak teknolojileri Çin'den gelseydi, ABD'li geliştiricilerin sistemlerini bu teknolojiler üzerine kuracaklarını öne sürüyorlar. Uzun vadede bu, Çin'i yapay zeka araştırma ve geliştirmesinin merkezi haline getirebilir.
Berkeley'deki California Üniversitesi'nden bilgisayar bilimi profesörü Ion Stoica, “Açık kaynak topluluğunun odağı Çin'e kaydı” dedi. “Bu ABD için büyük bir tehdit olabilir” çünkü Çin'in yeni teknolojilerin gelişimini hızlandırmasına olanak tanıyor.
Başkan Trump, göreve başlamasından birkaç saat sonra, Biden yönetiminin açık kaynak teknolojilerini kısıtlama tehdidinde bulunan başkanlık emrini yürürlükten kaldırdı.
Dr. Stoica ve öğrencileri yakın zamanda, belirli kıyaslama testlerinde OpenAI o1 adı verilen en son OpenAI sisteminin performansıyla eşleşebilecek Sky-T1 adlı bir yapay zeka sistemi geliştirdi. Yalnızca 450 dolarlık bilgi işlem gücüne ihtiyaç duyuyorlardı.
Bunu, Çinli teknoloji devi Alibaba'nın piyasaya sürdüğü iki açık kaynak teknolojisini temel alarak başardılar.
450 dolarlık sistemleri OpenAI teknolojisi veya DeepSeek'in yeni sistemi kadar güçlü değil. Ve kullandıkları tekniklerin önde gelen teknolojilerden daha iyi performans gösteren sistemlere yol açması pek olası değildir. Ancak proje, minimum kaynaklara sahip şirketlerin bile rekabetçi sistemler kurabileceğini gösterdi.
Toronto'da teknoloji danışmanı olan Reuven Cohen, Aralık ayının sonundan bu yana DeepSeek-V3'ü kullanıyor. Bunun OpenAI, Google ve San Francisco merkezli start-up Anthropic'in en yeni sistemleriyle karşılaştırılabilir olduğunu ve kullanımının çok daha ucuz olduğunu söylüyor.
“DeepSeek benim için para biriktirmenin bir yolu” dedi. “Bu benim gibi birinin kullanmak isteyeceği türden bir teknoloji.”