İki yıl önce, Baidu ve Alibaba gibi bilinen Çinli teknoloji şirketleri, Silikon Vadisi'nin canlı duyurular ve yeni sohbet botları ile yapay zekada ilerlemesi farklı bir yaklaşım izledi. Araştırmaya başladı.
Strateji ödendi.
Çinli girişim, daha iyi finanse edilen Amerikan rakiplerinin tekliflerinden çok daha ucuz olan güçlü bir AI modeli yaratma iddiasıyla teknoloji dünyasını tahrif etti.
Çin ve ABD arasındaki yapay zeka kuralı hakkında rekabette Deepseek hiçbir yerden çıkmış gibi görünüyordu. Aslında, son yıllarda, Çin teknoloji dünyasından geleneksel bir şey olan bir yolla yükseldi.
Araştırma yapmanın misyonu, 2022 sonbaharında AI'ya kıyasla Amerikan imzası olan Silikon Vadisi Şirketi Openaai gibi şirketleri yansıtmaktadır. Ancak, benzerlikler genellikle burada biter.
Deepseek'in kökenleri, teknoloji için teknoloji açısından değil finansta. High-Flyer adlı bir Çin hedge fonu olan ana şirket, insanlığın AI gibi açık AI gibi korunduğu bir laboratuvar olarak değil, Çin borsalarında bahis oynamak için AI kullanan bir şirket olarak başladı.
High-Flyer, dürtüsel ve donatma ile tanınan Çin'in perakende yatırımcılarının hakim olduğu bir pazarda fayda sağlayarak zencefil oldu. 2021'de yüksek uçuş, Pekin'deki yetkililerin pazarları sakin tutma girişimleriyle çeliştiklerine inandıkları spekülatif ticaret sırasında Çin'de düzenleyici yaklaşımla baskı altına alındı.
Yani High Flyer, Çin hükümetinin önceliklerini daha iyi organize etmek için yeni bir fırsat kullandı: İleri AI
“Daha yüksek değerli şeyler ve yatırım endüstrisinin ötesine geçen şeyler yapmak istiyoruz, ancak ikinci bir başlangıç yapmaya karşılık gelen yatırımlardan bağımsız olarak yeni bir ekip” bir AI hisse spekülasyonu olarak yanlış yorumlandı. “
Deepseek doğdu. Diğer birçok Çinli girişimde olduğu gibi, Deepseek de farklı bir iş yaklaşımına sahip yerleşik bir pazarda geldi.
Deepseek'in yapay zeka için son modeli neredeyse Amerikalı rakipler kadar güçlü, ancak çok daha verimli hale geliyor. Başarısı Silikon Vadisi'nin AI liderliğinin küçüldüğünü gösteriyor. Washington'un çabalarına rağmen, Deepseek'in Çin Çin'in AI için gerekli gelişmiş cipslere erişimini kısıtlamak için atılımı, bu kontrollerin uzun vadede ne kadar etkili olabileceğini sorgular – Deepseek'in kurucusu bir kısıtlamanın bir kısıtlamasına sahip olduğunu kabul etmesine rağmen var.
Deepseek, satış için tüketiciler için AI ürünleri üretmeye dayanmıyordu ve sadece bu ay her metin ve fotoğrafın basit komutlarla oluşturabileceği ilk sohbet botunu yayınladı. Bunun yerine şirket, yüksek flyers'ın banka ve fahri araştırmalarla hisse senedi ticaretinden yapılmış parayı kullandı. Yaklaşım onu nihayetinde tüketim malları için şirket olan ABD rakiplerinden ayırıyor.
Bu alışılmadık yaklaşım, Deepseek'te Çin hükümetinin kamuoyunun kullanımı konusundaki katı düzenlemelerini atlamayı mümkün kıldı. Çünkü odak noktası, modellerini kullanan şirketlere araştırma ve satışa – ve bu ay sohbet botunun yayınlanmasına kadar tüketici uygulamaları değil – ilk çalışmaları aynı devlet kısıtlamalarını tetiklemedi.
Deepseek, Doğu Hangzhou kentindeki Zhejiang Üniversitesi'nde eğitim gören ince, fren mühendisi genel müdürü Liang Wenfeng tarafından yönetiliyor. Çin medyasına verdiği birkaç röportajda, Çin şirketlerinin Amerikan yeniliklerini karşılamak için kazanmak için araştırma yapmak zorunda olduğunu söyledi. Deepseek ve High Flyers, yorumlarla ilgili sorulara cevap vermedi.
Çinli teknoloji şirketlerinin “kesinlikle bir sermaye değil, güven eksikliği ve yüksek yetenek yoğunluğunun nasıl organize edilebileceğini bildiğini” söyledi.
Röportajlara ve kamu hesaplarına göre, Bay Liang ile çalışanlar onu derin bir teknik geçmişe sahip yetenekli bir yönetici olarak tanımlıyor.
“O kesinlikle bir INTP,” dedi daha önceki bir Deepseek modelinde çalışan ve Çin'deki gençler arasında popüler bir kişilik testi olan Myers-Briggs testinin introspektif bir kişilik tipine atıfta bulunan Zihan Wang. Wang, “INTP'ler gerçekten iyi araştırmacılar ve keşfetme isteğine sahipler.” Dedi. “Her şeyi kontrol etmek isteyenlerden biri değil.”
Bay Liang, proje zaman çizelgeleri gibi ayrıntılarla sizi çok fazla rahatsız etmedi ve zaman zaman tüm araştırmacı ekibine teşvik edici araştırma soruları gönderdi. Ancak çoğunlukla Bay Liang teknolojiyi ilerletiyor gibiydi ve kârlara odaklanmadı.
Programcıların tutumuna odaklanan birçok Çinli şirketin aksine, Bay Liang, insanları bilgisayar dışından istihdam etmek için bir üne sahiptir. Deepseek çalışanlarındaki Çin'in en iyi üniversitelerinin şair ve beşeri bilimleri, ülkenin zor kolej sınavından klasik Çin şiiri ve as soruları yazmak için modeli eğitiyor.
“Ekibin çoğunluğu Çin'deki en iyi üniversiteleri tamamladı,” dedi San Francisco'daki Baset'te kıdemli bir yazılım mühendisi olan Yineneng Zhang, Deepseek'in bir kısmına yardımcı olmayan bir proje olan Sglang'da, DeepSeeks'teki insanlar sistem inşa etmek için bir proje oluşturmaya yardımcı olmayan bir proje, . “Çok zeki ve çok gençsin.”
Çinli teknoloji şirketleri, yıllardır bilgisayar görüşünde kullanılan yapay zeka uygulamaları için yüz tanıma gibi öncü çalışmalar yürütmektedir. Ancak Openai'nin Chatgpt yayınlaması bir yerleşime yol açtı. Hiçbir Çinli şirket hemen karşılaştırılabilir bir şey yayınlamadığında, birçoğu Amerikan şirketlerinin ileri AI'da bir liderlik ettiği sonucuna varmıştır.
Çin'de bilgisayar bilimcileri devam edebileceklerini kanıtlamaya kararlıydı. 2023'te, Çin'deki birçok şirket, chatgpt gibi chatbotların temelini oluşturan teknoloji olan kendi harika modellerini yayınladı.
Bununla birlikte, gelişmiş modeller oluşturmak, yüz milyonlarca dolara mal olacak çok sayıda cips kullanmalıdır.
Yüksek el ilanları da harcadı. 2021 yılına gelindiğinde, 10.000'den fazla gelişmiş Nvidia A100 yongası gerçekleştirebilen bir avuç Çinli şirketten sadece biriydi.
Ancak Deepseek'in araştırması bunu şaşırtıcı bir avantaj sağladı. Geçen yıl, geliştiricilerin uygulamaları modelleriyle hesapladığı fiyatları önemli ölçüde düşürdü ve daha büyük rakiplerle bir fiyat savaşı başlattı.
Daha önce Deepseek'te çalışan mühendis Bay Wang, inşa ettikleri teknoloji için neredeyse hiç ticari uygulama olmadığını söyledi. Bunun yerine şirket, birçok kişi tarafından birçok amaç için kullanılabilecek bir AI sistemi oluşturmaya odaklandı.
“Zamanım boyunca nasıl para kazandığımız hakkında fazla konuşmadık,” dedi Wang. “Sadece harika bir temel modeline odaklandınız.”
Deepseek'in popülaritesinin önemli bir kısmı, geliştiricilerinin çalışmalarını halka açık hale getirmesidir. Açık kaynak olarak adlandırılan bu tür bilgi alışverişi, bilgisayar yazılımının, internetin ve şimdi yapay zekanın geliştirilmesinin temel taşıydı.
Amerika Birleşik Devletleri'nde AI araştırmacıları ve girişimciler uzun zamandır Deepseek'in teknolojisinin ilerlemesini sürdürüyorlar. Geçen yıl şirket, kendi bilgisayar programlarının oluşturulması için geliştirilen sistemleri piyasaya sürdüğünde başkan oldu.
Şirket için yeni bir zorluk yeni büyük harfine bağlanabilir. Aynı gün, geçen hafta yayınlanan yeni sohbet botunun arkasındaki model olan R1'de, Bay Liang, Çin'in başbakanı Li Qiang ile yuvarlak bir plakada ortaya çıktı.
Deepseek'in ani popülaritesi, Çin Partisi Komünist Partisi'nin çabalarının merkezinde yeniliği teşvik etmek zorunda ve bunun zor olabileceğini kanıtlayabilir, dedi Rand Corporation'a teknoloji analizinin kıdemli danışmanı Jimmy Goodrich, Federal Hükümet. “Deepseek için büyük bir acil durum. Eminim hükümetin beş yıllık planında değildiniz ”dedi.
“Hem parti hem de dünya izlerken bu kaotik kaygısız vizyonu koruyabilir misin?”
Zixu Wang Hong Kong'dan katkı araştırması.
Strateji ödendi.
Çinli girişim, daha iyi finanse edilen Amerikan rakiplerinin tekliflerinden çok daha ucuz olan güçlü bir AI modeli yaratma iddiasıyla teknoloji dünyasını tahrif etti.
Çin ve ABD arasındaki yapay zeka kuralı hakkında rekabette Deepseek hiçbir yerden çıkmış gibi görünüyordu. Aslında, son yıllarda, Çin teknoloji dünyasından geleneksel bir şey olan bir yolla yükseldi.
Araştırma yapmanın misyonu, 2022 sonbaharında AI'ya kıyasla Amerikan imzası olan Silikon Vadisi Şirketi Openaai gibi şirketleri yansıtmaktadır. Ancak, benzerlikler genellikle burada biter.
Deepseek'in kökenleri, teknoloji için teknoloji açısından değil finansta. High-Flyer adlı bir Çin hedge fonu olan ana şirket, insanlığın AI gibi açık AI gibi korunduğu bir laboratuvar olarak değil, Çin borsalarında bahis oynamak için AI kullanan bir şirket olarak başladı.
High-Flyer, dürtüsel ve donatma ile tanınan Çin'in perakende yatırımcılarının hakim olduğu bir pazarda fayda sağlayarak zencefil oldu. 2021'de yüksek uçuş, Pekin'deki yetkililerin pazarları sakin tutma girişimleriyle çeliştiklerine inandıkları spekülatif ticaret sırasında Çin'de düzenleyici yaklaşımla baskı altına alındı.
Yani High Flyer, Çin hükümetinin önceliklerini daha iyi organize etmek için yeni bir fırsat kullandı: İleri AI
“Daha yüksek değerli şeyler ve yatırım endüstrisinin ötesine geçen şeyler yapmak istiyoruz, ancak ikinci bir başlangıç yapmaya karşılık gelen yatırımlardan bağımsız olarak yeni bir ekip” bir AI hisse spekülasyonu olarak yanlış yorumlandı. “
Deepseek doğdu. Diğer birçok Çinli girişimde olduğu gibi, Deepseek de farklı bir iş yaklaşımına sahip yerleşik bir pazarda geldi.
Deepseek'in yapay zeka için son modeli neredeyse Amerikalı rakipler kadar güçlü, ancak çok daha verimli hale geliyor. Başarısı Silikon Vadisi'nin AI liderliğinin küçüldüğünü gösteriyor. Washington'un çabalarına rağmen, Deepseek'in Çin Çin'in AI için gerekli gelişmiş cipslere erişimini kısıtlamak için atılımı, bu kontrollerin uzun vadede ne kadar etkili olabileceğini sorgular – Deepseek'in kurucusu bir kısıtlamanın bir kısıtlamasına sahip olduğunu kabul etmesine rağmen var.
Deepseek, satış için tüketiciler için AI ürünleri üretmeye dayanmıyordu ve sadece bu ay her metin ve fotoğrafın basit komutlarla oluşturabileceği ilk sohbet botunu yayınladı. Bunun yerine şirket, yüksek flyers'ın banka ve fahri araştırmalarla hisse senedi ticaretinden yapılmış parayı kullandı. Yaklaşım onu nihayetinde tüketim malları için şirket olan ABD rakiplerinden ayırıyor.
Bu alışılmadık yaklaşım, Deepseek'te Çin hükümetinin kamuoyunun kullanımı konusundaki katı düzenlemelerini atlamayı mümkün kıldı. Çünkü odak noktası, modellerini kullanan şirketlere araştırma ve satışa – ve bu ay sohbet botunun yayınlanmasına kadar tüketici uygulamaları değil – ilk çalışmaları aynı devlet kısıtlamalarını tetiklemedi.
Deepseek, Doğu Hangzhou kentindeki Zhejiang Üniversitesi'nde eğitim gören ince, fren mühendisi genel müdürü Liang Wenfeng tarafından yönetiliyor. Çin medyasına verdiği birkaç röportajda, Çin şirketlerinin Amerikan yeniliklerini karşılamak için kazanmak için araştırma yapmak zorunda olduğunu söyledi. Deepseek ve High Flyers, yorumlarla ilgili sorulara cevap vermedi.
Çinli teknoloji şirketlerinin “kesinlikle bir sermaye değil, güven eksikliği ve yüksek yetenek yoğunluğunun nasıl organize edilebileceğini bildiğini” söyledi.
Röportajlara ve kamu hesaplarına göre, Bay Liang ile çalışanlar onu derin bir teknik geçmişe sahip yetenekli bir yönetici olarak tanımlıyor.
“O kesinlikle bir INTP,” dedi daha önceki bir Deepseek modelinde çalışan ve Çin'deki gençler arasında popüler bir kişilik testi olan Myers-Briggs testinin introspektif bir kişilik tipine atıfta bulunan Zihan Wang. Wang, “INTP'ler gerçekten iyi araştırmacılar ve keşfetme isteğine sahipler.” Dedi. “Her şeyi kontrol etmek isteyenlerden biri değil.”
Bay Liang, proje zaman çizelgeleri gibi ayrıntılarla sizi çok fazla rahatsız etmedi ve zaman zaman tüm araştırmacı ekibine teşvik edici araştırma soruları gönderdi. Ancak çoğunlukla Bay Liang teknolojiyi ilerletiyor gibiydi ve kârlara odaklanmadı.
Programcıların tutumuna odaklanan birçok Çinli şirketin aksine, Bay Liang, insanları bilgisayar dışından istihdam etmek için bir üne sahiptir. Deepseek çalışanlarındaki Çin'in en iyi üniversitelerinin şair ve beşeri bilimleri, ülkenin zor kolej sınavından klasik Çin şiiri ve as soruları yazmak için modeli eğitiyor.
“Ekibin çoğunluğu Çin'deki en iyi üniversiteleri tamamladı,” dedi San Francisco'daki Baset'te kıdemli bir yazılım mühendisi olan Yineneng Zhang, Deepseek'in bir kısmına yardımcı olmayan bir proje olan Sglang'da, DeepSeeks'teki insanlar sistem inşa etmek için bir proje oluşturmaya yardımcı olmayan bir proje, . “Çok zeki ve çok gençsin.”
Çinli teknoloji şirketleri, yıllardır bilgisayar görüşünde kullanılan yapay zeka uygulamaları için yüz tanıma gibi öncü çalışmalar yürütmektedir. Ancak Openai'nin Chatgpt yayınlaması bir yerleşime yol açtı. Hiçbir Çinli şirket hemen karşılaştırılabilir bir şey yayınlamadığında, birçoğu Amerikan şirketlerinin ileri AI'da bir liderlik ettiği sonucuna varmıştır.
Çin'de bilgisayar bilimcileri devam edebileceklerini kanıtlamaya kararlıydı. 2023'te, Çin'deki birçok şirket, chatgpt gibi chatbotların temelini oluşturan teknoloji olan kendi harika modellerini yayınladı.
Bununla birlikte, gelişmiş modeller oluşturmak, yüz milyonlarca dolara mal olacak çok sayıda cips kullanmalıdır.
Yüksek el ilanları da harcadı. 2021 yılına gelindiğinde, 10.000'den fazla gelişmiş Nvidia A100 yongası gerçekleştirebilen bir avuç Çinli şirketten sadece biriydi.
Ancak Deepseek'in araştırması bunu şaşırtıcı bir avantaj sağladı. Geçen yıl, geliştiricilerin uygulamaları modelleriyle hesapladığı fiyatları önemli ölçüde düşürdü ve daha büyük rakiplerle bir fiyat savaşı başlattı.
Daha önce Deepseek'te çalışan mühendis Bay Wang, inşa ettikleri teknoloji için neredeyse hiç ticari uygulama olmadığını söyledi. Bunun yerine şirket, birçok kişi tarafından birçok amaç için kullanılabilecek bir AI sistemi oluşturmaya odaklandı.
“Zamanım boyunca nasıl para kazandığımız hakkında fazla konuşmadık,” dedi Wang. “Sadece harika bir temel modeline odaklandınız.”
Deepseek'in popülaritesinin önemli bir kısmı, geliştiricilerinin çalışmalarını halka açık hale getirmesidir. Açık kaynak olarak adlandırılan bu tür bilgi alışverişi, bilgisayar yazılımının, internetin ve şimdi yapay zekanın geliştirilmesinin temel taşıydı.
Amerika Birleşik Devletleri'nde AI araştırmacıları ve girişimciler uzun zamandır Deepseek'in teknolojisinin ilerlemesini sürdürüyorlar. Geçen yıl şirket, kendi bilgisayar programlarının oluşturulması için geliştirilen sistemleri piyasaya sürdüğünde başkan oldu.
Şirket için yeni bir zorluk yeni büyük harfine bağlanabilir. Aynı gün, geçen hafta yayınlanan yeni sohbet botunun arkasındaki model olan R1'de, Bay Liang, Çin'in başbakanı Li Qiang ile yuvarlak bir plakada ortaya çıktı.
Deepseek'in ani popülaritesi, Çin Partisi Komünist Partisi'nin çabalarının merkezinde yeniliği teşvik etmek zorunda ve bunun zor olabileceğini kanıtlayabilir, dedi Rand Corporation'a teknoloji analizinin kıdemli danışmanı Jimmy Goodrich, Federal Hükümet. “Deepseek için büyük bir acil durum. Eminim hükümetin beş yıllık planında değildiniz ”dedi.
“Hem parti hem de dünya izlerken bu kaotik kaygısız vizyonu koruyabilir misin?”
Zixu Wang Hong Kong'dan katkı araştırması.