bizim ikincimizde beş bölümlük diziTeknolojinin gerçekte nasıl çalıştığını açıklayacağım.
ChatGPT’ye, Microsoft’un Bing sohbet botuna ve Google’ın Bard’ına güç veren yapay zekalar, insan benzeri konuşmalar yapabilir ve sonsuz çeşitlilikte konularda doğal, akıcı metinler yazabilir. Ayrıca kod yazmaktan bir çocuğun doğum günü partisini planlamaya kadar karmaşık görevleri de yerine getirebilirler.
Ama hepsi nasıl çalışıyor? Buna cevap vermek için, sözde büyük dil modelinin başlığının altına bakmamız gerekiyor – bu sistemlere güç veren yapay zeka türü.
Büyük Dil Modelleri veya LLM’ler, AI sahnesinde nispeten yenidir. İlki yaklaşık beş yıl önce çıktı ve pek iyi değildi. Ancak bugün e-postalar, sunumlar ve kısa notlar yazabiliyor ve size bir yabancı dil öğretebiliyorlar. Teknoloji geliştikçe ve Silikon Vadisi para kazanmaya çabalarken, önümüzdeki aylarda ve yıllarda daha fazla fırsatın ortaya çıkacağı kesin.
Size sıfırdan büyük bir dil modeli kurma, işleri basitleştirme ve zor matematiğin çoğunu çıkarma konusunda yol göstereceğim. Diyelim ki e-postalarınızı yanıtlamanıza yardımcı olacak bir LLM oluşturmaya çalışıyoruz. Biz buna MailBot diyoruz.
1. Adım: Bir hedef belirleyin
Her AI sisteminin bir hedefe ihtiyacı vardır. Araştırmacılar buna bir amaç fonksiyonu. Örneğin, “olabildiğince çok satranç oyunu kazanın” kadar basit veya “sadece amino asit dizilerini kullanarak proteinlerin üç boyutlu şeklini tahmin etmek” kadar karmaşık olabilir.
Başlıca dil modellerinin çoğu aynı temel amaç işlevine sahiptir: bir metin dizisi verildiğinde, sonra ne geleceğini tahmin edin. MailBot’a daha sonra daha spesifik hedefler vereceğiz, ancak şimdilik buna bağlı kalalım.
2. Adım: Çok sayıda veri toplayın
Daha sonra MailBot’a yazmayı öğretecek eğitim verilerini toplamamız gerekiyor. İdeal olarak, blog gönderileri, tweet’ler, Wikipedia makaleleri ve haberler gibi, genellikle web’den kazınmış milyarlarca sayfa anlamına gelen devasa bir metin koleksiyonu oluşturuyoruz.
Yeni nesil sohbet robotları
5 haritadan 1
Cesur yeni bir dünya. Yapay zekadan güç alan yeni nesil sohbet robotları, teknolojinin internet ekonomisini alt üst edip edemeyeceğini, günümüzün güç merkezlerini geçmişe dönüştürüp endüstrinin yeni devlerini yaratıp yaratmayacağını görmek için bir kapışmaya yol açtı. İşte bilmeniz gereken botlar:
ChatGPT. Araştırma laboratuvarı OpenAI tarafından geliştirilen yapay zeka dil modeli ChatGPT, karmaşık soruları yanıtlama, şiir yazma, kod oluşturma, tatil planlama ve dilleri çevirme becerisiyle Kasım ayından bu yana manşetlerde yer alıyor. Mart ortasında kullanıma sunulan en son sürüm olan GPT-4, görüntülere bile yanıt verebilir (ve Tek Tip Çubuk Sınavını geçebilir).
Am. ChatGPT’nin ilk çıkışından iki ay sonra OpenAI’nin lider yatırımcısı ve ortağı Microsoft, internet arama motoru Bing’e neredeyse her konuda açık metin konuşmaları yapabilen benzer bir sohbet robotu ekledi. Ancak, piyasaya sürüldükten sonra çok fazla dikkat çeken şey, botun zaman zaman yanlış, yanıltıcı ve garip tepkileri oldu.
ernie Arama devi Baidu, Çin’in ilk büyük rakibini Mart ayında ChatGPT’ye sundu. Gelişmiş Temsil Yoluyla Bilgi Entegrasyonunun kısaltması olan Ernie’nin ilk çıkışı, botun vaat edilen “canlı” bir gösteriminin kaydedildiğinin ortaya çıkmasının ardından bir fiyaskoyla sonuçlandı.
Başlamak için bazı ücretsiz, halka açık veri kitaplıkları kullanıyoruz, ör. B. web verileri için Ortak Tarama Deposu. Ancak, özel veya özel veriler biçiminde kendi gizli sosumuzu da eklemek istiyoruz. MailBot’un İngilizce’ye ek olarak Fransızca veya İspanyolca e-postalar yazabilmesi için yabancı dilde metin lisansı verebiliriz. Genel olarak, ne kadar çok veriye sahip olursak ve kaynaklar ne kadar çeşitli olursa, modelimiz o kadar iyi olacaktır.
Verileri modelimize aktarmadan önce, onu belirteç adı verilen sözcükler, deyimler ve hatta tek tek karakterler olabilen birimlere ayırmamız gerekir. Metni ısırık büyüklüğünde parçalara dönüştürmek, bir modelin metni daha kolay ayrıştırmasına yardımcı olur.
3. Adım: Sinir ağınızı oluşturun
Verilerimiz tokenize edildikten sonra, yapay zekanın “beynini” – sinir ağı olarak bilinen bir sistem türü – bir araya getirmemiz gerekiyor. Bu, bilgileri işleyen ve depolayan birbirine bağlı düğümlerden (veya “nöronlardan”) oluşan karmaşık bir ağdır.
MailBot için nispeten yeni bir tür sinir ağı kullanmak istiyoruz. trafo modeli. Birden fazla metin parçasını aynı anda analiz ederek onları daha hızlı ve daha verimli hale getirebilirsiniz. (Transformatör modelleri, tam kısaltması “Generative Pretrained Transformer” anlamına gelen ChatGPT gibi sistemlerin anahtarıdır.)
4. Adım: Sinir ağınızı eğitin
Daha sonra model, kalıpları ve ilişkileri belirleyerek verileri belirteç bazında analiz eder. “Sevgili”nin ardından genellikle bir adın geldiğini veya “Saygılarımla”nın genellikle adınızdan önce geldiğini fark edebilirsiniz. AI, bu kalıpları tanımlayarak anlamlı mesajlar oluşturmayı öğrenir.
Sistem ayrıca bir bağlam duygusu geliştirir. Örneğin, çevredeki kelimelere bağlı olarak “banka”nın bir finans kuruluşuna veya bir nehir kıyısına atıfta bulunabileceğini öğrenebilir.
Bu kalıpları öğrenirken, Transformer modeli bir harita çizer: insan dilinin son derece karmaşık bir matematiksel temsili. olarak bilinen sayısal değerlerle bu ilişkileri izler. parametre. Günümüzün en iyi LLM’lerinin çoğu, yüz milyarlarca veya daha fazla parametreye sahiptir.
Eğitim günler hatta haftalar alabilir ve muazzam bilgi işlem gücü gerektirir. Ancak bittiğinde, e-postalarınızı yazmaya başlamak için neredeyse hazırdır.
Garip bir şekilde, başka yetenekler de geliştirebilir. LLM’ler bir dizideki bir sonraki kelimeyi tekrar tekrar tahmin etmeyi öğrendikçe, aşağıdakiler gibi başka beklenmedik beceriler de kazanabilirler: B. Kodlamayı bilmek. Yapay zeka araştırmacıları bu davranışları acil olarak adlandırıyor ve hala bazen gizemli kalıyorlar.
5. Adım: Modelinizi optimize edin
Büyük bir dil modeli eğitildikten sonra, belirli bir iş için kalibre edilmesi gerekir. Örneğin, bir hastane tarafından kullanılan bir chatbot’un tıbbi terminolojiyi anlaması gerekir.
MailBot’u optimize etmek için, ondan bir dizi e-posta oluşturmasını isteyebilir, doğruluk açısından derecelendirmeleri için insanları işe alabilir ve ardından, iyileşene kadar derecelendirmeleri modele geri besleyebiliriz.
Bu, ChatGPT ile kullanılan yaklaşımın yaklaşık bir tahminidir. İnsan geri bildirimi ile pekiştirmeli öğrenme.
Adım 6: Dikkatlice Başlayın
Tebrikler! MailBot eğitildikten ve ince ayar yapıldıktan sonra kullanıma hazırdır. Bunun için bir tür kullanıcı arabirimi oluşturduktan sonra – e-posta uygulamanıza takılan bir Chrome uzantısı gibi – e-posta göndermeye başlayabilir.
Ancak ne kadar iyi görünürse görünsün, yine de yeni asistanınıza göz kulak olmak isteyeceksiniz. Microsoft ve Meta gibi şirketler zor yoldan öğrendikçe, AI sistemleri öngörülemez ve öngörülemez, hatta ürkütücü ve tehlikeli hale gelebilir.
Yarın, işlerin beklenmedik ve bazen rahatsız edici şekillerde nasıl ters gidebileceği hakkında daha fazla şey duyacağız.
Onun ev ödevi
LLM’lerin daha yaratıcı becerilerinden birini inceleyelim: farklı konseptleri ve formatları tuhaf ve yeni bir şeye dönüştürme yeteneği. Örneğin, Well’deki meslektaşlarımız ChatGPT’den “Dr. Seuss kullanır”.
Bugünün ödevi için, “Küresel ısınma hakkında bir Snoop Dogg Limerick yazın” gibi bir biçim, stil ve konuyu karıştırıp eşleştirmeye çalışın.
Kreasyonunuzu yorum olarak paylaşmayı unutmayın.
bilgi yarışması
3 sorudan 1. soru
ChatGPT gibi büyük dil modellerinin birincil amaç işlevi nedir?
Cevabınızı seçerek testi başlatın.
sözlük
ChatGPT’ye, Microsoft’un Bing sohbet botuna ve Google’ın Bard’ına güç veren yapay zekalar, insan benzeri konuşmalar yapabilir ve sonsuz çeşitlilikte konularda doğal, akıcı metinler yazabilir. Ayrıca kod yazmaktan bir çocuğun doğum günü partisini planlamaya kadar karmaşık görevleri de yerine getirebilirler.
Ama hepsi nasıl çalışıyor? Buna cevap vermek için, sözde büyük dil modelinin başlığının altına bakmamız gerekiyor – bu sistemlere güç veren yapay zeka türü.
Büyük Dil Modelleri veya LLM’ler, AI sahnesinde nispeten yenidir. İlki yaklaşık beş yıl önce çıktı ve pek iyi değildi. Ancak bugün e-postalar, sunumlar ve kısa notlar yazabiliyor ve size bir yabancı dil öğretebiliyorlar. Teknoloji geliştikçe ve Silikon Vadisi para kazanmaya çabalarken, önümüzdeki aylarda ve yıllarda daha fazla fırsatın ortaya çıkacağı kesin.
Size sıfırdan büyük bir dil modeli kurma, işleri basitleştirme ve zor matematiğin çoğunu çıkarma konusunda yol göstereceğim. Diyelim ki e-postalarınızı yanıtlamanıza yardımcı olacak bir LLM oluşturmaya çalışıyoruz. Biz buna MailBot diyoruz.
1. Adım: Bir hedef belirleyin
Her AI sisteminin bir hedefe ihtiyacı vardır. Araştırmacılar buna bir amaç fonksiyonu. Örneğin, “olabildiğince çok satranç oyunu kazanın” kadar basit veya “sadece amino asit dizilerini kullanarak proteinlerin üç boyutlu şeklini tahmin etmek” kadar karmaşık olabilir.
Başlıca dil modellerinin çoğu aynı temel amaç işlevine sahiptir: bir metin dizisi verildiğinde, sonra ne geleceğini tahmin edin. MailBot’a daha sonra daha spesifik hedefler vereceğiz, ancak şimdilik buna bağlı kalalım.
2. Adım: Çok sayıda veri toplayın
Daha sonra MailBot’a yazmayı öğretecek eğitim verilerini toplamamız gerekiyor. İdeal olarak, blog gönderileri, tweet’ler, Wikipedia makaleleri ve haberler gibi, genellikle web’den kazınmış milyarlarca sayfa anlamına gelen devasa bir metin koleksiyonu oluşturuyoruz.
Yeni nesil sohbet robotları
5 haritadan 1
Cesur yeni bir dünya. Yapay zekadan güç alan yeni nesil sohbet robotları, teknolojinin internet ekonomisini alt üst edip edemeyeceğini, günümüzün güç merkezlerini geçmişe dönüştürüp endüstrinin yeni devlerini yaratıp yaratmayacağını görmek için bir kapışmaya yol açtı. İşte bilmeniz gereken botlar:
ChatGPT. Araştırma laboratuvarı OpenAI tarafından geliştirilen yapay zeka dil modeli ChatGPT, karmaşık soruları yanıtlama, şiir yazma, kod oluşturma, tatil planlama ve dilleri çevirme becerisiyle Kasım ayından bu yana manşetlerde yer alıyor. Mart ortasında kullanıma sunulan en son sürüm olan GPT-4, görüntülere bile yanıt verebilir (ve Tek Tip Çubuk Sınavını geçebilir).
Am. ChatGPT’nin ilk çıkışından iki ay sonra OpenAI’nin lider yatırımcısı ve ortağı Microsoft, internet arama motoru Bing’e neredeyse her konuda açık metin konuşmaları yapabilen benzer bir sohbet robotu ekledi. Ancak, piyasaya sürüldükten sonra çok fazla dikkat çeken şey, botun zaman zaman yanlış, yanıltıcı ve garip tepkileri oldu.
ernie Arama devi Baidu, Çin’in ilk büyük rakibini Mart ayında ChatGPT’ye sundu. Gelişmiş Temsil Yoluyla Bilgi Entegrasyonunun kısaltması olan Ernie’nin ilk çıkışı, botun vaat edilen “canlı” bir gösteriminin kaydedildiğinin ortaya çıkmasının ardından bir fiyaskoyla sonuçlandı.
Başlamak için bazı ücretsiz, halka açık veri kitaplıkları kullanıyoruz, ör. B. web verileri için Ortak Tarama Deposu. Ancak, özel veya özel veriler biçiminde kendi gizli sosumuzu da eklemek istiyoruz. MailBot’un İngilizce’ye ek olarak Fransızca veya İspanyolca e-postalar yazabilmesi için yabancı dilde metin lisansı verebiliriz. Genel olarak, ne kadar çok veriye sahip olursak ve kaynaklar ne kadar çeşitli olursa, modelimiz o kadar iyi olacaktır.
Verileri modelimize aktarmadan önce, onu belirteç adı verilen sözcükler, deyimler ve hatta tek tek karakterler olabilen birimlere ayırmamız gerekir. Metni ısırık büyüklüğünde parçalara dönüştürmek, bir modelin metni daha kolay ayrıştırmasına yardımcı olur.
3. Adım: Sinir ağınızı oluşturun
Verilerimiz tokenize edildikten sonra, yapay zekanın “beynini” – sinir ağı olarak bilinen bir sistem türü – bir araya getirmemiz gerekiyor. Bu, bilgileri işleyen ve depolayan birbirine bağlı düğümlerden (veya “nöronlardan”) oluşan karmaşık bir ağdır.
MailBot için nispeten yeni bir tür sinir ağı kullanmak istiyoruz. trafo modeli. Birden fazla metin parçasını aynı anda analiz ederek onları daha hızlı ve daha verimli hale getirebilirsiniz. (Transformatör modelleri, tam kısaltması “Generative Pretrained Transformer” anlamına gelen ChatGPT gibi sistemlerin anahtarıdır.)
4. Adım: Sinir ağınızı eğitin
Daha sonra model, kalıpları ve ilişkileri belirleyerek verileri belirteç bazında analiz eder. “Sevgili”nin ardından genellikle bir adın geldiğini veya “Saygılarımla”nın genellikle adınızdan önce geldiğini fark edebilirsiniz. AI, bu kalıpları tanımlayarak anlamlı mesajlar oluşturmayı öğrenir.
Sistem ayrıca bir bağlam duygusu geliştirir. Örneğin, çevredeki kelimelere bağlı olarak “banka”nın bir finans kuruluşuna veya bir nehir kıyısına atıfta bulunabileceğini öğrenebilir.
Bu kalıpları öğrenirken, Transformer modeli bir harita çizer: insan dilinin son derece karmaşık bir matematiksel temsili. olarak bilinen sayısal değerlerle bu ilişkileri izler. parametre. Günümüzün en iyi LLM’lerinin çoğu, yüz milyarlarca veya daha fazla parametreye sahiptir.
Eğitim günler hatta haftalar alabilir ve muazzam bilgi işlem gücü gerektirir. Ancak bittiğinde, e-postalarınızı yazmaya başlamak için neredeyse hazırdır.
Garip bir şekilde, başka yetenekler de geliştirebilir. LLM’ler bir dizideki bir sonraki kelimeyi tekrar tekrar tahmin etmeyi öğrendikçe, aşağıdakiler gibi başka beklenmedik beceriler de kazanabilirler: B. Kodlamayı bilmek. Yapay zeka araştırmacıları bu davranışları acil olarak adlandırıyor ve hala bazen gizemli kalıyorlar.
5. Adım: Modelinizi optimize edin
Büyük bir dil modeli eğitildikten sonra, belirli bir iş için kalibre edilmesi gerekir. Örneğin, bir hastane tarafından kullanılan bir chatbot’un tıbbi terminolojiyi anlaması gerekir.
MailBot’u optimize etmek için, ondan bir dizi e-posta oluşturmasını isteyebilir, doğruluk açısından derecelendirmeleri için insanları işe alabilir ve ardından, iyileşene kadar derecelendirmeleri modele geri besleyebiliriz.
Bu, ChatGPT ile kullanılan yaklaşımın yaklaşık bir tahminidir. İnsan geri bildirimi ile pekiştirmeli öğrenme.
Adım 6: Dikkatlice Başlayın
Tebrikler! MailBot eğitildikten ve ince ayar yapıldıktan sonra kullanıma hazırdır. Bunun için bir tür kullanıcı arabirimi oluşturduktan sonra – e-posta uygulamanıza takılan bir Chrome uzantısı gibi – e-posta göndermeye başlayabilir.
Ancak ne kadar iyi görünürse görünsün, yine de yeni asistanınıza göz kulak olmak isteyeceksiniz. Microsoft ve Meta gibi şirketler zor yoldan öğrendikçe, AI sistemleri öngörülemez ve öngörülemez, hatta ürkütücü ve tehlikeli hale gelebilir.
Yarın, işlerin beklenmedik ve bazen rahatsız edici şekillerde nasıl ters gidebileceği hakkında daha fazla şey duyacağız.
Onun ev ödevi
LLM’lerin daha yaratıcı becerilerinden birini inceleyelim: farklı konseptleri ve formatları tuhaf ve yeni bir şeye dönüştürme yeteneği. Örneğin, Well’deki meslektaşlarımız ChatGPT’den “Dr. Seuss kullanır”.
Bugünün ödevi için, “Küresel ısınma hakkında bir Snoop Dogg Limerick yazın” gibi bir biçim, stil ve konuyu karıştırıp eşleştirmeye çalışın.
Kreasyonunuzu yorum olarak paylaşmayı unutmayın.
bilgi yarışması
3 sorudan 1. soru
ChatGPT gibi büyük dil modellerinin birincil amaç işlevi nedir?
Cevabınızı seçerek testi başlatın.
sözlük
Trafo modeli: Kelimeleri tek tek analiz etmeye ihtiyaç duymayan, ancak bir kerede tüm cümleye bakabilen konuşmayı anlamak için kullanışlı bir sinir ağı mimarisi. Kendini tanıma adı verilen bir teknik, modelin cümlenin anlamını anlamak için önemli olan belirli kelimelere odaklanmasını sağlar.
Parametre: Daha sonra hangi kelimelerin geleceğini tahmin etmesine yardımcı olan ipuçları gibi, büyük bir dil modelinin yapısını ve davranışını tanımlayan sayısal değerler. GPT-4 gibi modern sistemlerin yüz milyarlarca parametreye sahip olduğuna inanılıyor.
Takviyeli Öğrenme: Bir yapay zeka modeline deneme yanılma yoluyla en iyi sonucu bulmayı ve sonuçlarına göre bir algoritmadan ödül veya ceza almayı öğreten bir teknik. Bu sistem, insanların performansı hakkında geri bildirim sağlamasıyla geliştirilebilir.