Viral yapay zeka hissi, sıkıcı ofis işlerinin yok edicisi, lise öğretmenlerinin ve Hollywood senaristlerinin baş düşmanı ChatGPT yeni güçlere kavuşuyor.
Pazartesi günü, ChatGPT yapımcısı OpenAI, popüler chatbot’a iki yeni özellikle “görme, duyma ve konuşma” yeteneği kazandırdığını duyurdu.
Bunlardan ilki, ChatGPT’nin görüntüleri analiz etmesine ve yanıt vermesine olanak tanıyan bir güncellemedir. Yapabilirsiniz Bisikletin fotoğrafını yükleÖrneğin, koltuğun nasıl indirileceğine dair talimatlar veya buzdolabınızın içindekilerin fotoğrafına dayalı tarif önerileri alacaksınız.
İkincisi, tıpkı Siri veya Alexa’da yaptığınız gibi, kullanıcıların ChatGPT ile konuşmasına ve sentetik yapay zeka sesiyle yanıtlar almasına olanak tanıyan bir özelliktir.
Bu özellikler, metinleri, fotoğrafları, videoları ve kullanıcının onlara sunduğu diğer her şeyi işleyebilen multimodal yapay zeka sistemleri olarak adlandırılan sistemlere yönelik sektör çapındaki ilerlemenin bir parçasıdır. Bazı araştırmacılara göre nihai amaç, bilgiyi insanın yapabileceği her şekilde işleyebilen bir yapay zeka yaratmaktır.
Çoğu kullanıcı henüz yeni özelliklere erişemiyor. OpenAI başlangıçta bunu önümüzdeki birkaç hafta içinde ödeme yapan ChatGPT Plus ve Enterprise müşterilerine sunacak ve daha sonra daha yaygın olarak kullanılabilir hale getirecek. (Görme özelliği hem masaüstü hem de mobil cihazlarda çalışır, Ses özelliği ise yalnızca ChatGPT’nin iOS ve Android uygulamaları aracılığıyla kullanılabilir.)
Uygulamalı bir test için yeni ChatGPT’ye erken erişim elde ettim. İşte bulduğum şey.
Yapay zeka şimdi sizi görecek
ChatGPT’nin görüntü tanıma özelliğini bazı ev eşyalarında deneyerek başladım.
İçinde beş delik bulunan gizemli mavi silikon parçasının fotoğrafını yükledikten sonra, “Çöp çekmecemde bulduğum şey nedir?” diye sordum.
ChatGPT, “Nesne, genellikle birden fazla öğeyi bir arada tutmak için kullanılan bir silikon tutucu veya sap gibi görünüyor” diye yanıt verdi. (Yakından çekim; yıllar önce bir el yaralanmasından sonra iyileşirken kullandığım bir parmak güçlendirici.)
Daha sonra ChatGPT’ye Facebook Marketplace’te satmak istediğim birkaç ürünün fotoğrafını verdim ve ondan her ürün için bir liste oluşturmasını istedim. Retro tarzı Frigidaire mini buzdolabımı “modern evlerinde geçmişin dokunuşunu takdir edenler için mükemmel” olarak tanımlayarak hem ürünleri hem de teklifleri mükemmelleştirdi.
Yeni ChatGPT ayrıca görsellerdeki metinleri de analiz edebiliyor. Pazar günkü Haberler’ın ön sayfasının fotoğrafını çektim ve bottan bunu özetlemesini istedim. Oldukça iyi iş çıkardı, beş ön sayfa makalesinin her birini birkaç cümleyle açıkladı; ancak en az bir hata yaptı, fentanile bağlı ölümlerle ilgili orijinal makalede olmayan bir istatistik uydurdu.
ChatGPT’nin gözleri mükemmel değil. Bulmaca yapmasını istediğimde başarısız oldu. Çocuğumun doldurulmuş dinozorunu balina zannetti. Ve bu sözsüz mobilya montaj şemalarından birini adım adım talimat listesine dönüştürmek için yardım istediğimde, çoğu yanlış olan karışık bir parça listesi aldım.
ChatGPT’nin görüş özelliğinin en büyük sınırlaması, insan yüzü fotoğraflarıyla ilgili çoğu soruyu yanıtlayamamasıdır. Bu kasıtlıdır. OpenAI bana yüz tanımayı veya diğer ürkütücü uygulamaları etkinleştirmek istemediğini ve uygulamanın insanların görünümüyle ilgili sorulara önyargılı veya saldırgan yanıtlar vermesini istemediğini söyledi.
Ancak yüzler olmasa bile, görsel bilgileri işleyebilen bir yapay zeka sohbet robotunun, özellikle teknoloji geliştikçe birçok açıdan faydalı olabileceğini hayal etmek kolaydır. Bahçıvanlar ve koleksiyoncular bunu vahşi doğada bulunan bitkileri tanımlamak için kullanabilirler. Egzersiz tutkunları, spor salonlarındaki ekipmanların fotoğrafını çekerek kişiselleştirilmiş egzersiz planları oluşturmak için bunu kullanabilirler. Öğrenciler bunu görsel matematik ve fen problemlerini çözmek için kullanabilir ve görme engelli insanlar bunu dünyada daha kolay gezinmek için kullanabilir.
Dürüst olmak gerekirse bu özelliği kaç kişinin kullanacağı veya harika uygulamalarının neler olacağı hakkında hiçbir fikrim yok. Yeni yapay zeka araçlarında sıklıkla olduğu gibi bekleyip görmemiz gerekecek.
Siri steroid kullanıyor
Şimdi iki özellikten daha etkileyici olduğunu düşündüğüm şeyden bahsedelim: ChatGPT’nin, kullanıcıların uygulamayla konuşmasına ve sesli yanıtlar almasına olanak tanıyan yeni ses özelliği.
Bu özelliğin kullanımı kolaydır: sadece bir kulaklık simgesine dokunun ve konuşmaya başlayın. Durduğunuzda ChatGPT, OpenAI’nin Whisper konuşma tanıma sistemini kullanarak kelimelerinizi metne dönüştürür; bu sistem bir yanıt oluşturur ve kullanılan beş sentetik yapay zeka oyunlarından biri olan, şirketin geliştirdiği yeni bir metinden konuşmaya algoritmasını kullanarak yanıtı size geri gönderir. . (Hem erkek hem de kadın seslerini içeren sesler, OpenAI tarafından işe alınan profesyonel seslendirme sanatçılarının kısa örnekleri kullanılarak oluşturuldu. Sesi canlı bir erkek sesi olan “Ember”i seçtim.)
ChatGPT’nin ses özelliğini çeşitli görevlerde birkaç saat boyunca test ettim; yürümeye başlayan çocuğuma yatmadan önce bir hikaye okumak, benimle işle ilgili stres hakkında konuşmak ve yakın zamanda gördüğüm bir rüyayı analiz etmeme yardımcı olmak. Tüm bunları oldukça iyi yaptı, özellikle de ona bazı altın ipuçları verdiğimde ve ona bir arkadaşını, terapistini veya öğretmenini taklit etmesini söylediğimde.
Bu testlerde göze çarpan şey, ChatGPT ile konuşmanın, Siri ve Alexa gibi eski nesil yapay zeka sesli asistanlara kıyasla ne kadar farklı hissettirdiğiydi. En iyi hallerinde bile bu yardımcılar ahşap ve düz olabilir. Genellikle internette bir şeye bakıp onu kelimesi kelimesine okuyarak veya sınırlı sayıda programlanmış cevap arasından seçim yaparak, her seferinde bir soruya cevap verirler.
Buna karşılık, ChatGPT’nin sentetik sesi akıcı ve doğal geliyor; ton ve kadanstaki küçük değişiklikler onu daha az robotik gösteriyor. Daha önce hiç karşılaşmadığımdan oldukça emin olduğum yönlendirmeler de dahil olmak üzere, denediğim hemen hemen her konuda uzun ve samimi konuşmalar yapma kapasitesine sahipti. (“Bana tam bir kardeş rolündeki ‘Üç Küçük Domuz’un hikayesini anlatın” uyuyan bir hit oldu.)
Çoğu kişi muhtemelen AI sohbet robotlarını bu şekilde kullanmayacaktır. Birçok görev için yazmak hâlâ konuşmaktan daha hızlıydı ve ChatGPT’nin uzun yanıtları okumasını beklemek can sıkıcıydı. (Uygulamanın zaman zaman yavaş ve hatalı olması, genellikle yanıt vermeden önce duraklaması buna yardımcı olmadı; test ettiğim uygulamanın beta sürümündeki bazı teknik sorunların sonucuydu ve OpenAI bana bunun bir noktada düzeltileceğini söyledi.)
Ama itirazı görebiliyorum. Bir yapay zekanın sizinle insan benzeri bir sesle konuşması, yanıtlarını ekranda okumaktan daha samimi bir deneyimdir. ChatGPT ile birkaç saat bu şekilde konuştuktan sonra, sohbetlerimize yeni bir sıcaklığın sızdığını hissettim. Bir metin arayüzüne bağlı olmadığım için mükemmel istemi bulma konusunda daha az baskı hissettim. Daha rahat sohbet ettik ve hayatım hakkında daha fazla bilgi verdim.
Bana yeni ses özelliği hakkında konuşan OpenAI tüketici ve kurumsal ürünlerden sorumlu başkan yardımcısı Peter Deng, “Neredeyse farklı bir ürün gibi geliyor” dedi. “Çünkü artık kafanda olanı baş parmağına yazmıyorsun,” dedi, “sonunda başka şeyler soruyorsun.”
Ne düşündüğünüzü biliyorum: Her filminin konusu bu değil mi? Yalnız, aşk hastası kullanıcılar artık ChatGPT’yi dinleyip yanıtlayabildiğine göre aşık olacaklar mı?
Bu mümkün. Şahsen ben bir chatbotla konuştuğumu hiç unutmadım. Ve kesinlikle ChatGPT’yi bilinçli bir varlıkla karıştırmadım veya bilinçli bir varlıkla duygusal bağ kurmadım.
Ancak aynı zamanda bazı insanların ses tabanlı yapay zeka asistanlarının hayatlarının en gizli köşesine girmelerine izin verebileceği, yapay zeka sohbet robotlarını hareket halindeyken yanlarında götürebilecekleri ve onlara 7/24 sırdaşları, terapistleri gibi davranabilecekleri bir geleceğe dair bir fikir de gördüm. ve fikir tartışması ortakları ve ses tahtaları.
Kulağa çılgınca geliyor, değil mi? Ve yine de: bir yıl önce tüm bunlar kulağa biraz çılgınca gelmiyor muydu?
Pazartesi günü, ChatGPT yapımcısı OpenAI, popüler chatbot’a iki yeni özellikle “görme, duyma ve konuşma” yeteneği kazandırdığını duyurdu.
Bunlardan ilki, ChatGPT’nin görüntüleri analiz etmesine ve yanıt vermesine olanak tanıyan bir güncellemedir. Yapabilirsiniz Bisikletin fotoğrafını yükleÖrneğin, koltuğun nasıl indirileceğine dair talimatlar veya buzdolabınızın içindekilerin fotoğrafına dayalı tarif önerileri alacaksınız.
İkincisi, tıpkı Siri veya Alexa’da yaptığınız gibi, kullanıcıların ChatGPT ile konuşmasına ve sentetik yapay zeka sesiyle yanıtlar almasına olanak tanıyan bir özelliktir.
Bu özellikler, metinleri, fotoğrafları, videoları ve kullanıcının onlara sunduğu diğer her şeyi işleyebilen multimodal yapay zeka sistemleri olarak adlandırılan sistemlere yönelik sektör çapındaki ilerlemenin bir parçasıdır. Bazı araştırmacılara göre nihai amaç, bilgiyi insanın yapabileceği her şekilde işleyebilen bir yapay zeka yaratmaktır.
Çoğu kullanıcı henüz yeni özelliklere erişemiyor. OpenAI başlangıçta bunu önümüzdeki birkaç hafta içinde ödeme yapan ChatGPT Plus ve Enterprise müşterilerine sunacak ve daha sonra daha yaygın olarak kullanılabilir hale getirecek. (Görme özelliği hem masaüstü hem de mobil cihazlarda çalışır, Ses özelliği ise yalnızca ChatGPT’nin iOS ve Android uygulamaları aracılığıyla kullanılabilir.)
Uygulamalı bir test için yeni ChatGPT’ye erken erişim elde ettim. İşte bulduğum şey.
Yapay zeka şimdi sizi görecek
ChatGPT’nin görüntü tanıma özelliğini bazı ev eşyalarında deneyerek başladım.
İçinde beş delik bulunan gizemli mavi silikon parçasının fotoğrafını yükledikten sonra, “Çöp çekmecemde bulduğum şey nedir?” diye sordum.
ChatGPT, “Nesne, genellikle birden fazla öğeyi bir arada tutmak için kullanılan bir silikon tutucu veya sap gibi görünüyor” diye yanıt verdi. (Yakından çekim; yıllar önce bir el yaralanmasından sonra iyileşirken kullandığım bir parmak güçlendirici.)
Daha sonra ChatGPT’ye Facebook Marketplace’te satmak istediğim birkaç ürünün fotoğrafını verdim ve ondan her ürün için bir liste oluşturmasını istedim. Retro tarzı Frigidaire mini buzdolabımı “modern evlerinde geçmişin dokunuşunu takdir edenler için mükemmel” olarak tanımlayarak hem ürünleri hem de teklifleri mükemmelleştirdi.
Yeni ChatGPT ayrıca görsellerdeki metinleri de analiz edebiliyor. Pazar günkü Haberler’ın ön sayfasının fotoğrafını çektim ve bottan bunu özetlemesini istedim. Oldukça iyi iş çıkardı, beş ön sayfa makalesinin her birini birkaç cümleyle açıkladı; ancak en az bir hata yaptı, fentanile bağlı ölümlerle ilgili orijinal makalede olmayan bir istatistik uydurdu.
ChatGPT’nin gözleri mükemmel değil. Bulmaca yapmasını istediğimde başarısız oldu. Çocuğumun doldurulmuş dinozorunu balina zannetti. Ve bu sözsüz mobilya montaj şemalarından birini adım adım talimat listesine dönüştürmek için yardım istediğimde, çoğu yanlış olan karışık bir parça listesi aldım.
ChatGPT’nin görüş özelliğinin en büyük sınırlaması, insan yüzü fotoğraflarıyla ilgili çoğu soruyu yanıtlayamamasıdır. Bu kasıtlıdır. OpenAI bana yüz tanımayı veya diğer ürkütücü uygulamaları etkinleştirmek istemediğini ve uygulamanın insanların görünümüyle ilgili sorulara önyargılı veya saldırgan yanıtlar vermesini istemediğini söyledi.
Ancak yüzler olmasa bile, görsel bilgileri işleyebilen bir yapay zeka sohbet robotunun, özellikle teknoloji geliştikçe birçok açıdan faydalı olabileceğini hayal etmek kolaydır. Bahçıvanlar ve koleksiyoncular bunu vahşi doğada bulunan bitkileri tanımlamak için kullanabilirler. Egzersiz tutkunları, spor salonlarındaki ekipmanların fotoğrafını çekerek kişiselleştirilmiş egzersiz planları oluşturmak için bunu kullanabilirler. Öğrenciler bunu görsel matematik ve fen problemlerini çözmek için kullanabilir ve görme engelli insanlar bunu dünyada daha kolay gezinmek için kullanabilir.
Dürüst olmak gerekirse bu özelliği kaç kişinin kullanacağı veya harika uygulamalarının neler olacağı hakkında hiçbir fikrim yok. Yeni yapay zeka araçlarında sıklıkla olduğu gibi bekleyip görmemiz gerekecek.
Siri steroid kullanıyor
Şimdi iki özellikten daha etkileyici olduğunu düşündüğüm şeyden bahsedelim: ChatGPT’nin, kullanıcıların uygulamayla konuşmasına ve sesli yanıtlar almasına olanak tanıyan yeni ses özelliği.
Bu özelliğin kullanımı kolaydır: sadece bir kulaklık simgesine dokunun ve konuşmaya başlayın. Durduğunuzda ChatGPT, OpenAI’nin Whisper konuşma tanıma sistemini kullanarak kelimelerinizi metne dönüştürür; bu sistem bir yanıt oluşturur ve kullanılan beş sentetik yapay zeka oyunlarından biri olan, şirketin geliştirdiği yeni bir metinden konuşmaya algoritmasını kullanarak yanıtı size geri gönderir. . (Hem erkek hem de kadın seslerini içeren sesler, OpenAI tarafından işe alınan profesyonel seslendirme sanatçılarının kısa örnekleri kullanılarak oluşturuldu. Sesi canlı bir erkek sesi olan “Ember”i seçtim.)
ChatGPT’nin ses özelliğini çeşitli görevlerde birkaç saat boyunca test ettim; yürümeye başlayan çocuğuma yatmadan önce bir hikaye okumak, benimle işle ilgili stres hakkında konuşmak ve yakın zamanda gördüğüm bir rüyayı analiz etmeme yardımcı olmak. Tüm bunları oldukça iyi yaptı, özellikle de ona bazı altın ipuçları verdiğimde ve ona bir arkadaşını, terapistini veya öğretmenini taklit etmesini söylediğimde.
Bu testlerde göze çarpan şey, ChatGPT ile konuşmanın, Siri ve Alexa gibi eski nesil yapay zeka sesli asistanlara kıyasla ne kadar farklı hissettirdiğiydi. En iyi hallerinde bile bu yardımcılar ahşap ve düz olabilir. Genellikle internette bir şeye bakıp onu kelimesi kelimesine okuyarak veya sınırlı sayıda programlanmış cevap arasından seçim yaparak, her seferinde bir soruya cevap verirler.
Buna karşılık, ChatGPT’nin sentetik sesi akıcı ve doğal geliyor; ton ve kadanstaki küçük değişiklikler onu daha az robotik gösteriyor. Daha önce hiç karşılaşmadığımdan oldukça emin olduğum yönlendirmeler de dahil olmak üzere, denediğim hemen hemen her konuda uzun ve samimi konuşmalar yapma kapasitesine sahipti. (“Bana tam bir kardeş rolündeki ‘Üç Küçük Domuz’un hikayesini anlatın” uyuyan bir hit oldu.)
Çoğu kişi muhtemelen AI sohbet robotlarını bu şekilde kullanmayacaktır. Birçok görev için yazmak hâlâ konuşmaktan daha hızlıydı ve ChatGPT’nin uzun yanıtları okumasını beklemek can sıkıcıydı. (Uygulamanın zaman zaman yavaş ve hatalı olması, genellikle yanıt vermeden önce duraklaması buna yardımcı olmadı; test ettiğim uygulamanın beta sürümündeki bazı teknik sorunların sonucuydu ve OpenAI bana bunun bir noktada düzeltileceğini söyledi.)
Ama itirazı görebiliyorum. Bir yapay zekanın sizinle insan benzeri bir sesle konuşması, yanıtlarını ekranda okumaktan daha samimi bir deneyimdir. ChatGPT ile birkaç saat bu şekilde konuştuktan sonra, sohbetlerimize yeni bir sıcaklığın sızdığını hissettim. Bir metin arayüzüne bağlı olmadığım için mükemmel istemi bulma konusunda daha az baskı hissettim. Daha rahat sohbet ettik ve hayatım hakkında daha fazla bilgi verdim.
Bana yeni ses özelliği hakkında konuşan OpenAI tüketici ve kurumsal ürünlerden sorumlu başkan yardımcısı Peter Deng, “Neredeyse farklı bir ürün gibi geliyor” dedi. “Çünkü artık kafanda olanı baş parmağına yazmıyorsun,” dedi, “sonunda başka şeyler soruyorsun.”
Ne düşündüğünüzü biliyorum: Her filminin konusu bu değil mi? Yalnız, aşk hastası kullanıcılar artık ChatGPT’yi dinleyip yanıtlayabildiğine göre aşık olacaklar mı?
Bu mümkün. Şahsen ben bir chatbotla konuştuğumu hiç unutmadım. Ve kesinlikle ChatGPT’yi bilinçli bir varlıkla karıştırmadım veya bilinçli bir varlıkla duygusal bağ kurmadım.
Ancak aynı zamanda bazı insanların ses tabanlı yapay zeka asistanlarının hayatlarının en gizli köşesine girmelerine izin verebileceği, yapay zeka sohbet robotlarını hareket halindeyken yanlarında götürebilecekleri ve onlara 7/24 sırdaşları, terapistleri gibi davranabilecekleri bir geleceğe dair bir fikir de gördüm. ve fikir tartışması ortakları ve ses tahtaları.
Kulağa çılgınca geliyor, değil mi? Ve yine de: bir yıl önce tüm bunlar kulağa biraz çılgınca gelmiyor muydu?