Reddit, uzun süredir internetteki sohbetler için bir etkin nokta olmuştur. Her gün yaklaşık 57 milyon kişi makyaj, video oyunları ve elektrikli araba yıkama ipuçları gibi çeşitli konularda sohbet etmek için siteyi ziyaret ediyor.
Son yıllarda Reddit’in sohbetleri Google, OpenAI ve Microsoft gibi şirketler için ücretsiz bir eğitim aracı oldu. Bu şirketler, Silikon Vadisi’ndeki pek çok kişinin teknolojide bir sonraki büyük şey olma yolunda olduğuna inandığı devasa yapay zeka sistemlerinin geliştirilmesinde Reddit konuşmalarından yararlanıyor.
Şimdi Reddit bunun için para almak istiyor. Şirket Salı günü yaptığı açıklamada, dış kuruluşların sosyal ağın çok çeşitli kişisel görüşmelerini indirmesine ve işlemesine olanak tanıyan uygulama programlama arayüzüne veya API’ye erişim için işletmelerden ücret almayı planladığını duyurdu.
Reddit’in kurucusu ve CEO’su Steve Huffman bir röportajda “Reddit veri külliyatı gerçekten değerli” dedi. Ancak bu değeri dünyanın en büyük şirketlerinden bazılarına ücretsiz olarak vermek zorunda değiliz.”
Hareket, OpenAI’nin popüler programı ChatGPT gibi AI sistemlerini geliştirmek amacıyla barındırdığı konuşmalara erişim için ücret alan bir sosyal ağın ilk önemli örneklerinden biridir. Bu yeni AI sistemleri bir gün büyük şirketlere yol açabilir, ancak muhtemelen Reddit gibi şirketlere pek yardımcı olmayacaklar. Aslında, Reddit’in konuşmalarının otomatikleştirilmiş kopyaları olan rakipler oluşturmak için kullanılabilirler.
Reddit’in hamlesi, bu yılın sonlarında olası bir Wall Street halka arzına hazırlanırken de geldi. 2005 yılında kurulan şirket, parasını öncelikle platformundaki reklam ve e-ticaret işlemlerinden kazanıyor. Reddit, API erişimi için ne ücret alacağının ayrıntılarını hâlâ çözdüğünü ve önümüzdeki haftalarda fiyatlandırmayı açıklayacağını söyledi.
Büyük dil modelleri veya LLM’ler yeni yapay zeka teknolojilerinin geliştirilmesinin ayrılmaz bir parçası haline geldikçe, Reddit sohbetleri veya şirketin tabiriyle alt dizinler değerli metalar haline geldi.
Yeni nesil sohbet robotları
5 haritadan 1
Cesur yeni bir dünya. Yapay zekadan güç alan yeni nesil sohbet robotları, teknolojinin internet ekonomisini alt üst edip edemeyeceğini, günümüzün güç merkezlerini geçmişe dönüştürüp endüstrinin yeni devlerini yaratıp yaratmayacağını görmek için bir kapışmaya yol açtı. İşte bilmeniz gereken botlar:
ChatGPT. Araştırma laboratuvarı OpenAI tarafından geliştirilen yapay zeka dil modeli ChatGPT, karmaşık soruları yanıtlama, şiir yazma, kod oluşturma, tatil planlama ve dilleri çevirme becerisiyle Kasım ayından bu yana manşetlerde yer alıyor. Mart ortasında kullanıma sunulan en son sürüm olan GPT-4, görüntülere bile yanıt verebilir (ve Tek Tip Çubuk Sınavını geçebilir).
Am. ChatGPT’nin ilk çıkışından iki ay sonra OpenAI’nin lider yatırımcısı ve ortağı Microsoft, internet arama motoru Bing’e neredeyse her konuda açık metin konuşmaları yapabilen benzer bir sohbet robotu ekledi. Ancak, piyasaya sürüldükten sonra çok fazla dikkat çeken şey, botun zaman zaman yanlış, yanıltıcı ve garip tepkileri oldu.
ernie Arama devi Baidu, Çin’in ilk büyük rakibini Mart ayında ChatGPT’ye sundu. Gelişmiş Temsil Yoluyla Bilgi Entegrasyonunun kısaltması olan Ernie’nin ilk çıkışı, botun vaat edilen “canlı” bir gösteriminin kaydedildiğinin ortaya çıkmasının ardından bir fiyaskoyla sonuçlandı.
LLM’ler, esasen Google ve Microsoft’un yakın bir ortağı olan OpenAI gibi şirketler tarafından geliştirilen gelişmiş algoritmalardır. Algoritmalar için Reddit konuşmaları veridir ve bunları geliştirmek için LLM’lere beslenen geniş malzeme havuzunun bir parçasıdır.
Google’ın sohbete dayalı yapay zeka hizmeti Bard’ın oluşturulmasına yardımcı olan temel algoritma, kısmen Reddit verileri üzerinde eğitilmiştir. OpenAI’nin Chat GPT’si, üzerinde eğitim aldığı bilgi kaynaklarından biri olarak Reddit verilerini aktarır.
Diğer şirketler de barındırdıkları konuşmaların ve görüntülerin değerini görmeye başlıyor. Görüntü barındırma hizmeti Shutterstock, yalnızca metin tabanlı bir bilgi istemiyle yeni, canlı grafik görüntüler oluşturan üretken yapay zeka programı DALL-E’nin geliştirilmesine yardımcı olmak için görüntü verilerini OpenAI’ye de sattı.
Geçen ay, Twitter’ın sahibi Elon Musk, binlerce dış şirket ve bağımsız geliştirici tarafından ağda gerçekleşen milyonlarca konuşmayı izlemek için kullanılan Twitter API’sinin kullanımına sert önlemler aldığını söyledi. Değişikliğin nedeni olarak LLM’leri göstermese de, yeni ücretler onlarca hatta yüzbinlerce doları bulabilir.
Yapay zeka üreticilerinin modellerini daha da geliştirmek için iki temel şeye ihtiyacı var: muazzam bilgi işlem gücü ve muazzam miktarda veri. En büyük AI geliştiricilerinden bazıları, bol miktarda bilgi işlem gücüne sahiptir, ancak yine de algoritmalarını geliştirmek için gereken veriler için kendi ağlarının dışına bakar. Buna Wikipedia, milyonlarca sayısallaştırılmış kitap, akademik makale ve Reddit gibi kaynaklar dahildir.
Google, Open AI ve Microsoft temsilcileri, yorum talebine hemen yanıt vermedi.
Reddit, Google ve Microsoft gibi şirketlerin arama motorlarıyla uzun süredir simbiyotik bir ilişki sürdürüyor. Arama motorları, bilgileri indekslemek ve arama sonuçlarında kullanılabilir kılmak için Reddit’in web sayfalarını “tarar”. Bu tarama veya “kazıma”, internetteki her web sitesi tarafından her zaman hoş karşılanmaz. Ancak Reddit, arama sonuçlarında daha üst sıralarda görünmekten faydalandı.
Dinamik LLM’ler için farklıdır – sohbet robotları gibi yeni AI sistemleri oluşturmak için ellerinden geldiğince çok veri toplarlar.
Reddit, sürekli güncellendiği için verilerinin özellikle değerli olduğunu düşünüyor. Bay Huffman, bu yenilik ve alaka düzeyinin, büyük dil modelleme algoritmalarının en iyi sonuçları elde etmek için ihtiyaç duyduğu şey olduğunu söyledi.
Bay Huffman, “İnternetteki diğer tüm yerlerden daha fazla, Reddit gerçek sohbetler için bir yuvadır” dedi. “Sitede sadece terapide ya da AA’da söyleyeceğiniz ya da hiç söylemeyeceğiniz pek çok şey var.”
Bay Huffman, Reddit’in API’sinin, insanların Reddit’i kullanmasına yardımcı olacak uygulamalar geliştirmek isteyen geliştiriciler için ücretsiz olmaya devam edeceğini söyledi. Araçları, örneğin, kullanıcıların yorumlarının bir alt dizin kurallarına uyup uymadığını otomatik olarak izleyen bir bot oluşturmak için kullanabilirsiniz. Reddit verilerini akademik veya ticari olmayan amaçlarla incelemek isteyen araştırmacılar, bu verilere ücretsiz olarak erişmeye devam edecek.
Reddit ayrıca, sözde makine öğrenimini sitenin kendisinin nasıl çalıştığına dahil etmeyi umuyor. Örneğin, Reddit’te AI tarafından oluşturulan metnin kullanımını belirlemek ve kullanıcılara yorumun bir bottan geldiğini bildiren bir etiket eklemek için kullanılabilir.
Şirket ayrıca, sitenin forumlarının sorunsuz çalışması ve kullanıcılar arasındaki konuşmaların iyileştirilmesi için gönüllü olarak zaman ayıran moderatörler tarafından kullanılabilecek yazılım araçlarını geliştirme sözü verdi. Moderatörlerin forumları izlemesine yardımcı olan üçüncü taraf botlar da desteklenmeye devam etmektedir.
Ancak AI yapımcılarının ödeme yapma zamanı.
Huffman, “Reddit’te gezinmek, değerler üretmek ve bu değerlerin hiçbirini kullanıcılarımıza geri döndürmemek, sorunumuz olan bir şey” dedi. “İşleri düzene sokmak için iyi bir zaman.”
“Bunun adil olduğunu düşünüyoruz” diye ekledi.
Son yıllarda Reddit’in sohbetleri Google, OpenAI ve Microsoft gibi şirketler için ücretsiz bir eğitim aracı oldu. Bu şirketler, Silikon Vadisi’ndeki pek çok kişinin teknolojide bir sonraki büyük şey olma yolunda olduğuna inandığı devasa yapay zeka sistemlerinin geliştirilmesinde Reddit konuşmalarından yararlanıyor.
Şimdi Reddit bunun için para almak istiyor. Şirket Salı günü yaptığı açıklamada, dış kuruluşların sosyal ağın çok çeşitli kişisel görüşmelerini indirmesine ve işlemesine olanak tanıyan uygulama programlama arayüzüne veya API’ye erişim için işletmelerden ücret almayı planladığını duyurdu.
Reddit’in kurucusu ve CEO’su Steve Huffman bir röportajda “Reddit veri külliyatı gerçekten değerli” dedi. Ancak bu değeri dünyanın en büyük şirketlerinden bazılarına ücretsiz olarak vermek zorunda değiliz.”
Hareket, OpenAI’nin popüler programı ChatGPT gibi AI sistemlerini geliştirmek amacıyla barındırdığı konuşmalara erişim için ücret alan bir sosyal ağın ilk önemli örneklerinden biridir. Bu yeni AI sistemleri bir gün büyük şirketlere yol açabilir, ancak muhtemelen Reddit gibi şirketlere pek yardımcı olmayacaklar. Aslında, Reddit’in konuşmalarının otomatikleştirilmiş kopyaları olan rakipler oluşturmak için kullanılabilirler.
Reddit’in hamlesi, bu yılın sonlarında olası bir Wall Street halka arzına hazırlanırken de geldi. 2005 yılında kurulan şirket, parasını öncelikle platformundaki reklam ve e-ticaret işlemlerinden kazanıyor. Reddit, API erişimi için ne ücret alacağının ayrıntılarını hâlâ çözdüğünü ve önümüzdeki haftalarda fiyatlandırmayı açıklayacağını söyledi.
Büyük dil modelleri veya LLM’ler yeni yapay zeka teknolojilerinin geliştirilmesinin ayrılmaz bir parçası haline geldikçe, Reddit sohbetleri veya şirketin tabiriyle alt dizinler değerli metalar haline geldi.
Yeni nesil sohbet robotları
5 haritadan 1
Cesur yeni bir dünya. Yapay zekadan güç alan yeni nesil sohbet robotları, teknolojinin internet ekonomisini alt üst edip edemeyeceğini, günümüzün güç merkezlerini geçmişe dönüştürüp endüstrinin yeni devlerini yaratıp yaratmayacağını görmek için bir kapışmaya yol açtı. İşte bilmeniz gereken botlar:
ChatGPT. Araştırma laboratuvarı OpenAI tarafından geliştirilen yapay zeka dil modeli ChatGPT, karmaşık soruları yanıtlama, şiir yazma, kod oluşturma, tatil planlama ve dilleri çevirme becerisiyle Kasım ayından bu yana manşetlerde yer alıyor. Mart ortasında kullanıma sunulan en son sürüm olan GPT-4, görüntülere bile yanıt verebilir (ve Tek Tip Çubuk Sınavını geçebilir).
Am. ChatGPT’nin ilk çıkışından iki ay sonra OpenAI’nin lider yatırımcısı ve ortağı Microsoft, internet arama motoru Bing’e neredeyse her konuda açık metin konuşmaları yapabilen benzer bir sohbet robotu ekledi. Ancak, piyasaya sürüldükten sonra çok fazla dikkat çeken şey, botun zaman zaman yanlış, yanıltıcı ve garip tepkileri oldu.
ernie Arama devi Baidu, Çin’in ilk büyük rakibini Mart ayında ChatGPT’ye sundu. Gelişmiş Temsil Yoluyla Bilgi Entegrasyonunun kısaltması olan Ernie’nin ilk çıkışı, botun vaat edilen “canlı” bir gösteriminin kaydedildiğinin ortaya çıkmasının ardından bir fiyaskoyla sonuçlandı.
LLM’ler, esasen Google ve Microsoft’un yakın bir ortağı olan OpenAI gibi şirketler tarafından geliştirilen gelişmiş algoritmalardır. Algoritmalar için Reddit konuşmaları veridir ve bunları geliştirmek için LLM’lere beslenen geniş malzeme havuzunun bir parçasıdır.
Google’ın sohbete dayalı yapay zeka hizmeti Bard’ın oluşturulmasına yardımcı olan temel algoritma, kısmen Reddit verileri üzerinde eğitilmiştir. OpenAI’nin Chat GPT’si, üzerinde eğitim aldığı bilgi kaynaklarından biri olarak Reddit verilerini aktarır.
Diğer şirketler de barındırdıkları konuşmaların ve görüntülerin değerini görmeye başlıyor. Görüntü barındırma hizmeti Shutterstock, yalnızca metin tabanlı bir bilgi istemiyle yeni, canlı grafik görüntüler oluşturan üretken yapay zeka programı DALL-E’nin geliştirilmesine yardımcı olmak için görüntü verilerini OpenAI’ye de sattı.
Geçen ay, Twitter’ın sahibi Elon Musk, binlerce dış şirket ve bağımsız geliştirici tarafından ağda gerçekleşen milyonlarca konuşmayı izlemek için kullanılan Twitter API’sinin kullanımına sert önlemler aldığını söyledi. Değişikliğin nedeni olarak LLM’leri göstermese de, yeni ücretler onlarca hatta yüzbinlerce doları bulabilir.
Yapay zeka üreticilerinin modellerini daha da geliştirmek için iki temel şeye ihtiyacı var: muazzam bilgi işlem gücü ve muazzam miktarda veri. En büyük AI geliştiricilerinden bazıları, bol miktarda bilgi işlem gücüne sahiptir, ancak yine de algoritmalarını geliştirmek için gereken veriler için kendi ağlarının dışına bakar. Buna Wikipedia, milyonlarca sayısallaştırılmış kitap, akademik makale ve Reddit gibi kaynaklar dahildir.
Google, Open AI ve Microsoft temsilcileri, yorum talebine hemen yanıt vermedi.
Reddit, Google ve Microsoft gibi şirketlerin arama motorlarıyla uzun süredir simbiyotik bir ilişki sürdürüyor. Arama motorları, bilgileri indekslemek ve arama sonuçlarında kullanılabilir kılmak için Reddit’in web sayfalarını “tarar”. Bu tarama veya “kazıma”, internetteki her web sitesi tarafından her zaman hoş karşılanmaz. Ancak Reddit, arama sonuçlarında daha üst sıralarda görünmekten faydalandı.
Dinamik LLM’ler için farklıdır – sohbet robotları gibi yeni AI sistemleri oluşturmak için ellerinden geldiğince çok veri toplarlar.
Reddit, sürekli güncellendiği için verilerinin özellikle değerli olduğunu düşünüyor. Bay Huffman, bu yenilik ve alaka düzeyinin, büyük dil modelleme algoritmalarının en iyi sonuçları elde etmek için ihtiyaç duyduğu şey olduğunu söyledi.
Bay Huffman, “İnternetteki diğer tüm yerlerden daha fazla, Reddit gerçek sohbetler için bir yuvadır” dedi. “Sitede sadece terapide ya da AA’da söyleyeceğiniz ya da hiç söylemeyeceğiniz pek çok şey var.”
Bay Huffman, Reddit’in API’sinin, insanların Reddit’i kullanmasına yardımcı olacak uygulamalar geliştirmek isteyen geliştiriciler için ücretsiz olmaya devam edeceğini söyledi. Araçları, örneğin, kullanıcıların yorumlarının bir alt dizin kurallarına uyup uymadığını otomatik olarak izleyen bir bot oluşturmak için kullanabilirsiniz. Reddit verilerini akademik veya ticari olmayan amaçlarla incelemek isteyen araştırmacılar, bu verilere ücretsiz olarak erişmeye devam edecek.
Reddit ayrıca, sözde makine öğrenimini sitenin kendisinin nasıl çalıştığına dahil etmeyi umuyor. Örneğin, Reddit’te AI tarafından oluşturulan metnin kullanımını belirlemek ve kullanıcılara yorumun bir bottan geldiğini bildiren bir etiket eklemek için kullanılabilir.
Şirket ayrıca, sitenin forumlarının sorunsuz çalışması ve kullanıcılar arasındaki konuşmaların iyileştirilmesi için gönüllü olarak zaman ayıran moderatörler tarafından kullanılabilecek yazılım araçlarını geliştirme sözü verdi. Moderatörlerin forumları izlemesine yardımcı olan üçüncü taraf botlar da desteklenmeye devam etmektedir.
Ancak AI yapımcılarının ödeme yapma zamanı.
Huffman, “Reddit’te gezinmek, değerler üretmek ve bu değerlerin hiçbirini kullanıcılarımıza geri döndürmemek, sorunumuz olan bir şey” dedi. “İşleri düzene sokmak için iyi bir zaman.”
“Bunun adil olduğunu düşünüyoruz” diye ekledi.