Kendi yapay zekalarını öğretmek için yapay zekayı kullanan teknoloji şirketleri hakkında bilmeniz gerekenler

Teletabi · 6 Nis 2024

OpenAI, Google ve diğer teknoloji şirketleri, sohbet robotlarını kitaplardan, Wikipedia makalelerinden, haberlerden ve İnternet'teki diğer kaynaklardan toplanan büyük miktardaki verilerle eğitiyor. Ancak gelecekte sentetik veriler olarak adlandırılan verileri kullanabilmeyi umuyorlar.

Bunun nedeni, teknoloji şirketlerinin yapay zekayı geliştirmek için İnternet'in sunduğu yüksek kaliteli metinlerden yararlanıyor olabilmesidir. Şirketler, eserlerini izinsiz kullandıkları için yazarlardan, haber kuruluşlarından ve bilgisayar programcılarından telif hakkı davalarıyla karşı karşıya kalıyor. (Böyle bir davada Haberler, OpenAI ve Microsoft'a dava açtı.)

Sentetik verilerin telif hakkı sorunlarını azaltmaya ve yapay zeka eğitim materyallerinin tedarikini artırmaya yardımcı olacağına inanıyorlar. İşte bu konuda bilmeniz gerekenler.

Sentetik Veri Nedir?

Yapay zekanın ürettiği verilerdir.

Bu, teknoloji şirketlerinin yapay zekanın yapay zeka tarafından eğitilmesini istediği anlamına mı geliyor?

Evet. Google, OpenAI ve Anthropic gibi teknoloji şirketleri, yapay zeka modellerini insanlar tarafından yazılan metinlerle eğitmek yerine, teknolojilerini diğer yapay zeka modelleri tarafından oluşturulan verilerle eğitmeyi umuyor.

Sentetik veriler işe yarıyor mu?

Tam olarak değil. Yapay zeka modelleri bazı şeyleri yanlış anlıyor ve uyduruyor. Ayrıca eğitildikleri internet verilerinde ortaya çıkan önyargıları da tanıdıklarını gösterdiler. Dolayısıyla şirketler yapay zekayı eğitmek için yapay zekayı kullandıklarında, sonunda kendi hatalarını pekiştirebilirler.

Sentetik veriler şu anda teknoloji şirketleri tarafından yaygın olarak kullanılıyor mu?

HAYIR. Teknoloji şirketleri bu konuda denemeler yapıyor. Ancak sentetik verilerin potansiyel eksiklikleri nedeniyle günümüzde yapay zeka sistemlerinin oluşturulma biçiminde önemli bir rol oynamıyor.

Peki teknoloji şirketleri neden geleceğin sentetik veriler olduğunu söylüyor?

Şirketler sentetik verilerin oluşturulma şeklini iyileştirebileceklerine inanıyor. OpenAI ve diğerleri, daha kullanışlı ve güvenilir sentetik veriler üretmek için iki farklı yapay zeka modelinin birlikte çalıştığı bir tekniği araştırıyorlar.

Verileri bir yapay zeka modeli oluşturur. Daha sonra ikinci bir model, tıpkı bir insan gibi verileri değerlendiriyor ve verilerin iyi mi kötü mü, doğru mu yanlış mı olduğuna karar veriyor. Yapay zeka modelleri aslında metinleri yazabileceklerinden daha iyi değerlendirebiliyor.

Yapay zeka girişimi SynthLabs'ın CEO'su Nathan Lile, “Teknolojiye iki şeyi bağlarsanız, hangisinin en iyi göründüğüne hemen hemen karar verebilirsiniz” dedi.

Buradaki fikir, bunun daha iyi bir chatbot yetiştirmek için gereken yüksek kaliteli verileri sağlayacağıdır.

Bu teknik işe yarıyor mu?

Bir şekilde. Her şey bu ikinci yapay zeka modeline bağlı. Metinleri ne kadar iyi değerlendirebiliyorsunuz?

Anthropic, bunu başarıya ulaştırma çabalarını en çok dile getiren kişi oldu. İkinci yapay zeka modelini şirketin araştırmacıları tarafından belirlenen bir “anayasaya” dayanarak optimize ediyor. Bu, modele Özgürlük, Eşitlik ve Kardeşlik veya Yaşam, Özgürlük ve Kişisel Güvenlik gibi belirli ilkeleri destekleyen metinleri seçmeyi öğretir. Anthropic'in yöntemi “Anayasal Yapay Zeka” olarak biliniyor.

Anthropic'inkine benzer bir süreç kullanarak sentetik veriler oluşturmak için iki yapay zeka modelinin birlikte nasıl çalıştığı aşağıda açıklanmıştır:

Yine de ikinci yapay zeka modelinin yolunda gitmesini sağlamak için insanlara ihtiyaç var. Bu, bu sürecin ne kadar sentetik veri üretebileceğini sınırlar. Ve araştırmacılar, Anthropic'inki gibi bir yöntemin yapay zeka sistemlerini geliştirmeye devam edip etmeyeceği konusunda bölünmüş durumda.

Sentetik veriler şirketlerin özel bilgileri kullanmaktan kaçınmasına yardımcı oluyor mu?

Sentetik veriler üreten yapay zeka modelleri ise, çoğu telif hakkıyla korunan, insan tarafından üretilen veriler üzerinde eğitildi. Bu nedenle telif hakkı sahipleri, OpenAI ve Anthropic gibi şirketlerin telif hakkıyla korunan metin, resim ve videoları izinsiz kullandığını hâlâ iddia edebilir.

British Columbia Üniversitesi'nde bilgisayar bilimi profesörü olan ve daha önce OpenAI'de araştırmacı olarak çalışan Jeff Clune, yapay zeka modellerinin eninde sonunda bazı açılardan insan beyninden daha güçlü hale gelebileceğini söyledi. Ama bunu insan beyninden öğrendikleri için yapacaklar.

“Newton'u özetlemek gerekirse yapay zeka, devasa insan veri setlerinin omuzlarında durarak daha ileriyi görüyor” dedi.

Kendi yapay zekalarını öğretmek için yapay zekayı kullanan teknoloji şirketleri hakkında bilmeniz gerekenler

Teletabi

Administrator