Yenilikçi Bir Fikirle Başlangıç
2016 yılında, Hammad Syed ve eski WhatsApp mühendislerinden Mahmoud Felfel, Medium makalelerini sesli okuyabilen bir Chrome eklentisi geliştirme fikrini ortaya attı. Bu eklenti, Medium’daki hikayeleri okuyabiliyordu ve ilk olarak Product Hunt‘da ön plana çıktı. Bir yıl sonra, bu fikir tamamen yeni bir işe dönüştü.
PlayAI’nin Yükselişi
Syed, TechCrunch ile yaptığı bir röportajda, “Bireylere ve kuruluşlara, uygulamaları için gerçekçi sesli içerik oluşturmalarında yardımcı olmak için daha büyük bir fırsat gördük” dedi. “Kendi modelini oluşturma gereği olmadan, insan kalitesinde ses deneyimlerini her zamankinden daha hızlı sunabiliyorlardı.”
Syed ve Felfel’in kurduğu PlayAI (eski adıyla PlayHT), kendisini “AI’nın ses arayüzü” olarak tanıtıyor. Müşteriler, birçok hazır sesi seçebilir ya da bir sesi kopyalayarak kullanabilir ve PlayAI’nin APIsini entegre ederek metinleri sese dönüştürebilirler. Kullanıcılar, seslerin intonasyonunu, ritmini ve tonunu ayarlama seçeneklerine sahipler.
Otomasyon ve Eğlence Araçları
PlayAI ayrıca, kullanıcıların dosyalarını yükleyerek okuyarak sesli versiyonlar oluşturan bir “playground” sundu. Son zamanlarda, işletmelerin müşteri çağrılarına yanıt vermek gibi görevleri otomatikleştirmek için kullanılan “AI ajanları” oyununa da girdi.
Şirketin en ilginç deneylerinden biri olan PlayNote, PDF’leri, videoları, fotoğrafları ve müzikleri podcast tarzı programlara dönüştürüyor. Bu araçlar, yüklenen dosya veya URL’den senaryo üreterek, çeşitli AI modelleri ile son ürünü oluşturuyor.
Ben de bu aracı denedim ve aldığım sonuçlar hiç fena değildi. PlayNote’un “podcast” ayarı, kalite açısından NotebookLM ile eşdeğer sonuçlar üretiyor ve aracın fotoğrafları ve videoları anlama yeteneği oldukça ilginç. Geçenlerde yediğim bir tavuk mole yemeğinin fotoğrafını verdiğimde, PlayNote beş dakikalık bir podcast senaryosu yazdı. Gerçekten, gelecekte yaşıyoruz.
Elbette bu araç, tıpkı diğer AI araçları gibi zaman zaman garip sonuçlar ve yanlış bilgiler üretiyor. Ayrıca, PlayNote’un bir dosyayı seçtiğiniz formata uyarlama çabasına rağmen, kuru bir yasal belgenin iyi bir kaynak olmadığını unutmamalısınız.
Etik ve Güvenlik Sorunları
PlayNote’un podcast formatı, PlayAI’nin en son modeli olan PlayDialog sayesinde mümkün. Syed, bu modelin “bir konuşmanın bağlamını ve tarihini” kullanarak akışa uygun bir ses ürettiğini belirtti. “Bir konuşmanın tarihsel bağlamını kullanarak prosodi, duygu ve tempoyu kontrol edip, doğal bir teslimat ve uygun bir ton sunan PlayDialog ile konuşma gerçekleştiriyoruz” dedi.
Ancak, PlayAI geçmişte ElevenLabs ile oldukça rekabetçi bir ortamdayken, daha önce yeterince güvenlik önlemleri almamakla eleştirildi. Şirketin ses kopyalama aracı, kullanıcıların “gerekli tüm haklara veya izne sahip olduklarına” dair bir onay kutusunu işaretlemelerini gerektiriyor. Ancak, bu konuda bir denetleme mekanizması yok. Örneğin, ben Kamala Harris’in sesini bir kayıt kaynağından kolaylıkla kopyalayabildim.
Bu durum, dolandırıcılık ve deepfake için potansiyel oluşturan bir sorun. Gerçekten de, kullanıcıların izinsiz ses kopyası oluşturmaları durumunda PlayAI, durumu bildirildiğinde ilgili kullanıcının erişimini engelleyip, sesin kaldırılmasını sağlıyor. Syed, sistemin her zaman bu şekilde çalışacağına dair güvence verdi.
PlayAI’nın güvenlik ve etik önlemleriyle ilgili olarak, Syed “PlayAI, üretilen her ses kopyasının yaratıcısına özel olduğunu garanti ediyor. Bu eşsizlik, kullanıcıların yaratıcı haklarını korumak için çok önemli” dedi.
PlayAI’nin büyüme hedefleri çok büyük, çünkü şirket yeni bir 20 milyon dolarlık tohum yatırımı kapattı ve bu yatırımlar, 500 Startups ve Kindred Ventures tarafından yönetildi. Toplamda kalitelerini geliştirmek ve geliştirdiği ses teknolojisini kullanarak iş süreçlerini kısa sürede sunmak için bu fonları kullanmayı planlıyorlar.