SON DAKİKA

Yapay Zeka

AI’ye insanlar gibi iletişim kurmayı öğretmek

Sadece arızalı bir araba motorunun sesini tarif etmek veya komşunuzun kedisini taklit ederek miyavlamak, ses taklidi yapmanın etkili bir yoludur. Sesleri sesimizle taklit etmek, bazen kelimelerin yetersiz kaldığı durumlarda bir kavramı aktarabilmek için faydalı olabilir.

Vokal taklit, hızlı bir çizim yaparak bir durumu iletmek gibidir; burada kalem yerine ses yolumuzu kullanarak bir sesi ifade ederiz. Bu fikir karmaşık görünebilir ama aslında hepimizin içgüdüsel olarak yaptığı bir şeydir. Denemek isterseniz, sesinizi bir ambulans sireni, bir karga ya da bir çanın sesiyle eşleştirerek başlayabilirsiniz.

MIT’nin Yenilikçi AI Sistemi

MIT Bilgisayar Bilimleri ve Yapay Zeka Laboratuvarı (CSAIL) araştırmacıları, daha önce insan vokal taklitini “duymamış” bir yapay zeka sistemi geliştirdi. Bu sistem, insan benzeri ses taklitleri üretebiliyor ve herhangi bir eğitim gerektirmiyor.

Bu başarı, araştırmacıların insan sesini taklit ve yorumlama biçimlerinden ilham alarak oluşturdukları bir sistem sayesinde mümkün oldu. İlk olarak, ses kutusundan gelen titreşimlerin boğaz, dil ve dudaklar tarafından nasıl şekillendiğini simüle eden bir insan vokal yolu modeli inşa ettiler. Ardından, bu vokal yolu modelini kontrol eden ve insanların ses iletimindeki özel bağlamlarının dikkate alındığı bir bilişsel AI algoritması geliştirdiler.

Seslerin İnsan Benzeri İmitasyonları

Bu model, çevredeki birçok sesi alarak, insan benzeri taklitlerini oluşturma yeteneğine sahip. Örneğin, yaprakların hışırtısı, yılanın hışırtısı ya da yaklaşan bir ambulans sireni gibi sesleri doğru bir şekilde taklit edebiliyor. Ayrıca model, insan vokal taklitlerinden gerçek dünya seslerini tahmin etmek için tersine de çalışabiliyor; bu, bazı bilgisayarlı görsel sistemlerin bir çizim üzerinden yüksek kaliteli görüntüler elde etmesine benziyor. Örneğin, insanın bir kedinin “miyav” sesini taklit edip etmediğini ya da onun “hışırtı” sesini doğru şekilde ayırt edebiliyor.

İleriye Dönük Potansiyeller

Gelecekte, bu model ses tasarımcıları için daha sezgisel “taklit temelli” arayüzlere yol açabilir, sanal gerçeklikte daha insana benzer AI karakterlerin yaratılmasına yardımcı olabilir ve hatta öğrencilere yeni diller öğrenme konusunda destek olabilir.

Bu araştırmanın baş yazarları, MIT CSAIL doktora öğrencileri Kartik Chandra, Karima Ma ve lisans araştırmacısı Matthew Caren, bilgisayar grafiklerinin gerçekçiliğinin genellikle görsel ifadenin nihai hedefi olmadığını belirtiyorlar. Örneğin, bir soyut resim ya da bir çocuğun pastel boyasıyla yaptığı bir çizim, bir fotoğraftan daha etkileyici ve ifade dolu olabilir.

Taklit Sanatının Geliştirilmesi

Taklit sanatının üç aşaması üzerine çalışan ekip, insan vokal taklitleriyle karşılaştırmak üzere üç aşamalı bir model geliştirmiştir. Öncelikle, gerçek dünya seslerine mümkün olan en benzerini üretmeyi hedefleyen bir temel model oluşturmuşlardır; ancak bu model, insan davranışlarını pek yansıtmıyordu.

İkinci olarak, dinleyiciye uygun, özelleştirilmiş bir “iletim” modeli tasarlamışlardır. Bu model, bir sesin dinleyici için en belirgin olan yönünü dikkate alıyor. Üçüncü aşamada, insan taklitlerini daha iyi yansıtabilmek adına modelin son bir katmanı eklenmiştir. Bu katman, seslerin üretimi için harcanan zaman ve enerjiyi hesaba katarak daha insana benzer taklitler ortaya koymaktadır.

Bu araştırma sonuçları, sanatçılara sesleri daha etkili bir şekilde aktarabilmeleri için yardımcı olmanın yanı sıra, içerik üreticilerine de daha açık ve detaylı sesler sunma potansiyeline sahiptir.

Düşüncenizi Paylaşın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

İlgili Teknoloji Haberleri

The economics of AI refer to the economic impact and implications of artificial intelligence technologies. Some key points to know about the economics of AI include: 1. Increased productivity: AI has the potential to significantly increase productivity by automating routine tasks and processes, freeing up human workers to focus on more complex and creative tasks. 2. Job displacement: While AI can create new job opportunities, it also has the potential to displace certain roles that can be automated. This can lead to job loss and require workers to acquire new skills to remain relevant in the workforce. 3. Cost savings: AI can help businesses reduce costs by streamlining operations, improving efficiency, and optimizing resource allocation. 4. Enhanced decision-making: AI can provide businesses with valuable insights and data analysis to make more informed and strategic decisions, leading to better outcomes and competitive advantage. 5. New revenue streams: AI technologies can enable businesses to develop new products and services, enter new markets, and create innovative business models that can generate additional revenue streams. 6. Ethical and societal considerations: The widespread adoption of AI raises ethical and societal concerns around issues such as privacy, bias, job displacement, and the potential for AI to exacerbate existing inequalities. 7. Regulatory challenges: Policymakers are grappling with how to regulate AI technologies to ensure they are used responsibly and ethically while also fostering innovation and economic growth. Overall, the economics of AI present both opportunities and challenges for businesses, workers, and society as a whole. It is important for stakeholders to carefully consider the implications of AI adoption and to develop strategies for maximizing the benefits while mitigating potential risks.