Meta’nın Yeni Çeviri Modeli: SeamlessM4T

Meta, neredeyse 100 farklı dilde çeviri yapabilen yeni bir konuşma metni çeviri modeli olan SeamlessM4T’yi piyasaya sürdü. Şirket, evrensel bir çevirmen oluşturma amacıyla çalışmalarını sürdürüyor.

    Meta, evrensel bir çevirmen vizyonu doğrultusunda, SeamlessM4T adında yeni bir çeviri modeli geliştirdiğini duyurdu. Bu model, metinleri ve konuşmaları neredeyse 100 farklı dil arasında çevirebiliyor.

    SeamlessM4T Nedir?

    SeamlessM4T, “Massively Multilingual and Multimodal Machine Translation” ifadesinin kısaltmasıdır. Bu model, neredeyse 100 dilde hem metin-çeviriden metne hem de konuşma-çeviriden metne çeviri yapabiliyor. Böylece dünya dillerini birbirine bağlama amacı güden bir adım daha atılmış oluyor. Program girdi olarak 100 farklı dili tanıyabiliyor ve bunları 35 farklı çıktı diline çevirebiliyor. Böylece çoklu dil ve çoklu modlarda çeviri yapma yeteneği ile öne çıkıyor.

    SeamlessM4T, Creative Commons CC BY-NC 4.0 lisansı altında piyasaya sürüldü. Bu sayede araştırmacılar, modeli daha da geliştirebilmek için kullanabilirler. Aynı zamanda, Meta, açık çeviri veri seti SeamlessAlign’in meta verilerini de paylaştı.

    Kurgusal Babel Fish ve TARDIS Çeviri Matrisi

    Meta, evrensel bir dil çevirmeni inşa etmenin zorluklarını açıklarken, “The Hitchhiker’s Guide to the Galaxy” kitabındaki hayali “Babel Fish“e atıfta bulunuyor. Babel Fish, kitapta anlatıldığı gibi kulak içine yerleştirilen bir balıktır ve anında herhangi bir dili anlama yeteneği sunar. Aynı zamanda “Doctor Who” hayranları için, Meta’nın aracını TARDIS’in içindeki çeviri matrisine benzetmek de mümkündür.


    The Hitchhiker’s Guide to the Galaxy’deki kurgusal Babel Fish gibi Evrensel bir dil çevirmeni inşa etmek, mevcut konuşmadan konuşmaya ve konuşmadan metne sistemlerin dünya dillerinin sadece küçük bir bölümünü kapsadığı için bir takım zorluklar içeriyor”

    Meta

    Yenilik: Tüm Çeviri Görevini Tek Seferde Gerçekleştirme

    SeamlessM4T, büyük çeviri modellerinin farklı sistemlere bölünmüş şekilde çeviri yapmasının aksine, tüm çeviri görevini tek seferde gerçekleştirebilen bir model olarak öne çıkıyor. Bu, önemli bir adım olarak kabul ediliyor.

    Modelin ilginç özelliklerinden biri, konuşmacının birden fazla dil arasında geçiş yaptığı durumları tanıyabilme yeteneğidir. Örneğin, modelin Hindice, Telugu ve İngilizce arasındaki geçişleri hızla ayırt edebildiği bir video demosu bulunmaktadır.

    Meta’nın Önceki Çeviri Modelleri

    Meta, SeamlessM4T’ten önce de bir dizi çeviri modeli geliştirdi. “No Language Left Behind” adlı metin-çeviri modeli, 200 farklı dili destekliyordu. Ayrıca Meta, “SpeechMatrix” adlı çoklu dil konuşma-çeviri veri setini ve çok dilli konuşma tanıma için “Massively Multilingual Speech“i geliştirdi.

    Dil Çevirisi ve Meta’nın Rolü

    Meta gibi şirketler için dil çevirisi, binlerce moderatörü farklı dillerdeki Facebook ve Instagram gönderilerini yönetmek üzere istihdam etmeleri nedeniyle önemlidir. Çoğu zaman, büyük diller dışındaki diller için yetersiz çalışan otomatik moderasyona dayanmak gerekebilir. Bu noktada, küçük dillere ait veri kümelerine erişim sağlanması durumunda yapay zeka, moderasyonu geliştirmek için bir araç olabilir.

    SeamlessM4T’in Geliştirilme Süreci

    SeamlessM4T’in geliştirilirken, Meta Fairseq sıralı modelleme aracını yeniden tasarladı ve daha hafif modeller oluşturarak daha fazla bilgiyi işlemeye olanak tanıdı.

    Eğitim verilerinde dengesiz toksisiteyi filtreledik. Girdi veya çıktı farklı oranlarda toksisite içeriyorsa, o eğitim dizisini çıkardık.

    Meta

    Meta, çıktı çevirinin orijinal metinde bulunmayan toksisite eklemesi durumunu tespit edebilmeyi hedefleyerek, toksik veya hassas kelimeleri tanımlayan bir sistem geliştirdi. Modelin cinsiyet eğilimini de algılayabildiğini iddia ediyor. Model, cinsiyet ayrımı yapılmamış terimlere cinsiyetli kelimeler eklediğinde bunu tespit edebiliyor.

    Meta, birçok yapay zeka modelini geliştiricilere ve araştırmacılara açık kaynaklı bir şekilde sunmaktadır. Son zamanlarda, metin-ses dönüşümüne izin veren AudioCraft kodunu yayınladı ve büyük dil modeli Llama 2’ye erişim sağladı.

    Önceki yazı

    Gizemli Bitcoin Cüzdanı 3 Ay İçinde Üçüncü En Büyük BTC Sahibi Oldu

    Sonraki yazı

    Microsoft Popüler Programlama Dili Python'ı Excel'e Getiriyor