Bu içerik Onedio üyesi kullanıcı tarafından üretilmiş, Onedio editör ekibi tarafından müdahale edilmemiştir. Siz de Onedio’da dilediğiniz şekilde içerik üretebilirsiniz.

Google Çeviri Alanından Sonra Dudak Okuma Konusunda da İnanılmaz Bir Devrime İmza Attı!

-
2 dakikada okuyabilirsiniz

Hatırlayacağınız üzere geçtiğimiz günlerde Google, "Google Translate"'e getirdiği yenilikle çeviri alanında adeta devrim yapmıştı. Boş durmak nedir bilmeyen şirket, bu sefer de dudak okuma alanında inanılmaz bir gelişme kaydetti.

Kaynak: https://arxiv.org/pdf/1611.05358v1.pdf

Oxford Üniversitesi ile Google, Deepmind projesi kapsamında oldukça önemli bir ilerleme kaydetti.

BBC işbirliğiyle yürütülen projede, BBC'ye ait oldukça büyük bir TV programı arşivi üzerinde çalışılarak yapay zekanın dudak okuma yetenekleri artırıldı ve çok önemli bir başarıya imza atıldı.

Yapay zeka, toplamı 5000 saati bulan TV programı arşivindeki 118 bin cümle ile eğitime tabi tutuldu.

Ocak 2010 ile Aralık 2015 arasında yayınlanmış bu programlarla eğitim bittikten sonra, yapay zekanın yetenekleri, daha sonraki zamanlarda yayınlanmış TV programları üzerinde denendi ve işler bu noktada bir hayli ilginçleşti.

Profesyonal bir dudak okuyucuyla karşı karşıya getirilen yapay zeka, açık ara farkla daha isabetli tahminler yürütmeyi başardı.

Hatta aradaki fark o kadar fazlaydı ki; profesyonel dudak okuyucu kişi %12,4 oranında isabet yakalarken, Google'ın yapay zeka programı %46.8 ile neredeyse 4 katı kadar yüksek bir isabet oranı tutturdu.

Dahası, sistemin yaptığı yanlışların birçoğu sadece çok küçük harf nüanslarıydı.

Bu sonuçlarla Google dev bir adımla hem dudak okuyucu insanları, hem de diğer dudak okuma sistemlerini ezip geçti adeta.

Daha geçtiğimiz günlerde dudak okuma alanında büyük bir adım atılmıştı aslında.

Yine Oxford Üniversitesi'nde, 2 hafta önce insanlardan daha iyi tahminler yapan bir dudak okuma sistemi geliştirilmişti. Ancak bu sistem, GRID adlı sadece 51 farklı kelimeli bir sistem üzerinde denenmişti.

BBC'nin setinde ise 17 bin 500 adet farklı kelime bulunuyor. Üstelik GRID, hep aynı düzende oluşturulmuş cümlelere sahipken, BBC'nin programlarında gerçek insanlar konuştuğu için daha karmaşık cümle yapıları bulunuyordu.

Bu bakımdan Google, bu mükemmel gelişmenin bile 4-5 gömlek üstünde bir ilerlemeye imza atmış durumda.

Bu yeni adımın ne kadar büyük olduğuna hala ikna olmadıysanız şunu da belirtelim: Sistem, TV programlarının bir kısmında ses ve görüntünün senkronize olmamasından bile etkilenmemiş. Hatta ve hatta bu senkronizasyon hatalarını, dudak okuma esnasında tespit ederek 5000 saatlik video arşivinin tamamını düzgün şekilde senkronlamış.

Bu teknolojinin kullanım alanı neler olabilir peki?

DeepMind araştırmacıları, programın duyma zorluğu çeken kişilere yardımcı olabileceğini, sessiz filmlere açıklamalar yazmakta kullanılabileceğini veya Siri, Alexa gibi dijital asistanları kontrol etmekte kullanılabileceğini söylüyor. Bu tür teknolojiler elbette gizlilik endişeleriyle de geliyor – dudak okuyan yazılımlar, gelecekte günlük hayatta konuştuklarımızı kaydetmekte kullanılabilir.

Özetle, Google'ı tebrik etmemek gerçekten elde değil...

Bu içerik Onedio üyesi kullanıcı tarafından üretilmiş, Onedio editör ekibi tarafından müdahale edilmemiştir. Siz de Onedio’da dilediğiniz şekilde içerik üretebilirsiniz.

BU İÇERİĞE EMOJİYLE TEPKİ VER!
Helal olsun!
Hoş değil!
Yerim!
Çok acı...
Yok artık!
Çok iyi!
Kızgın!

FACEBOOK YORUMLARI

ONEDİO ÜYELERİ NE DİYOR?

Yorum Yazın
Gizli Kullanıcı

hal 9000?

philipp-plein

imam hatipler kapatilmadi mi HALA?

kulustur

Bu tür teknoloji üreten firmalar varken dünyayı bir köprü ile kıskandırdığını düşünenleri gördükçe çıldırıyorum.

alialifb777

o da farkında dünyanın yaptığı köprüyü/yolu s*klemediğinin ama koyunları gütmek lazim

rex-conqueror

Artık virgül kullanmayı öğrenseniz diyorum.

Başlıklar

DeepMindGoogle
Görüş Bildir