Facebook’un son araştırmasıyla bilgisayar görüşü ‘sağduyuya doğru ilerliyor – TechCrunch

0
20

Makine öğrenimi, nasıl yapılacağını öğretecek verilere sahip olduğunuz sürece her türlü şeyi yapabilir. Bu her zaman kolay değildir ve araştırmacılar her zaman yapay zekaya biraz “sağduyu” katmanın bir yolunu ararlar, böylece onu elde etmeden önce ona 500 kedinin resmini göstermeniz gerekmez. Facebook’un en yeni araştırması, veri darboğazını azaltmak için büyük bir adım atıyor.

Şirketin müthiş yapay zeka araştırma bölümü, yıllardır gelişmiş bilgisayar görme algoritmaları gibi şeylerin nasıl ilerletileceği ve ölçeklendirileceği üzerinde çalışıyor ve genellikle araştırma topluluğunun geri kalanıyla paylaşılan istikrarlı bir ilerleme kaydetti. Facebook’un özellikle izlediği ilginç bir gelişme, “yarı denetimli öğrenme” adı verilen şeydir.

Genellikle bir yapay zekayı eğitmeyi düşündüğünüzde, yukarıda belirtilen 500 kedi resmi gibi bir şey düşünürsünüz – seçilmiş ve etiketlenmiş görüntüler (bu, kedinin ana hatlarını çizmek, kedinin etrafına bir kutu koymak veya sadece içeride bir kedi olduğunu söylemek anlamına gelebilir). orada bir yerde), böylece makine öğrenme sistemi kedi tanıma sürecini otomatikleştirmek için bir algoritma oluşturabilir. Doğal olarak, eğer köpek veya at yapmak istiyorsanız, 500 köpek resmine, 500 at resmine, vb. İhtiyacınız vardır – doğrusal olarak ölçeklenir, bu, teknolojide asla görmek istemeyeceğiniz bir kelimedir.

“Denetimsiz” öğrenmeyle ilgili yarı denetimli öğrenme, herhangi bir etiketli veri olmadan bir veri kümesinin önemli parçalarını bulmayı içerir. Sadece vahşileşmekle kalmıyor, hala bir yapı var; Örneğin, sisteme çalışması için bin cümle verdiğinizi ve ardından birkaç kelimesi eksik olan on tane daha gösterdiğinizi hayal edin. Sistem muhtemelen boşlukları sadece önceki binde gördüklerine dayanarak doldurarak iyi bir iş çıkarabilir. Ancak bunu resimler ve videolarla yapmak o kadar kolay değil – o kadar basit veya öngörülebilir değiller.

Ancak Facebook araştırmacıları, kolay olmasa da mümkün ve aslında çok etkili olduğunu gösterdi. DINO sistemi (“NO etiketleri ile bilginin dağıtılması” için oldukça ikna edici olmayan bir şekilde duran), herhangi bir etiketli veri olmadan insanların, hayvanların ve nesnelerin videolarında ilgi çekici nesneleri bulmayı oldukça iyi öğrenebilir.

Resim Kredisi: Facebook

Bunu, videoyu tek tek analiz edilecek bir görüntü dizisi olarak değil, “bir dizi kelime” ve “bir cümle” arasındaki fark gibi karmaşık, birbiriyle ilişkili bir küme olarak değerlendirerek yapar. Temsilci, videonun başlangıcına olduğu kadar ortasına ve sonuna da katılarak “bu genel şekle sahip bir nesnenin soldan sağa gitmesi” gibi şeyler hakkında bir fikir edinebilir. Bu bilgi diğer bilgilerle beslenir, örneğin sağdaki bir nesne birinciyle örtüştüğünde, sistem onların aynı şey olmadığını bilir, sadece bu çerçevelere dokunur. Ve bu bilgi sırayla başka durumlara da uygulanabilir. Başka bir deyişle, temel bir görsel anlam duygusu geliştirir ve bunu yeni nesneler üzerinde oldukça az eğitimle yapar.

Bu, yalnızca etkili olmakla kalmayıp aynı zamanda geleneksel olarak eğitilmiş sistemlere kıyasla iyi performans gösteren, aynı zamanda daha ilişkilendirilebilir ve açıklanabilir bir bilgisayar görme sistemi ile sonuçlanır. Örneğin, 500 köpek resmi ve 500 kedi resmi ile eğitilmiş bir yapay zeka her ikisini de tanıyacak olsa da, bunların hiçbir şekilde benzer olduklarına dair hiçbir fikri olmayacak. Ancak DINO – spesifik olmasa da – görsel olarak birbirlerine benzediklerini, her halükarda arabalardan çok daha fazla olduklarını ve bu meta veri ve bağlamın hafızasında görünür olduğunu anlıyor. Köpekler ve kediler, bu tür dijital bilişsel alanda köpeklerden ve dağlardan “daha yakındır”. Bu kavramları burada küçük lekeler olarak görebilirsiniz – bir türden olanların nasıl birbirine yapıştığını görün:

Makine öğrenimi modelindeki kavramların nasıl birbirine yakın kaldığını gösteren animasyonlu şema.

Resim Kredisi: Facebook

Bunun, burada girmeyeceğimiz teknik türden kendi avantajları var. Merak ediyorsanız, Facebook’un blog gönderisinde bağlantısı verilen makalelerde daha fazla ayrıntı var.

Ayrıca, etiketli verilere olan ihtiyacı daha da azaltan PAWS adı verilen bir eğitim yöntemi olan bitişik bir araştırma projesi de var. PAWS, yarı denetimli öğrenmenin bazı fikirlerini daha geleneksel denetimli yöntemle birleştirir ve temelde hem etiketli hem de etiketlenmemiş verilerden öğrenmesine izin vererek eğitime bir destek sağlar.

Facebook, elbette birçok kullanıcıya dönük (ve gizli) görüntü ile ilgili ürünleri için iyi ve hızlı bir görüntü analizine ihtiyaç duyar, ancak bilgisayarla görme dünyasındaki bu genel ilerlemeler, şüphesiz geliştirici topluluğu tarafından başka amaçlar için memnuniyetle karşılanacaktır.

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz