içinde

Bilim adamları görüntü pikselleme(STEGO) algoritması geliştiriyorlar

Bilim adamları dünyadaki her bir görüntü için STEGO Görüntü pikselleme algoritması üzerinde çalışıyorlar. Bu münkün olursa araçlardaki yön bulma ve algılama daha da kusursuz hale gelebilir.

Verileri etiketlemek bir angarya olabilir. Bilgisayarlı görü modelleri için ana geçim kaynağıdır; onsuz, nesneleri, insanları ve diğer önemli görüntü özelliklerini tanımlamakta çok zorlanırlar. Yine de yalnızca bir saatlik etiketlenmiş ve etiketlenmiş veri üretmek, insanoğlunun 800 saatini alabilir. Makineler çevremizi daha iyi algılayıp etkileşime girdikçe, dünyaya ilişkin yüksek kaliteli anlayışımız gelişir. Ama daha fazla yardıma ihtiyaçları var.

MIT‘nin Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı (CSAIL), Microsoft ve Cornell Üniversitesi’nden bilim adamları, herhangi bir insan etiketi olmadan nesneleri ortaklaşa keşfedebilen ve parçalara ayırabilen bir algoritma olan “STEGO” oluşturarak görme modellerini rahatsız eden bu sorunu çözmeye çalıştılar.

STEGO, bir görüntüdeki her piksele bir etiket atama süreci için “anlamsal bölümleme” adı verilen bir şey öğrenir. Semantik bölütleme, günümüzün bilgisayarlı görü sistemleri için önemli bir beceridir çünkü görüntüler nesnelerle karıştırılabilir. Daha da zor olan, bu nesnelerin her zaman değişmez kutulara sığmamasıdır; algoritmalar, bitki örtüsü, gökyüzü ve patates püresi gibi “şeyler” yerine, insanlar ve arabalar gibi ayrık “şeyler” için daha iyi çalışma eğilimindedir. Önceki bir sistem, parkta oynayan bir köpeğin nüanslı bir sahnesini sadece bir köpek olarak algılayabilirdi, ancak görüntünün her pikseline bir etiket atayarak, STEGO görüntüyü ana bileşenlerine ayırabilir: bir köpek, gökyüzü, çimen ve köpeğin sahibi gibi

Basliksiz 3

Makinalar ile dünyayı görmek.

“Görebilen” makineler, sürücüsüz arabalar ve tıbbi teşhis için tahmine dayalı modelleme gibi çok çeşitli yeni ve gelişmekte olan teknolojiler için çok önemlidir. STEGO etiketler olmadan öğrenebildiğinden, birçok farklı alandaki nesneleri, hatta insanların henüz tam olarak anlamadıklarını bile algılayabilir.

“Onkolojik taramalara, gezegenlerin yüzeyine veya yüksek çözünürlüklü biyolojik görüntülere bakıyorsanız, uzman bilgisi olmadan hangi nesnelerin aranacağını bilmek zordur. Gelişmekte olan alanlarda, bazen insan uzmanlar bile neyin doğru olduğunu bilmiyorlar. nesneler olmalı” diyor Ph.D. Mark Hamilton. MIT‘de elektrik mühendisliği ve bilgisayar bilimi öğrencisi, MIT CSAIL‘in araştırma ortağı, Microsoft‘ta yazılım mühendisi ve STEGO hakkında yeni bir makalenin baş yazarı. “Bilimin sınırlarında işlemek için bir yöntem tasarlamak istediğiniz bu tür durumlarda, makinelerden önce insanların bunu çözeceğine güvenemezsiniz.”

STEGO, genel görüntüler, sürüş görüntüleri ve yüksek irtifa hava fotoğraflarını kapsayan bir dizi görsel alanda test edildi. Her alanda, STEGO, insan yargılarıyla yakından uyumlu olan ilgili nesneleri tanımlayabildi ve bölümlere ayırabildi. STEGO‘nun en çeşitli kriteri, iç mekan sahnelerinden spor yapan insanlara, ağaçlara ve ineklere kadar dünyanın her yerinden çeşitli görüntülerden oluşan COCO-Stuff veri setiydi. Çoğu durumda, önceki son teknoloji sistem, bir sahnenin düşük çözünürlüklü özünü yakalayabilir, ancak ince ayrıntılar üzerinde mücadele edemez. Bir insansa  bir damlaydı, bir motosiklet bir kişi olarak algılanıyordu. Aynı sahnelerde, STEGO önceki sistemlerin performansını iki katına çıkardı ve hayvanlar, binalar, insanlar, mobilyalar ve diğerleri gibi kavramları keşfetti.

STEGO, COCO-Stuff karşılaştırmasında önceki sistemlerin performansını iki katına çıkarmakla kalmadı, aynı zamanda diğer görsel alanlarda da benzer sıçramalar yaptı. Sürücüsüz araç veri kümelerine uygulandığında STEGO, önceki sistemlerden çok daha yüksek çözünürlük ve ayrıntı düzeyi ile yolları, insanları ve sokak işaretlerini başarıyla bölümlere ayırdı. Uzaydan gelen görüntülerde sistem, Dünya yüzeyinin her bir metrekaresini yollara, bitki örtüsüne ve binalara ayırdı.

Pikselleri birbirine bağlama işlemi

“Enerji Tabanlı Grafik Optimizasyonu ile Kendinden Denetimli Transformatör” anlamına gelen STEGO, ImageNet veritabanından 14 milyon görüntü aracılığıyla dünya hakkında bilgi edinen DINO algoritmasının üzerine inşa edilmiştir. STEGO, anlam yaratmak için dünyanın parçalarını bir araya getirme yöntemimizi taklit eden bir öğrenme süreciyle DINO omurgasını iyileştirir.

Örneğin, parkta yürüyen köpeklerin iki resmini düşünebilirsiniz. Farklı parklarda, farklı sahipleri olan farklı köpekler olsalar da, STEGO (insanlar olmadan) her sahnenin nesnelerinin birbiriyle nasıl ilişkili olduğunu söyleyebilir. Yazarlar, görüntülerdeki her küçük, kahverengi, tüylü şeyin ve aynı şekilde çim ve insanlar gibi diğer paylaşılan nesnelerle nasıl benzer olduğunu görmek için STEGO‘nun zihnini bile araştırıyor. STEGO, nesneleri görüntüler arasında bağlayarak resmin tutarlı bir görünümünü oluşturur.

Basliksiz 1 1

Bu algoritma teknolojisi gelecek vaad ediyormu?

İyileştirmelerine rağmen, STEGO hala bazı zorluklarla karşı karşıyadır. Birincisi, etiketlerin keyfi olabileceğidir. Örneğin, COCO-Stuff veri kümesinin etiketleri, muz ve tavuk kanadı gibi “gıda maddeleri” ile irmik ve makarna gibi “gıda maddeleri” arasında ayrım yapar. STEGO orada pek bir ayrım görmüyor. Diğer durumlarda, STEGO, alıcının “hammadde” yerine “gıda maddesi” olarak etiketlendiği, telefon ahizesine oturan bir muz gibi tuhaf görüntülerle karıştırıyor.

Gelecek çalışmalar için, gerçek dünyadaki şeyler bazen aynı anda birden fazla şey olabileceğinden (“gıda”, “bitki” gibi) pikselleri sabit sayıda sınıfa etiketlemekten ziyade STEGO‘ya biraz daha fazla esneklik kazandırmayı keşfetmeyi planlıyorlar. ve “meyve”). Yazarlar, bunun algoritmaya belirsizlik, değiş tokuşlar ve daha soyut düşünme için yer açacağını umuyor.

Hamilton “Potansiyel olarak karmaşık veri kümelerini anlamak için genel bir araç oluştururken, bu tür bir algoritmanın görüntülerden nesne keşfinin bilimsel sürecini otomatikleştirebileceğini umuyoruz. İnsan etiketlemesinin aşırı derecede pahalı olacağı veya insanların basitçe yapmadığı birçok farklı alan var. Belirli biyolojik ve astrofiziksel alanlarda olduğu gibi belirli yapıyı bile bilmiyorum.Gelecekteki çalışmaların çok geniş bir veri kümesi kapsamına uygulanmasını sağlayacağını umuyoruz.Herhangi bir insan etiketine ihtiyacınız olmadığından, artık ML araçlarını daha geniş bir şekilde uygulamaya başlayabiliriz ”diyor.

STEGO basit, zarif ve çok etkili. Denetimsiz segmentasyonu, görüntü anlamada ilerleme için bir ölçüt ve çok zor bir sorun olarak görüyorum. Araştırma topluluğu, transformatör mimarilerinin benimsenmesiyle denetimsiz görüntü anlamada müthiş ilerleme kaydetti. Bilgisayarla görü ve makine öğrenimi profesörü ve Oxford Üniversitesi mühendislik bilimleri bölümünde Görsel Geometri Grubu’nun ortak lideri Andrea Vedaldi, diyor. “Bu araştırma, denetimsiz segmentasyondaki bu ilerlemenin belki de en doğrudan ve etkili gösterimini sağlıyor.”

Bildiri

Ne düşünüyorsun?

Bir cevap yazın

Paylaşımcı

Yazar Aras Salvo

İllegalplatform.co 'nun kılıcı Aras Salvo

zipline marka

ABD Japonya’da Zipline marka dronla ilaç dağıtımına başladı

Ukraynada yasanan savas nedeniyle otomobil satislari etkilendi1

Ukrayna'da yaşanan savaş nedeniyle otomobil satışları etkilendi