Araştırmacılar, DeepMind’ın AlphaFold2 protein katlama gücünü daha hızlı, ücretsiz olarak temin edilebilen modelle eşleştiriyor – TechCrunch

0
16

DeepMind, geçen yılın sonlarında AlphaFold2 AI modelinin proteinlerin yapısını (yaygın ve çok zor bir problem) o kadar doğru bir şekilde öngördüğü biyoloji dünyasını hayrete düşürdü ki, birçoğu onlarca yıllık problemi “çözüldü” ilan etti. Şimdi araştırmacılar, hesaplama maliyetinin çok küçük bir bölümünde neredeyse aynı şeyi yapan bir sistem olan RoseTTAFold ile DeepMind’ın dünyanın geri kalanında sıçradığı şekilde DeepMind’ı atladıklarını iddia ediyorlar. (Oh, ve kullanımı ücretsizdir.)

AlphaFold2, bir proteini oluşturan amino asit dizilimi verilen bir proteinin fiziksel yapısını tahmin etmek için oluşturulmuş algoritmalar arasında sanal bir rekabet olan CASP14’teki rekabeti alt üst ettiği Kasım ayından bu yana endüstrinin gündemi oldu. DeepMind’ın modeli diğerlerinden o kadar öndeydi, o kadar yüksek ve güvenilir bir şekilde doğruydu ki, bu alandaki birçok kişi (yarı ciddi ve iyi bir mizahla) yeni bir alana geçmek hakkında konuştu.

Ancak kimseyi tatmin etmeyen bir yön, DeepMind’ın sistemle ilgili planlarıydı. Kapsamlı ve açık bir şekilde tanımlanmadı ve bazıları şirketin (Alphabet/Google’ın sahibi olduğu) gizli sosu az ya da çok kendilerine saklamayı planladığından endişelendi – bu onların ayrıcalığı olurdu, ancak aynı zamanda karşılıklı yardım ethosuna bir şekilde aykırı olurdu. bilim dünyasında.

Güncelleme: DeepMind, Nature dergisinde bugün daha ayrıntılı yöntemler yayınladı. Kod GitHub’da mevcuttur. Bu, yukarıda bahsedilen endişeyi önemli ölçüde azaltır, ancak aşağıda açıklanan ilerleme hala oldukça önemlidir.

Bu endişe, David Baker ve Minkyung Baek liderliğindeki Washington Üniversitesi araştırmacılarının Science dergisinin son sayısında yayınlanan çalışmalarıyla en azından kısmen tartışılmış görünüyor. Baker, hatırlarsınız, yakın zamanda ekibinin tasarlanmış proteinlerle COVID-19 ile mücadele çalışmaları için bir Atılım Ödülü kazandı.

Ekibin yeni modeli RoseTTAFold, soruları e-posta yoluyla yanıtlayan Baker’ın AlphaFold2 tarafından kullanılanlardan ilham aldığını açıkça kabul ettiği yöntemleri kullanarak benzer doğruluk seviyelerinde tahminlerde bulunuyor.

AlphaFold2 grubu, CASP14 toplantısında birkaç yeni üst düzey konsept sundu. Bu fikirlerden yola çıkarak ve gruptaki meslektaşlarıyla çok sayıda toplu beyin fırtınası yaparak Minkyung çok kısa sürede inanılmaz ilerleme kaydetmeyi başardı” dedi. (“O harika!” diye ekledi.)

Öngörülen protein yapılarının örnekleri ve temel gerçekleri. 90’ın üzerinde bir puan son derece iyi olarak kabul edilir. Resim Kredisi: UW/Baek ve diğerleri

Baker’ın grubu CASP14’te aşağı yukarı ikinci sırayı aldı, ortalama bir başarı değil, ancak DeepMind’in açıklanan yöntemlerini duymak bile onları genellikle bir çarpışma rotasına soktu. Amino asit dizisini (tek boyut), kalıntılar arasındaki mesafeleri (iki boyut) ve uzaydaki koordinatları (üç boyut) aynı anda dikkate alan “üç yollu” bir sinir ağı geliştirdiler. Uygulama, karmaşıklığın ötesinde ve bu makalenin kapsamı dışındadır, ancak sonuç, neredeyse aynı doğruluk seviyelerine ulaşan bir modeldir – bir yıldan daha kısa bir süre önce tamamen benzeri görülmemiş seviyeler, tekrar etmeye değer.

Dahası, RoseTTAFold bu doğruluk düzeyini çok daha hızlı bir şekilde gerçekleştirir – yani daha az hesaplama gücü kullanarak. Kağıdın dediği gibi:

DeepMind, bireysel tahminler yapmak için günlerce birkaç GPU kullandığını bildirirken, tahminlerimiz bir sunucu için kullanılacak şekilde ağ üzerinden tek bir geçişte yapılır… RoseTTAFold’un uçtan uca sürümü için ~ 10 dakika gerekir 400’den az kalıntıya sahip proteinler için omurga koordinatları oluşturmak üzere bir RTX2080 GPU.

Duymak? Bu, rahatlayarak iç çeken ve süper bilgisayar zamanı isteyen e-posta taslaklarını bir kenara atan binlerce mikrobiyologun sesi. Bugünlerde bir 2080’i elde etmek kolay olmayabilir, ancak önemli olan nokta, herhangi bir üst düzey masaüstü GPU’nun bu görevi, günlerce çalışan üst düzey bir kümeye ihtiyaç duymak yerine dakikalar içinde gerçekleştirebilmesidir.

Mütevazı gereksinimler, RoseTTAFold’u halka açık barındırma ve dağıtım için de uygun hale getiriyor, AlphaFold2 için asla kartlarda bulunmayan bir şey.

Baker, “Herkesin protein dizileri sunabileceği ve yapıların tahmin edilmesini sağlayabileceği bir kamu sunucumuz var” dedi. “Sunucuyu birkaç hafta önce kurduğumuzdan bu yana 4.500’den fazla başvuru oldu. Ayrıca kaynak kodunu ücretsiz olarak erişilebilir hale getirdik.”

Bu çok niş görünebilir ve öyledir, ancak protein katlanması tarihsel olarak biyolojideki en zorlu sorunlardan biri olmuştur ve sayısız saatlerce yüksek performanslı hesaplamanın adanmış olduğu bir sorundur. İnsanların bilgisayar döngülerini protein yapılarını tahmin etmeye çalışmasına izin veren popüler dağıtılmış bilgi işlem uygulaması Folding@Home’u hatırlayabilirsiniz. Bin bilgisayarda günler veya haftalar sürmüş olabilecek türden bir sorun – esasen kaba zorlama çözümleri ve uygunluğu kontrol ederek – artık tek bir masaüstünde dakikalar içinde yapılabilir.

Proteinlerin fiziksel yapısı, vücudumuzdaki görevlerin büyük çoğunluğunu yerine getiren proteinler ve terapötik nedenlerle değiştirilmesi, baskılanması, güçlendirilmesi vb. gereken proteinler olduğu için biyolojide son derece önemlidir; Ancak önce, anlaşılmaları gerekiyor ve Kasım ayına kadar bu anlayışa hesaplama yoluyla güvenilir bir şekilde ulaşılamadı. CASP14’te bunun mümkün olduğu kanıtlandı ve şimdi yaygın olarak kullanıma sunuldu.

Duygu ifade edilmiş olsa da, protein katlanması sorununa uzun vadede bir “çözüm” değildir. Nötr koşullarda hareketsiz durumdaki proteinlerin çoğu artık yapılarının tahmin edilmesini sağlayabilir ve bunun birden fazla alanda büyük yankıları vardır, ancak proteinler nadiren “nötr koşullarda hareketsiz halde” bulunur. Diğer molekülleri yakalamak veya serbest bırakmak, kapıları ve diğer proteinleri bloke etmek veya geçmek ve genellikle yaptıkları her şeyi yapmak için bükülür ve bükülürler. Bu etkileşimler çok daha fazla sayıda, karmaşık ve tahmin edilmesi güçtür ve ne AlphaFold2 ne de RoseTTAFold bunu yapamaz.

Baker, “Önümüzde birçok heyecan verici bölüm var… hikaye daha yeni başlıyor” dedi.

Bilimi ve olası yansımaları merak ediyorsanız, AlphaFold2’nin CASP14 performansının ardından yazılan yöntemlerin ve olası sonraki adımların bu çok daha ayrıntılı ve teknik açıklamasını okumayı düşünün.

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz