DeepMind, yapay zeka tarafından çizilen insan proteinlerinin ‘dönüştürücü’ haritasını oluşturur

0
17

AI araştırma laboratuvarı DeepMind, yapay zeka kullanarak bugüne kadarki en kapsamlı insan proteinleri haritasını oluşturdu. Google-parent Alphabet’in bir yan kuruluşu olan şirket, bazı bilim adamlarının çalışmanın potansiyel etkisini, her insan genini haritalamak için uluslararası bir çaba olan İnsan Genom Projesi’ninkiyle karşılaştırarak verileri ücretsiz olarak yayınlıyor.

Proteinler, vücutta doku oluşturmaktan hastalıklarla savaşmaya kadar sayısız görevi yerine getiren uzun, karmaşık moleküllerdir. Amaçları, origami gibi katlanarak karmaşık ve düzensiz şekiller oluşturan yapıları tarafından belirlenir. Bir proteinin nasıl katlandığını anlamak, işlevini açıklamaya yardımcı olur ve bu da bilim adamlarına vücudun nasıl çalıştığına dair temel araştırmalar yapmaktan yeni ilaçlar ve tedaviler tasarlamaya kadar çeşitli görevlerde yardımcı olur.

“DeepMind’in tüm 10 yılı aşan kullanım ömrünün doruk noktası”

Önceden, bir proteinin yapısını belirlemek pahalı ve zaman alan deneylere dayanıyordu. Ancak geçen yıl DeepMind, AlphaFold adlı AI yazılımını kullanarak bir proteinin yapısı hakkında doğru tahminler üretebileceğini gösterdi. Şimdi şirket, program tarafından yapılan yüz binlerce tahmini kamuoyuna açıklıyor.

Şirket CEO’su ve kurucu ortağı Demis Hassabis, The Verge’e “Bunu DeepMind’ın 10 yıllık ömrünün tamamının doruk noktası olarak görüyorum” dedi. “En başından beri yapmaya karar verdiğimiz şey buydu: AI’da atılımlar yapmak, bunu Go ve Atari gibi oyunlarda test etmek, [and] Bilimsel atılımları hızlandırıp hızlandıramayacağımızı ve bunları insanlığa fayda sağlamak için kullanıp kullanamayacağımızı görmek için bunu gerçek dünyadaki sorunlara uygulayın.”

Deneysel sonuçlarla (yeşil) karşılaştırıldığında AlphaFold tarafından tahmin edilen iki protein yapısı örneği (mavi). Resim: Derin Zihin

Şu anda, her biri deneysel yöntemlerle üretilen ve Protein Veri Bankası aracılığıyla erişilebilen, kamuya açık alanda mevcut olan yaklaşık 180.000 protein yapısı bulunmaktadır. DeepMind, fareler ve meyve sinekleri gibi hayvanlar ve E. coli gibi bakteriler dahil olmak üzere 20 farklı organizmada yaklaşık 350.000 proteinin yapısı için tahminler yayınlıyor. (DeepMind’in verileri ile önceden var olan protein yapıları arasında bir miktar örtüşme vardır, ancak modellerin doğası nedeniyle tam olarak ne kadarını ölçmek zordur.) En önemlisi, sürüm tüm insan proteinlerinin yüzde 98’i için yaklaşık 20.000 farklı tahmin içeriyor. topluca insan proteomu olarak bilinen yapılar. İnsan proteinlerinin ilk halka açık veri seti değil, ancak en kapsamlı ve doğru.

AlphaFold’un teknik lideri John Jumper, isterlerse bilim adamlarının tüm insan proteomunu kendileri için indirebileceklerini söylüyor. Jumper, The Verge’e “Etkili bir şekilde bir HumanProteome.zip var, sanırım boyutu yaklaşık 50 gigabayt” diyor. “İsterseniz bir flash sürücüye koyabilirsiniz, ancak analiz için bir bilgisayar olmadan pek işinize yaramaz!”

“herkes her şey için kullanabilir”

Bu ilk veri dilimini başlattıktan sonra, DeepMind, Avrupa’nın amiral gemisi yaşam bilimleri laboratuvarı olan Avrupa Moleküler Biyoloji Laboratuvarı (EMBL) tarafından sürdürülecek olan protein deposuna eklemeye devam etmeyi planlıyor. EMBL genel müdürü Edith Heard’a göre DeepMind, yıl sonuna kadar 100 milyon protein yapısı için tahminler yayınlamayı umuyor.

Hassabis, verilerin hem bilimsel hem de ticari araştırmacılar için sonsuza kadar ücretsiz olacağını söylüyor. DeepMind CEO’su bir basın brifinginde “Herkes bunu herhangi bir şey için kullanabilir” dedi. “Sadece alıntıya dahil olan insanlara kredi vermeleri gerekiyor.”

Bir proteinin yapısını anlamak, çeşitli alanlardaki bilim adamları için faydalıdır. Bilgi, yeni ilaçların tasarlanmasına, atık maddeleri parçalayan yeni enzimlerin sentezlenmesine ve virüslere veya aşırı hava koşullarına dayanıklı mahsuller oluşturulmasına yardımcı olabilir. DeepMind’in protein tahminleri şimdiden, COVID-19’a neden olan virüs olan SARS-CoV-2’nin çalışmalarını incelemek de dahil olmak üzere tıbbi araştırmalar için kullanılıyor.

“Bilim camiası için kesinlikle büyük bir etkisi olacak”

Yeni veriler bu çabaları hızlandıracak, ancak bilim adamları, bu bilgileri gerçek dünyadaki sonuçlara dönüştürmenin hala çok zaman alacağını belirtiyor. Colorado Üniversitesi biyokimya bölümünde profesör olan Marcelo C. Sousa, “Bunun bir yıl içinde hastaların tedavi şeklini değiştirecek bir şey olacağını düşünmüyorum, ancak bilim camiası üzerinde kesinlikle büyük bir etkisi olacak” dedi. , The Verge’e söyledi.

DeepMind kıdemli araştırma bilimcisi Kathryn Tunyasuvunakool, bilim adamlarının bu tür bilgilerin parmaklarının ucunda olmasına alışmaları gerektiğini söylüyor. “Bir biyolog olarak, 20.000 yapıya bile bakmak için elimizde bir oyun kitabı olmadığını doğrulayabilirim, bu yüzden bu [amount of data] son derece beklenmedik, ”dedi Tunyasuvunakool The Verge. “Yüz binlerce yapıyı analiz etmek – bu delilik.”

Bununla birlikte, özellikle DeepMind’in yazılımı, deneysel olarak belirlenmiş modellerden ziyade protein yapılarının tahminlerini üretir; bu, bazı durumlarda yapıyı doğrulamak için daha fazla çalışmaya ihtiyaç duyulacağı anlamına gelir. DeepMind, AlphaFold yazılımına doğruluk ölçümleri oluşturmak için çok zaman harcadığını ve bunun her tahmin için ne kadar emin olduğunu sıraladığını söylüyor.

AlphaFold tarafından tahmin edilen örnek protein yapıları. Resim: Derin Zihin

Bununla birlikte, protein yapılarının tahminleri hala oldukça faydalıdır. Bir proteinin yapısını deneysel yöntemlerle belirlemek pahalı, zaman alıcı ve çok sayıda deneme yanılma işlemine dayanır. Bu, düşük güvenirlikli bir tahminin bile bilim insanlarını araştırma için doğru yönü göstererek yıllarca çalışmaktan kurtarabileceği anlamına gelir.

Glasgow Üniversitesi’nde yapısal biyoloji profesörü olan Helen Walden, The Verge’e DeepMind’ın verilerinin araştırma darboğazlarını “önemli ölçüde kolaylaştıracağını”, ancak “örneğin, biyokimya ve biyolojik değerlendirme yapmanın zahmetli, kaynak tüketen işinin” olduğunu söylüyor. ilaç fonksiyonları” kalacaktır.

Çalışmalarında daha önce AlphaFold’dan gelen verileri kullanan Sousa, bilim adamları için etkinin hemen hissedileceğini söylüyor. “DeepMind ile yaptığımız işbirliğinde, 10 yıldır elimizde olan bir protein örneğine sahip bir veri setimiz vardı ve buna uyan bir model geliştirme noktasına hiç gelmemiştik” diyor. “DeepMind bize bir yapı sağlamayı kabul etti ve 10 yıldır üzerinde oturduktan sonra sorunu 15 dakika içinde çözmeyi başardılar.”

Protein katlanması neden bu kadar zor?

Proteinler, insan vücudunda 20 farklı çeşitte bulunan amino asit zincirlerinden yapılır. Herhangi bir protein, her biri farklı yönlerde katlanabilen ve bükülebilen yüzlerce ayrı amino asitten oluşabileceğinden, bu, bir molekülün nihai yapısının inanılmaz derecede fazla sayıda olası konfigürasyona sahip olduğu anlamına gelir. Bir tahmin, tipik proteinin 10^300 şekilde katlanabilmesidir – bu, 1 ve ardından 300 sıfırdır.

Protein katlanması, onlarca yıldır biyolojinin “büyük bir meydan okuması” olmuştur.

Proteinler mikroskopla incelenemeyecek kadar küçük olduğundan, bilim adamları nükleer manyetik rezonans ve X-ışını kristalografisi gibi pahalı ve karmaşık yöntemlerle yapılarını dolaylı olarak belirlemek zorunda kaldılar. Bir proteinin yapısını sadece onu oluşturan amino asitlerin bir listesini okuyarak belirleme fikri uzun zamandır teorize edilmiş ancak başarılması zor olduğundan, birçok kişinin onu biyolojinin “büyük bir meydan okuması” olarak tanımlamasına yol açmıştır.

Ancak son yıllarda, hesaplama yöntemleri – özellikle yapay zeka kullananlar – bu tür analizlerin mümkün olduğunu öne sürdü. Bu tekniklerle AI sistemleri, bilinen protein yapılarının veri kümeleri üzerinde eğitilir ve bu bilgileri kendi tahminlerini oluşturmak için kullanır.

DeepMind’ın AlphaFold yazılımı, CASP yarışmasındaki performansının gösterdiği gibi, hesaplamalı protein katlamanın doğruluğunu önemli ölçüde artırdı. Resim: Derin Zihin

Birçok grup yıllardır bu sorun üzerinde çalışıyor, ancak DeepMind’in derin yapay zeka yeteneği ve bilgi işlem kaynaklarına erişimi, ilerlemeyi önemli ölçüde hızlandırmasına izin verdi. Geçen yıl şirket, CASP olarak bilinen uluslararası bir protein katlama yarışmasında yarıştı ve rekabeti alt üst etti. Sonuçları o kadar doğruydu ki, CASP’in kurucularından biri olan hesaplamalı biyolog John Moult, “bir anlamda problemin [of protein folding] Çözüldü.”

DeepMind’ın AlphaFold programı, geçen yılki CASP yarışmasından bu yana güncellendi ve şimdi 16 kat daha hızlı. Hassabis, “Ortalama bir proteini dakikalar içinde, çoğu durumda saniyeler içinde katlayabiliriz” diyor. Şirket ayrıca geçen hafta AlphaFold’un temel kodunu açık kaynak olarak yayınladı ve başkalarının gelecekte çalışmalarını geliştirmesine izin verdi.

İngiltere’nin önde gelen protein katlama yazılımlarından bazılarını geliştiren Reading Üniversitesi’nde profesör olan Liam McGuffin, AlphaFold’un teknik dehasını övdü, ancak aynı zamanda programın başarısının onlarca yıllık önceki araştırmalara ve kamu verilerine dayandığını da kaydetti. McGuffin, The Verge’e “DeepMind, bu veritabanını güncel tutmak için geniş kaynaklara sahip ve bunu yapmak için herhangi bir akademik gruptan daha iyi bir konumdalar” dedi. “Bence akademisyenler sonunda oraya varırlardı, ancak daha yavaş olurdu çünkü bizler o kadar iyi kaynaklara sahip değiliz.”

DeepMind neden umursuyor?

The Verge’in konuştuğu birçok bilim insanı, DeepMind’ın bu verileri ücretsiz olarak yayınlama konusundaki cömertliğine dikkat çekti. Ne de olsa laboratuvar, ticari sağlık projelerine büyük miktarda kaynak aktaran Google-parent Alphabet’e ait. DeepMind’ın kendisi her yıl çok para kaybediyor ve şirket ile ana firması arasında araştırma özerkliği ve ticari uygulanabilirlik gibi konularda çok sayıda gerilim raporu var.

Ancak Hassabis, The Verge’e şirketin bu bilgileri her zaman ücretsiz olarak sunmayı planladığını ve bunu yapmanın DeepMind’in kurucu değerlerinin bir yerine getirilmesi olduğunu söyler. DeepMind’in çalışmalarının Google’da birçok yerde kullanıldığını vurguluyor – “neredeyse kullandığınız her şey, kaputun altında bizim teknolojimizden bazıları var” – ancak şirketin birincil hedefinin her zaman temel araştırma olduğunu vurguluyor.

“Değere ulaşmanın birçok yolu vardır.”

Hassabis, “Kazandığımızdaki anlaşma, öncelikle YG ve Yapay Zeka teknolojilerinin durumunu ilerletmek ve ardından bunu bilimsel atılımları hızlandırmak için kullanmak için burada olduğumuz yönündeydi” diyor. “[Alphabet] para kazanmaya odaklanan birçok bölüme sahip” diye ekliyor, DeepMind’in araştırmaya odaklanmasının “bilim camiası için prestij ve iyi niyet açısından her türlü faydayı getirdiğini” belirtiyor. Değer elde etmenin birçok yolu var.”

Hassabis, AlphaFold’un gelecek şeylerin bir işareti olduğunu tahmin ediyor – yapay zekanın insan biyolojisi gibi karmaşık problemlerin üstesinden gelmek için büyük potansiyelini gösteren bir proje.

“Bence gerçekten heyecan verici bir andayız” diyor. “Önümüzdeki on yılda, biz ve yapay zeka alanındaki diğer kişiler, burada, Dünya’da sahip olduğumuz gerçekten büyük sorunlara çözümleri gerçekten hızlandıracak inanılmaz atılımlar üretmeyi umuyoruz.”

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz