Bio-AI

ESM폴드 : 메타의 알파폴드

Physicist 2022. 11. 12. 03:31

https://www.codingworldnews.com/news/articleView.html?idxno=13298

ESM폴드의 단백질 구조 예측 속도는 알파폴드보다 60배 더 빠르다. 그러나 ESM폴드는 아직 알파폴드보다 정확도가 낮은 편이다.
다만, ESM폴드가 예측한 단백질 구조 중 1/3 이상은 질적으로 완성도가 높아, 전체적인 단백질 모양이 정확하다는 확신을 가질 수 있었다. 간혹 더 미세한 원자 수준의 세부 사항을 구별할 수도 있었다.


https://www.dongascience.com/news.php?idx=56929

메타는 텍스트를 예측하는 '대형 언어 모델(LLM)'이 적용된 AI 'ESM폴드(ESMFold)'로 박테리아와 바이러스 등 미생물의 단백질 약 6억1700개 이상을 예측한 결과를 논문 사전공개 사이트 '바이오 아카이브' 11월 1일자에 공개했다. 대형 언어 모델이란 일부 글자만 적어도 전체 단어를 예측하는 자동완성 기능에 사용되는 AI다.


https://www.thedailypost.kr/news/articleView.html?idxno=89916 

페이스북과 인스타그램을 운영하는 메타는 단백질 입체 구조를 예측하는 AI 언어모델 'ESM-2'를 사용해 6억 1700만종 이상의 메타게놈(Metagenome) 단백질 구조를 예측한 데이터베이스인 'ESM 메타게놈 아틀라스(ESM Metagenomic Atlas)'를 공개했다. 연구결과는 논문 사전공개 사이트 '바이오 아카이브'에 게재됐다.

메타의 단백질 구조 예측 AI는 'ESM 폴드(ESMFold)'로 불리며 단백질을 구성하는 원자나 분자를 언어로 해석해 학습 데이터에서 입체 구조를 예측하는 모델이다. 연구팀은 이 모델을 확장해 150억 개 파라미터를 가진 ESM-2를 개발했다.

https://github.com/facebookresearch/esm