알파고가 은퇴한 후 구글 딥마인드가 다음으로 도전한 것은 단백질 구조예측이라는 오랜 과학 난제였다. 이를 위해 만들어진 알파폴드는 과학계의 올림픽이라 할 수 있는 CASP 대회에 참가하여 주요 종목에서 1위를 차지하는 쾌거를 올렸다. 이 사실은 12월 1일(토)부터 4일간 멕시코 칸쿤에서 열린 CASP 단백질 구조예측 학회에서 발표되었다. CASP는 미 국립보건원(NIH) 후원으로 2년마다 열리는 단백질 구조예측 학술대회로, 실험구조가 곧 밝혀질 것으로 예상되는 단백질의 구조를 컴퓨터로 예측한 후 실험 구조와 비교 평가하는 대회다.
서울대 화학부 석차옥 교수는 심사위원 중 유일하게 CASP 참가자이면서 자문위원이기도 하다. 석교수가 이끄는 서울대 화학부팀은 단백질구조 예측 학술대회인 CASP에서 미래분야라 불리는 구조정밀화 종목에서 서버 1위, 복합체 구조예측 종목에서 전체 2위를 차지하였다. 구조정밀화는 정보부족으로 부정확하게 예측된 구조의 정확도를 향상시키고자 하는 종목이며, 복합체 구조예측은 단일 단백질들이 결합하여 이루는 단백질 복합체 구조를 예측하는 종목이다. 이 두 종목은 단백질 구조예측이 신약개발을 비롯한 바이오, 의약학 연구에 실질적으로 응용되는데 중요하여 CASP 창시자 물트 교수가 미래 분야라 지칭하였다.
올 여름 실시된 제13회 CASP 대회에는 200여개 참가팀이 100여개의 문제를 풀었고, 그 결과를 정리하는 12월 멕시코 학회에서 7개 종목의 세부순위가 발표되었다. 이번 CASP 학회에는 딥마인드 소속 연구자 2명 뿐 아니라 2개 종목에서 훌륭한 성과를 올린 서울대 출신 과학자 6명이 강연자 또는 토론자로 초청되어 우리나라 과학의 국제적 위상을 드높였다. 이번 대회에서 북한팀도 한 종목 1위를 차지하여 멕시코 학회 초청을 받았으나 참가하지는 않았다.
단백질 구조는 단백질의 삼차원 모양을 의미하며, 그 중요성은 단백질 구조연구가 단일 분야로는 노벨상이 가장 많이 수상된 분야라는 사실에서도 엿볼 수 있다. 세 번의 노벨화학상이 단백질 구조를 밝히는 실험방법을 개발한 과학자들에게 수여되었을 뿐 아니라(1962년, 2002년, 2017년), 이들 방법을 이용하여 특정한 개별 단백질들의 구조를 밝힌 공로로 다수의 노벨상이 추가로 수상되었다.
단백질 구조연구는 다양한 바이오 및 의약학 연구, 질병진단 및 치료제 개발에 큰 파급력을 가지고 있는 기초학문분야이다. 인간은 2만여 종의 단백질을 가지고 있으며, 질병과 관련된 여러 생물도 많은 종류의 단백질을 가지고 있다. 수많은 단백질의 구조를 하나하나 실험적으로 결정하는 것은 시간과 비용이 매우 많이 들기 때문에, 과학자들은 컴퓨터를 이용하여 많은 단백질의 구조를 손쉽게 예측하는 방법을 개발하고자 노력하였다. 단백질 구조예측 대회 CASP는 이러한 예측 방법을 평가하여 향후 발전을 이끌고자 1994년 미국 메릴랜드대 물트 교수에 의해 창립되어 2년마다 개최되고 있다.
올림픽처럼 CASP도 여러 종목으로 나누어져 있다. 이번에 알파폴드가 도전하여 2위와 큰 격차로 1위를 차지한 종목은, 문제로 주어진 단백질과 비슷한 단백질의 실험 구조가 없는 경우에 구조를 예측하는 토폴로지라는 주요 종목이다. 이번 멕시코 학회에서는 알파폴드의 성공요인이 무엇인지에 대해 활발한 토론이 이루어졌다. 결론은 알파폴드가 인공지능의 힘만으로 성공한 것이 아니라, 지난 20여년간 해당 학계에 축적되어 왔던 여러 방법 또한 중요하였다는 것이다. 알파폴드는 주요 방법 중 하나를 인공지능 방법으로 바꾸는데 성공한 것이다. 심지어 알파폴드와 비슷한 인공지능 방법을 개발한 논문도 작년에 발표된 바 있으며, 그 방법을 개발한 중국출신 재미 과학자 수 박사는 같은 종목에서 2위를 차지하였다. 알파폴드 성공의 핵심 열쇠 중 하나는 알파고를 개발한 딥마인드의 노하우인 것으로 보인다.
이번 CASP 대회에 북한팀이 참가한 종목은 구조평가라는 종목이다. 이 종목은 정확한 구조예측을 위해 필요한 여러 요소 중 구조평가라는 요소 하나를 떼 내어 별도의 종목으로 만든 것이다. 북한팀은 구조평가 심사 항목 중 부분구조평가 부문에서 1위를 차지하였다. 이번 구조평가 종목의 심사는 공교롭게도 우리나라 과학자 서울대 화학부 석차옥 교수가 맡아, 다른 종목과 마찬가지로 참가번호만으로 암맹평가를 하였다. 북한팀은 멕시코 학회에 패널토론자로 초청되었으나 일정상의 이유로 참가하지는 않았다.
이번 멕시코 학회 무대에서 활동한 우리나라 과학자는 총 6명이다. 구조평가 심사위원을 맡은 석차옥 교수를 비롯하여, 구조정밀화 종목 초청강연을 한 미시간 주립대 허림 박사와 워싱턴대 박한범 박사, 같은 종목 패널토론자로 참가한 서울대 원종훈 박사과정 학생, 복합체 구조예측 종목에서 초청강연을 한 서울대 백민경 박사, 데이터보조 구조예측 종목의 패널토론자로 참가한 강원대 이주용 교수 모두 서울대 화학부 출신이다.
이번에 알파폴드가 단백질 구조예측 문제를 완전히 해결한 것은 아니지만, 인공지능이 기초과학 연구에도 핵심적인 도구로 사용될 수 있다는 것은 입증하였다. 알파폴드의 이번 성공은 근본 원리를 중요시하는 보수적인 기초과학 문화 속에 데이터 학습에 기반을 둔 인공지능이 이미 깊이 파고들었다는 것을 보여주었다. 알파폴드, 북한, 그리고 우리나라 과학자들이 2년 뒤에 열릴 다음 CASP 대회에서 얼마나 발전된 성과를 보일지 기대된다.
자료제공 : 자연과학대학 화학부(02-880-9197)
구조정밀화 종목 패널토론 시간. 왼쪽부터 서울대 원종훈 학생, 워싱턴대 박한범 박사, 미시간 주립대 허림 박사, 미시간 주립대 파이그 교수, 서울대 석차옥 교수, 워싱턴대 베이커 교수, 심사위원 캠브리지대 리드 교수. 베이커 교수는 노벨화학상 후보로 종종 거론되는 거장이다.
서울대 화학부 석차옥 교수가 구조평가 분야 심사결과를 발표하고 있다.
서울대 화학부팀에서 정확하게 예측한 단백질 복합체 구조 세 개. 보라색 예측 구조가 노란색 실험구조와 매우 유사하다.