▶ Interview
백민경 생명과학부 교수
인공지능을 이용해 인류의 밝은 미래를 개척하는 학자가 있다. 생명과학 발전의 핵심인 단백질 구조를 예측하는 인공지능 ‘로제타폴드’를 개발한 생명과학부 백민경 교수. <사이언스>지로부터 ‘2021년 올해 최고의 연구 성과’로 선정되는 영광을 안은 백민경 교수와 만났다.
작년 9월 모교인 서울대학교 생명과학부 교수로 부임한 백민경 교수의 첫 학기는 누구보다 분주했다. 학생과 연구원이던 그가 3년여 만에 교수로서 다시 자연과학대 건물에 들어서면서 앞으로 펼쳐 나갈 연구 프로젝트를 깊이 고민하는 시기였기 때문이다. 국제학술지 〈사이언스〉가 ‘2021년 올해 최고의 연구 성과’로 선정한 AI 단백질 구조 예측 프로그램 ‘로제타폴드(RoseTTAFold)’의 핵심 개발자이기도 한 백 교수를 통해 머지않아 마주할 가까운 미래의 변화상을 살펴보았다.
2018년 박사 학위를 마치고 500동 자연과학대를 탈출했다고 생각했는데(웃음) 어느새 교수로서 500동에 입성해 정신없는 하루하루를 보낸 듯해요. 앞으로 제가 랩을 꾸려나갈 때 필요한 게 무엇인지 살피고 계획을 세우는 중요한 시간이었습니다. 기업으로부터 좋은 제안을 받기도 해서 얼마간 고민했지만, 기업 발전을 도모하기보다 계산생물학 분야의 전문 인력을 늘리는 게 장기적으로 더 좋은 일이라 판단해서 학교를 선택했어요. 계산생물학에 관심을 가진 학생들이 면담을 신청해올 때마다 흐뭇합니다.
생명체 안에서 일어나는 거의 모든 현상에 관여하는 가장 중요한 생체 분자가 단백질입니다. 아미노산이 다양하게 결합해 만들어내는 수많은 단백질은 그 3차원 구조에 따라 삶의
원동력이 되기도 하고, 병을 일으키기도 해요. 따라서 단백질의 구조를 이해하고 그것이 어떻게 기능하는지 알 수 있다면 생명 현상을 파악하고 신약 개발의 첫 단추를 푸는 데
큰 도움을 받을 수 있습니다. 컴퓨터를 이용한 계산을 통해 단백질 구조 정보와 상호작용을 예측하면서 인간을 포함한 모든 생명 현상을 깊이 있게 이해하는 것이 계산생물학의
연구 목적이라고 할 수 있습니다.
계산생물학은 이름처럼 계산(컴퓨터)에 생물학을 더한 것이죠. 실험 대신 컴퓨터 앞에서 연구를 합니다. 유전자부터 단백질 서열까지 수많은 데이터를 쌓고, 그 데이터를 바탕으로
계산을 통해 생명을 이해하는 학문이라고 말할 수 있어요. ‘손에 물을 안 묻히고’ 하는 생물학 연구라고 할 수도 있겠네요.(웃음) AI 덕분에 컴퓨터가 할 수 있는 계산의
영역이 더 넓어졌습니다.
20가지 아미노산이 어떻게 결합하느냐에 따라 단백질은 굉장히 다른 성질을 갖는데, 단백질 서열을 바탕으로 서로 다른 단백질의 생김새와 기능을 분석하고 예측하는 데 인공지능이 관여하게 됩니다. 이전에도 X선 결정법이나 초저온 전자현미경 기법(cryo-EM)처럼 단백질 구조를 파악하기 위한 실험법이 존재해왔습니다. 그런데 사람들이 볼 수 있는 구조 데이터를 찾아내는 데 오랜 시간과 비용이 소요됐죠. 지구상에 3억 개 이상의 단백질이 있다고 알려져 있는데, 하나의 단백질 구조를 파악하는 실험만으로도 몇 년이 걸리곤 하니까요. 그에 반해 AI를 활용한 로제타폴드는 시간과 비용을 획기적으로 줄일 수 있게 만들었습니다. AI가 굉장히 빠른 속도로 단백질 구조를 파악해내는 덕분에 짧게는 몇 초, 길어도 한두 시간 안에 풀 수 있는 것이죠. 100%의 정확도를 갖진 못하지만, 그 정확도의 범위까지도 예측해 알려줍니다. 결국 요즘은 많은 실험자가 로제타폴드로 먼저 구조를 풀어내고, 실험을 병행해 증명해가는 방식으로 활용하고 있습니다.
후보에 오른 건 그전부터 알고 있었는데, 신문사의 인터뷰 요청을 받으면서 선정 사실을 알게 됐어요. 굉장히 뿌듯했습니다. 사실 단백질 구조 예측 연구는 대학원 때부터 한 건데, 제가 생각한 것보다 많은 사람이 이 연구의 중요성을 인정해주는 듯해 기뻤어요. 제 연구를 이야기할 때 이제 사람들을 좀 더 쉽게 설득할 수 있겠다는 생각이 들더라고요.
AI가 사람을 대체할 수는 없으리라 생각해요. 사람이 해야 하는 많은 일을 도와준다는 측면에 가까워지겠죠. 개발자로서는 AI가 스스로 학습하는 덕분에 아이디어를 세세하게 구현할 필요가 없어지고, 사용자 입장에서도 챗GPT 같은 AI로부터 코딩이나 외국어 교정 같은 도움을 받을 수 있으니 말이에요. 기존의 일자리가 다른 형태로 바뀌는 현상이 나타나겠지만, 오히려 또 다른 기회를 만들어줄 것이라 예상합니다. 모든 인공지능에는 오류가 있게 마련입니다. 그 오차를 줄이는 연구와 개발은 사람의 몫이죠. 더불어 AI를 사용하는 사람들에겐 검증의 책임이 뒤따릅니다. 제가 하고 있는 연구에서도 AI가 예측하는 단백질 구조가 정말 맞는지 검증해야 하는 것처럼 말이죠.
단백질을 만드는 것이 DNA와 같은 핵산입니다. 유전 정보를 바탕으로 단백질을 만드는 레시피가 핵산에 저장된 셈이죠. 우리 몸의 세포들은 다 같은 유전 정보를 가지고
있는데도 눈, 피부, 장기 등의 조직마다 다른 형태로 분화하는 데, ‘전사 인자’라고 부르는 단백질이 핵산과 상호작용하면서 어떤 단백질을 많이 혹은 적게 만드는지가 달라지기
때문입니다.
단백질과 핵산의 기본 상호작용을 이해하면 왜 조직 간의 차이가 나타나는지, 외부 환경 변화에 대응하기 위해 단백질의 발현량이 어떻게 조절되는지, 단백질 발현량 조절에 이상이
생겼을 때 왜 질병이 발생하는지 등과 같이 다양한 생명 현상을 이해하는 데 큰 도움이 됩니다. 이를 잘 응용해서 특정 핵산 서열과 결합하여 특정 단백질의 발현을 증가,
감소시키는 인공 전사 인자를 설계하면 발현량 조절 이상으로 발생하는 질병을 치료할 수도 있습니다. 가뭄 및 질병 저항성이 뛰어난 작물을 개량하는 데도 활용할 수 있고요.
‘유전자 가위’라고도 불리는 유전자 치료제 개발에도 적용할 수 있습니다.
이런 중요성 때문에 아직까지 바이오 분야의 난제 중 하나로 꼽히는 단백질-핵산 상호작용을 예측하는 AI를 개발하려는 것입니다. 이를 위해 두 생체 물질의 상호작용을 결정하는
물리화학적 이론을 AI 학습에 접목해 예측 정확도를 높이려 해요. 단백질-핵산 상호작용을 예측하고 설계하는 AI의 개발은 생명 현상을 이해하는 것은 물론 질병 치료, 식량
위기 같은 당면한 사회문제를 해결하는 데도 중요한 역할을 할 수 있으리라 기대합니다.