Drug/Computer-Aided Drug Discovery

알파폴드가 예측한 단백질 구조는 완벽한가?

Novelism 2022. 8. 5. 21:06

 

 과거 단백질 구조 예측 연구를, 그리고 지금은 구조기반 약물 탐색 연구를 하고 있는 입장에서

자주 받는 질문 중 하나가 알파폴드가 예측한 단백질 구조는 완벽한가 라는 질문입니다. 

그 외에도 단백질 구조 예측이 도움이 되는가? 단백질 구조 예측 연구는 이제 더 이상 할 일이 없는가? 같은 질문들도 있습니다.

 

 알파폴드는 이미 누구나 사용할 수 있도록 공개되어있고, 알파폴드가 예측한 구조도 꾸준히 공개되고 있습니다. 

 알파폴드의 예측 구조는 일부 경우를 제외하면, 대부분 정확도가 매우 높고, 실험 구조와 큰 차이가 없다고 해도 과언이 아닙니다. 

 이미 단백질 구조도 다 공개되었으니 그러면 더 이상 구조 예측, 혹은 구조 결정 실험은 필요 없는가?라고 묻는다면 저는 아니라고 대답할 것입니다. 

 그 근거 중 하나는, PDB (prtoein data bank)의 실험 구조입니다.  PDB에서 특정 단백질을 검색해보면, 그 실험 구조가 밝혀지지 않은 경우도 있지만, 백여 개에 가까운 실험 결과가 있는 단백질도 있습니다.

 구조가 단 하나로 충분하다면, 왜 그렇게 많이 실험을 했을까요? 당연히 실험기법이 좋아져서 해상도가 올라간다는 점도 있습니다만, 구조가 단 하나로 충분하지 않기 때문이라고 생각할 수 있습니다. 애초에 생체내에서 단백질은 결정 상태와 다르게 구조가 경직되어 있지 않습니다. 

 변이가 일어나는 경우나, 서로 다른 약물이 결합된 경우에 약물과의 결합 구조를 보기 위해서 새로 실험을 할 수도 있지만, 이와 별개로도, 동일한 서열의 단백질의 구조가 다를 수도 있습니다. 생체에서 단백질은 고유의 기능을 수행합니다. 기능을 수행하는 과정은 구조적인 변화와 관련이 있습니다. 주로 다른 분자와의 결합에 의해 구조에 변화가 일어납니다. 촉매 (효소)로 작용한다면, 기질에 맞도록 구조 변화를 일으키기도 하고, 신호 전달 과정에서도 구조 변화를 일으킵니다. EGFR 이 여기에 특별히 해당됩니다. receptor이기에 EGF와 결합하고 다이머를 이루면서 kinase 영역이 active form으로 변하기도 하고, 특정 변이를 가진 경우엔 EGF의 결합 없이도 active form을 유지하기도 합니다. 또한 EGFR의 약물 타입은 5가지 정도가 있는데, 그 타깃들의 단백질 구조가 전부 동일한 것은 아닙니다. 구조 변화를 일어나기 전이 약물이 타깃일 수도 있고, 일어난 후가 타깃이 될 수도 있습니다. 

 예전에 콜레스테롤 운반 단백질의 구조를 살펴본 일이 있는데, 이 단백질의 콜레스테롤 결합 부위는 상당히 깊이 파여있는 구조입니다. 콜레스테롤이 결합되지 않은 상태에선 단백질의 포켓이 아예 닫혀있고, 결합할 공간 자체가 수축되어있습니다. 콜레스테롤이 접근하면 입구가 열리면서 내부 공간도 넓어집니다. 이런 단백질의 unbound form만을 알고 있다면 도킹 시뮬레이션 같은 것은 할 수 없습니다. 아마도 강제로 콜레스테롤이 결합하도록 레스트레인트를 걸고 분자동역학 시뮬레이션을 진행하면 결합 시뮬레이션이 가능할 수도 있지만, 쉬운 일은 아닙니다. 

 약물 결합이 아니더라도, pH 나 특정 이온의 농도 등 다양한 세포 환경이 단백질 구조에 영향을 미칩니다.

 

 알파폴드가 얼마나 대단한 일을 해냈는가에 대해 말한다면, 정말로 놀라울 정도로 대단하고, 노벨상을 받는 것이 당연한 일이라고 저는 생각합니다. 제가 단백질 구조 예측 연구를 하던 2016년쯤, 지금 방식으로 (TBM) 풀기 어려운 단백질 구조를 풀 방법이 있다면 노벨상을 받을 수 있지 않겠냐고 동료들과 이야기했던 게 생각나네요. 그때 상상했던 수준보다 훨씬 더 정확도가 높은 방법이 이미 개발된 것입니다. 컴퓨터 시뮬레이션을 활용한 연구가 노벨상을 받은 적은 여러 번 있지만, 아마도 알파폴드는 인공지능을 활용한 연구가 노벨상을 받는 첫 사례가 될 것입니다. 

 

 예측된 단백질 구조는 단백질 구조를 밝히는 실험에도 도움이 됩니다. 단백질이 거대분자이다 보니, 구조 결정 실험을 진행해도 그 실험 결과를 해석해서 구조를 찾는 것이 쉽지 않은데, 참고할만한 예시 구조가 있다면 이 과정이 더 쉽게 진행됩니다. 단백질 구조 자체를 분석하는 일에도 당연히 도움이 됩니다. 단백질의 구조를 보면 알 수 있는 것들이 많습니다. 구조로부터 기능을 유추할 수도 있고, 어떤 아미노산이 어떤 역할을 하는지, 어디가 고장 나면 어떤 문제가 생길지 등을 분석할 수 있습니다. 단백질 구조 기반 신약개발에도 큰 도움이 되긴 하는데, 구조 기반 신약개발은 나름 섬세한 일이고, 그냥 아무 단백질 구조나 입력으로 집어넣는다고 좋은 결과가 나오지 않습니다. 특히 단백질-약물 결합은 induced fit으로 서로 모양에 맞도록 구조가 변형된다는 점을 염두해야 합니다.