Drug 76

의약화학

인공지능/컴퓨터 기반 신약개발을 연구하려고 한다면, 무엇을 해야할까? 라고 질문한다면 저는 일단 의약화학 (0medicinal chemistry)을 공부 해야 한다고 대답하고 싶습니다. 전 직장에서 저에게 "약을 만든다면서 의약화학을 공부하지 않고서 어떻게 약을 만들 수 있겠습니까?" 라고 하셨던 분이 있습니다. 저는 그 말에 충격을 받고 의약화학책을 열심히 읽었는데, 거기엔 온갓 신약개발 사례들이 적혀 있었습니다. 제대로된 경험도 없는 벤처 회사 입장에선, 신약을 개발해본 경험이 있는 사람 한명이 있다면 얼마를 주고서라도 데려와야 할 것입니다. 그런데, 많은 신약개발 경험들이 담긴 책을 무려 저렴한 가격 10만원 이하에 살 수 있다면... 이것을 공부 안하는게 오히려 이상한 일일 것입니다. 제가 이분야..

pharmacophore model

분자가 단백질에 결합하는가 여부를 예측하기 위한 여러 방법들이 있습니다. 그들중 일부는 방법이라고 표현하고 싶지도 않을 정도로 허술하지만... docking, Molecular Dynamics, docking 구조 기반 scoring method, 2D 혹은 3D rule , ligand based ML, 단백질 구조기반 ML... 등등 여러 방법이 있습니다. 각각 장단점이 있습니다. 단독으로 사용할 수 없는 방법도 있고, 혹은 단독으로 사용할 때는 별로 좋지 않지만, 다른 방법과 결합했을 때 성능이 크게 향상되는 것도 있습니다. 예를 들자면 docking 구조 기반의 score나, Molecular dynamics 는 초기구조로 docking 구조를 필요로 합니다. docking 자체는 결합 예측 성능..

합성 가능한 분자 생성

저도 머신러닝 기반 분자생성 논문을 썼지만, 머신러닝 기반 분자생성 방법들 중 쓸만한게 거의 없습니다. 논문 저자들 중 자신이 만든 메소드를 계속 쓰는 사람이 있는지 궁금할 정도입니다. 여러가지 문제가 있지만, 일단 데이터를 통한 학습이라는 것이 데이터로부터 자유롭지 못하다는 것과, 합성가능성을 고려하기 어렵다는 점이 문제입니다. 학습한 데이터와 다른것이 생성되었다면, 그것이 머신의 창의력의 결과이기보다는 학습이 잘못되어서 나왔을 가능성이 높습니다. 그리고 사이드 체인에 뭔가 많이 붙었지만, 그게 정말 필요해서 붙었는지, 아니면 머신의 학습 오류인지 판단하기도 어렵습니다. AE 기반 분자 생성 모델에서 AE의 reconstruction조차 100%가 안되는데... 생성할 때 붙는 무언가도 노이즈에 의한 ..

단백질 구조예측과 단백질 구조 기반 약물 탐색

제가 단백질 구조 예측 분야를 연구하던 시절엔 구조 예측에 만에 집중했고, 단백질 하나 하나에 대한 연구를 별로 하지 않았습니다. 그러다보니 단백질 구조 예측을 해도 그것을 어디에 어떻게 사용할지에 대해서 깊히 생각해보지 않았습니다. 신약개발 분야로 넘어오면서 여러 단백질에 대해서 구조를 분석하다보니 여러 재미있는 점들을 알 수 있었습니다. 인간 단백질들 중에서 패밀리 단백질끼리는 서열이 매우 (50% 이상?) 유사합니다. 구조 또한 거의 유사합니다. 약물의 단백질에 대한 결합 여부를 실험해보면 패밀리에 속한 단백질 끼리는 상관성이 매우 높게 나올 것입니다. 슈퍼 패밀리라 할 수 있는 단백질들은 서열 유사성이 20% 정도로 떨어지지만, 전체적인 구조는 유사합니다. 그런데, 슈퍼 패밀리에 속하는 포켓 구조..

AutoDock Vina 및 변종 사용법

(추가) AutoDock Vina에서 사용하는 pdbqt 확장자에 대한 설명은 다음 글을 참고하세요. novelism.tistory.com/32 (추가) GUI를 이용한 도킹이나 실행 예제는 https://novelism.tistory.com/259 https://novelism.tistory.com/260 https://novelism.tistory.com/261 를 참고하세요. protein ligand docking 이란? 도킹 시뮬레이션의 1차적인 목표는 단백질-리간드의 결합 구조의 탐색 입니다. 결합 구조를 바꿔가면서 에너지 (혹은 스코어)를 계산해서 에너지가 최소화 되는 구조를 탐색하는 것입니다. 에너지 모델을 사용하니 결합 에너지 (다른 표현으로 binding free energy, 결합력,..

인공지능 신약개발에 대한 이야기

최근 2~3년 정도 사이에 인공지능 신약개발 관련 연구들이 많이 출판되고, 관련 사업을 하는 회사들도 많이 등장하였습니다. 그러나 그런 연구를 하고 있는 제가 봤을 때 신약개발에 실제로 도움이 될만한 연구, 혹은 써봤는데 잘 된다 좋다. 라고 할만한 메소드는 별로 없었습니다. 저는 이제는 좀 다른 접근방법이 필요하다고 생각합니다. 저는 2013년부터 단백질 관련 컴퓨터 시뮬레이션 연구를 하고 있었는데, 단백질 구조예측 분야에선 이미 2000년대 초반부터 머신러닝을 사용해왔기 때문에 머신러닝에 대해서도 관심을 가지고 있었습니다. 그러다가 알파고가 등장하고 딥러닝이 대중적으로 유명해지면서 저도 머신러닝 관련 연구를 시작하였습니다. 한편으론 단백질 구조예측만으론 가치있는 연구를 하기 어렵다는 생각이 들어서 신..