Drug 74

합성 가능한 분자 생성

저도 머신러닝 기반 분자생성 논문을 썼지만, 머신러닝 기반 분자생성 방법들 중 쓸만한게 거의 없습니다. 논문 저자들 중 자신이 만든 메소드를 계속 쓰는 사람이 있는지 궁금할 정도입니다. 여러가지 문제가 있지만, 일단 데이터를 통한 학습이라는 것이 데이터로부터 자유롭지 못하다는 것과, 합성가능성을 고려하기 어렵다는 점이 문제입니다. 학습한 데이터와 다른것이 생성되었다면, 그것이 머신의 창의력의 결과이기보다는 학습이 잘못되어서 나왔을 가능성이 높습니다. 그리고 사이드 체인에 뭔가 많이 붙었지만, 그게 정말 필요해서 붙었는지, 아니면 머신의 학습 오류인지 판단하기도 어렵습니다. AE 기반 분자 생성 모델에서 AE의 reconstruction조차 100%가 안되는데... 생성할 때 붙는 무언가도 노이즈에 의한 ..

단백질 구조예측과 단백질 구조 기반 약물 탐색

제가 단백질 구조 예측 분야를 연구하던 시절엔 구조 예측에 만에 집중했고, 단백질 하나 하나에 대한 연구를 별로 하지 않았습니다. 그러다보니 단백질 구조 예측을 해도 그것을 어디에 어떻게 사용할지에 대해서 깊히 생각해보지 않았습니다. 신약개발 분야로 넘어오면서 여러 단백질에 대해서 구조를 분석하다보니 여러 재미있는 점들을 알 수 있었습니다. 인간 단백질들 중에서 패밀리 단백질끼리는 서열이 매우 (50% 이상?) 유사합니다. 구조 또한 거의 유사합니다. 약물의 단백질에 대한 결합 여부를 실험해보면 패밀리에 속한 단백질 끼리는 상관성이 매우 높게 나올 것입니다. 슈퍼 패밀리라 할 수 있는 단백질들은 서열 유사성이 20% 정도로 떨어지지만, 전체적인 구조는 유사합니다. 그런데, 슈퍼 패밀리에 속하는 포켓 구조..

AutoDock Vina 및 변종 사용법

(추가) AutoDock Vina에서 사용하는 pdbqt 확장자에 대한 설명은 다음 글을 참고하세요. novelism.tistory.com/32 (추가) GUI를 이용한 도킹이나 실행 예제는 https://novelism.tistory.com/259 https://novelism.tistory.com/260 https://novelism.tistory.com/261 를 참고하세요. protein ligand docking 이란? 도킹 시뮬레이션의 1차적인 목표는 단백질-리간드의 결합 구조의 탐색 입니다. 결합 구조를 바꿔가면서 에너지 (혹은 스코어)를 계산해서 에너지가 최소화 되는 구조를 탐색하는 것입니다. 에너지 모델을 사용하니 결합 에너지 (다른 표현으로 binding free energy, 결합력,..

인공지능 신약개발에 대한 이야기

최근 2~3년 정도 사이에 인공지능 신약개발 관련 연구들이 많이 출판되고, 관련 사업을 하는 회사들도 많이 등장하였습니다. 그러나 그런 연구를 하고 있는 제가 봤을 때 신약개발에 실제로 도움이 될만한 연구, 혹은 써봤는데 잘 된다 좋다. 라고 할만한 메소드는 별로 없었습니다. 저는 이제는 좀 다른 접근방법이 필요하다고 생각합니다. 저는 2013년부터 단백질 관련 컴퓨터 시뮬레이션 연구를 하고 있었는데, 단백질 구조예측 분야에선 이미 2000년대 초반부터 머신러닝을 사용해왔기 때문에 머신러닝에 대해서도 관심을 가지고 있었습니다. 그러다가 알파고가 등장하고 딥러닝이 대중적으로 유명해지면서 저도 머신러닝 관련 연구를 시작하였습니다. 한편으론 단백질 구조예측만으론 가치있는 연구를 하기 어렵다는 생각이 들어서 신..