Drug 74

컴퓨터, 인공지능 활용 신약개발 스터디 모임 커뮤니티

제가 생각하기에 올바른 협업은 서로를 존중하고 서로를 배우려는 자세에서 시작합니다. 저는 현 단계에서 컴퓨터와 인공지능이 가야할 길은, 지금까지 사람들이 신약을 어떻게 개발해왔는지를 배우고, 그 방법론을 컴퓨터로 구현하고 자동화하여 더 많은 검토를 가능하게 하거나, 인간 전문가가 분석에 필요한 도움을 주어 업무 효율성을 높히는 것이라 생각합니다. 인공지능 신약개발 분야는 현재 어려운 상황입니다. 인공지능 신약개발이 도입된지도 5년 정도 되어 가지만, 여전히 누구라도 인정할만한 성공 사례는 없고, 투자 위축으로 많은 회사들이 어려움을 겪고 있습니다. 이미 사업을 철수한 회사나, 무급 휴직중인 회사도 있다고 합니다. 인공지능 신약개발은 사기가 아니냐? 라는 말까지도 나오고 있다고 합니다. 종사자로서 대답하기..

인공지능 신약개발과 데이터의 문제

최근 10년 사이에 인공지능에서 가장 인기 있는 분야는 딥러닝입니다. 이것은 인공지능 신약개발 분야에서도 마찬가지입니다. 인공지능 신약개발은 최근 5년 사이에 상당히 급성장을 이루고 있습니다. 국내에만 해도 40여 곳 이상의 회사가 설립되었고, 이들 중에는 시리즈 A에서 100억, B에서 200억 정도 규모로 투자받는 회사들도 있습니다. 누적 투자금액은 수천억 원 단위로 추정합니다. 딥러닝에 대한 인기와(그중 하나는 알파폴드이죠.)과 코로나로 인한 신약개발에 대한 관심이 이 분야의 성장을 이끌었다고 생각합니다. 인력에 대한 수요가 높다 보니 평균 연봉도 인공지능 신약개발이 도입되기 이전의 신약개발 연구자의 평균에 비해서 많이 높아지고 있습니다. 굳이 인공지능 신약개발 연구자가 아니더라도, AI회사에서 제..

인공지능 신약개발 온라인 교육 플랫폼 LAIDD 2.0 open

https://www.laidd.org/ LAIDD(Lectures on AI-driven Drug Discovery) [팜코랩] 현장 강의와 실습을 통한 AI 신약개발 집중교육 [한국생명정보학회] 현장 강의와 실습을 통한 AI 신약개발 집중 교육 코스 www.laidd.org 한국 제약바이오협회 인공지능신약개발지원센터에서 작년부터 운영하던 인공지능 신약개발 온라인 교육 플랫폼 laidd 가 9.1일부터 2.0 서비스를 시작하였습니다. 기존 laidd에 비해 다양한 기능과 많은 강의들이 추가되었습니다. 강의 영상 중간 넘기기도 가능합니다. 어쩌다 보니 저도 강의 영상을 찍었습니다. (강의 어렵네요...) 현재 모든 교육이 무료로 제공되니 부담 없이 수강하세요.

reference 를 이용하여 pdbqt를 pdb 로 변환하기

pdbqt에 대한 설명은 아래 글을 참고 하세요. https://novelism.tistory.com/32 pdbqt를 pdb 로 문제 없이 복원하기 위하선 reference 를 사용하는 것이 제일 좋습니다. reference를 사용하려면 3d conformer pdb 파일을 생성할 때부터 atom name 을 명확시해야 합니다. 다음 코드는 3d conformer를 생성한 후, pdb 파일에서 atom_name 을 수정하는 코드입니다. pdb 파일포멧에서 하나의 ligand 나 residue에 속하는 모든 원자들은 독립된 이름을 배정 받습니다. 예를들면 " CA ", " CB ", " CG " 등이 있습니다. 그래서 이런 atom name을 key로 사용할 수 있습니다. 하지만 obabel로 생성한 구..

알파폴드가 예측한 단백질 구조는 완벽한가?

과거 단백질 구조 예측 연구를, 그리고 지금은 구조기반 약물 탐색 연구를 하고 있는 입장에서 자주 받는 질문 중 하나가 알파폴드가 예측한 단백질 구조는 완벽한가 라는 질문입니다. 그 외에도 단백질 구조 예측이 도움이 되는가? 단백질 구조 예측 연구는 이제 더 이상 할 일이 없는가? 같은 질문들도 있습니다. 알파폴드는 이미 누구나 사용할 수 있도록 공개되어있고, 알파폴드가 예측한 구조도 꾸준히 공개되고 있습니다. 알파폴드의 예측 구조는 일부 경우를 제외하면, 대부분 정확도가 매우 높고, 실험 구조와 큰 차이가 없다고 해도 과언이 아닙니다. 이미 단백질 구조도 다 공개되었으니 그러면 더 이상 구조 예측, 혹은 구조 결정 실험은 필요 없는가?라고 묻는다면 저는 아니라고 대답할 것입니다. 그 근거 중 하나는, ..

chimera GUI에서 docking (vina) 사용법: 3. chimera로 도킹하기

이전 글 https://novelism.tistory.com/259 https://novelism.tistory.com/260 설치는 이전에 했고... 일단 pdb파일에서 receptor와 ligand를 분리해야 합니다. 3HMM.pdb 를 3HMM_receptor.pdb 로 복사합니다. 편집은 메모장이나 워드패드를 사용하면 됩니다. 여기서 HETATM 중 residue id가 855인 행들을 선택해서 잘라냅니다. 이 855는 pdb 에서 사용하는 ligand 의 고유 ID가 됩니다. 잘라내고 남은 빈 줄은 지웁니다. 3HMM_855.pdb 라는 빈 파일을 만들고 잘라 넣은 내용을 붙여 넣습니다. 텍스트 파일을 만들어서 확장자면 pdb로 고치면 됩니다. 이 ligand의 atom index는 2356 부..

chimera GUI에서 docking (vina) 사용법: 2. pdb 파일 구하기

이전 글 https://novelism.tistory.com/259 다음 글 https://novelism.tistory.com/261 원하는 타겟 단백질에 대한 단백질 코드는 Uniprot 에서 확인하실 수 있습니다. 며칠 사이에 홈페이지 GUI가 업데이트 되었네요. 좌측은 예전, 우측은 바뀐 버전입니다. 검색창에서 TGFR1이라고 검색해봅시다. TGFR1_HUMAN에 해당하는 P36898을 클릭합니다. 쭈욱 내리다보면 Structure 가 나옵니다. pdb 코드들은 여기서 얻을 수 있습니다. 저는 주로 이 리스트를 복사해다가 파일에 붙여 넣고 전부 pdb 구조를 다운로드한 후에 pymol 로 구조 정렬 후 살펴봅니다. 다음은 리스트의 pdb 들을 다운받는 코드입니다. dw_pdb.py #!/usr/b..

chimera GUI에서 docking (vina) 사용법: 1. 프로그램 설치

다음 글 https://novelism.tistory.com/260 https://novelism.tistory.com/261 도킹 시뮬레이션에서 GUI를 사용하는 것은 장점도, 단점도 있습니다. 장점은 사용하기 쉽고, docking box 를 확인하기 쉽다는 것이고, 단점은 다양한 옵션을 활용하기 어렵고, 대량의 도킹을 진행하기 어렵다는 것입니다. 저는 스크립트를 통해 자동화를 할 때도 한번 정도는 chimera로 docking box를 확인을 하고 시작합니다. chimera만이 아니라, pymol 도 사용하고 있지만... chimera vina에는 autodock tools (prepare_receptor4.py)이 포함되어있습니다. pdb를 pdbqt로 변환할 때 사용합니다. 일단 윈도우를 기반으로..

conda 로 pymol, openbabel 설치시 주의사항

pymol-open-source=2.5, openbabel=3.1.1 기준입니다. conda를 이용해서 이들을 설치할 때 순서를 잘 선택해야 합니다. conda install -c conda-forge openbabel conda install -c conda-forge pymol-open-source 이 순서로 설치 시... conda 사용 중에 매우 보고 싶지 않은 다음과 같은 것이 출력됩니다. Collecting package metadata (current_repodata.json): done Solving environment: failed with initial frozen solve. Retrying with flexible solve. Solving environment: failed wi..

TGFR1 DUD-E dataset 단백질 구조기반 분자 선별

TGFR1 에 대한 단백질-리간드 결합 구조 분석은 https://novelism.tistory.com/253 단백질-리간드 결합 구조와 스크리닝 예시: TGFR1 inhibitor TGFR1 (Transforming growth factor beta receptor type-1 or TGFBR1)와 저해제들의 co-crystal 구조입니다. TGFR1 는 Tyrosine Kinase Inhibitors의 일종으로, 아래 그림은 ATP가 결합하는 포켓에 결합하는 저해.. novelism.co.kr 를 참고하세요. DUD-E dataset에 있는 TGFR1의 active와 decoy에 대해 단백질 구조 기반으로 분자 선별한 결과입니다. 사용한 pdb id는 3 HMM입니다. 여기서 두가지 옵션을 비교하였습..