Drug/Computer-Aided Drug Discovery 60

reference 를 이용하여 pdbqt를 pdb 로 변환하기

pdbqt에 대한 설명은 아래 글을 참고 하세요. https://novelism.tistory.com/32 pdbqt를 pdb 로 문제 없이 복원하기 위하선 reference 를 사용하는 것이 제일 좋습니다. reference를 사용하려면 3d conformer pdb 파일을 생성할 때부터 atom name 을 명확시해야 합니다. 다음 코드는 3d conformer를 생성한 후, pdb 파일에서 atom_name 을 수정하는 코드입니다. pdb 파일포멧에서 하나의 ligand 나 residue에 속하는 모든 원자들은 독립된 이름을 배정 받습니다. 예를들면 " CA ", " CB ", " CG " 등이 있습니다. 그래서 이런 atom name을 key로 사용할 수 있습니다. 하지만 obabel로 생성한 구..

알파폴드가 예측한 단백질 구조는 완벽한가?

과거 단백질 구조 예측 연구를, 그리고 지금은 구조기반 약물 탐색 연구를 하고 있는 입장에서 자주 받는 질문 중 하나가 알파폴드가 예측한 단백질 구조는 완벽한가 라는 질문입니다. 그 외에도 단백질 구조 예측이 도움이 되는가? 단백질 구조 예측 연구는 이제 더 이상 할 일이 없는가? 같은 질문들도 있습니다. 알파폴드는 이미 누구나 사용할 수 있도록 공개되어있고, 알파폴드가 예측한 구조도 꾸준히 공개되고 있습니다. 알파폴드의 예측 구조는 일부 경우를 제외하면, 대부분 정확도가 매우 높고, 실험 구조와 큰 차이가 없다고 해도 과언이 아닙니다. 이미 단백질 구조도 다 공개되었으니 그러면 더 이상 구조 예측, 혹은 구조 결정 실험은 필요 없는가?라고 묻는다면 저는 아니라고 대답할 것입니다. 그 근거 중 하나는, ..

chimera GUI에서 docking (vina) 사용법: 3. chimera로 도킹하기

이전 글 https://novelism.tistory.com/259 https://novelism.tistory.com/260 설치는 이전에 했고... 일단 pdb파일에서 receptor와 ligand를 분리해야 합니다. 3HMM.pdb 를 3HMM_receptor.pdb 로 복사합니다. 편집은 메모장이나 워드패드를 사용하면 됩니다. 여기서 HETATM 중 residue id가 855인 행들을 선택해서 잘라냅니다. 이 855는 pdb 에서 사용하는 ligand 의 고유 ID가 됩니다. 잘라내고 남은 빈 줄은 지웁니다. 3HMM_855.pdb 라는 빈 파일을 만들고 잘라 넣은 내용을 붙여 넣습니다. 텍스트 파일을 만들어서 확장자면 pdb로 고치면 됩니다. 이 ligand의 atom index는 2356 부..

chimera GUI에서 docking (vina) 사용법: 2. pdb 파일 구하기

이전 글 https://novelism.tistory.com/259 다음 글 https://novelism.tistory.com/261 원하는 타겟 단백질에 대한 단백질 코드는 Uniprot 에서 확인하실 수 있습니다. 며칠 사이에 홈페이지 GUI가 업데이트 되었네요. 좌측은 예전, 우측은 바뀐 버전입니다. 검색창에서 TGFR1이라고 검색해봅시다. TGFR1_HUMAN에 해당하는 P36898을 클릭합니다. 쭈욱 내리다보면 Structure 가 나옵니다. pdb 코드들은 여기서 얻을 수 있습니다. 저는 주로 이 리스트를 복사해다가 파일에 붙여 넣고 전부 pdb 구조를 다운로드한 후에 pymol 로 구조 정렬 후 살펴봅니다. 다음은 리스트의 pdb 들을 다운받는 코드입니다. dw_pdb.py #!/usr/b..

chimera GUI에서 docking (vina) 사용법: 1. 프로그램 설치

다음 글 https://novelism.tistory.com/260 https://novelism.tistory.com/261 도킹 시뮬레이션에서 GUI를 사용하는 것은 장점도, 단점도 있습니다. 장점은 사용하기 쉽고, docking box 를 확인하기 쉽다는 것이고, 단점은 다양한 옵션을 활용하기 어렵고, 대량의 도킹을 진행하기 어렵다는 것입니다. 저는 스크립트를 통해 자동화를 할 때도 한번 정도는 chimera로 docking box를 확인을 하고 시작합니다. chimera만이 아니라, pymol 도 사용하고 있지만... chimera vina에는 autodock tools (prepare_receptor4.py)이 포함되어있습니다. pdb를 pdbqt로 변환할 때 사용합니다. 일단 윈도우를 기반으로..

conda 로 pymol, openbabel 설치시 주의사항

pymol-open-source=2.5, openbabel=3.1.1 기준입니다. conda를 이용해서 이들을 설치할 때 순서를 잘 선택해야 합니다. conda install -c conda-forge openbabel conda install -c conda-forge pymol-open-source 이 순서로 설치 시... conda 사용 중에 매우 보고 싶지 않은 다음과 같은 것이 출력됩니다. Collecting package metadata (current_repodata.json): done Solving environment: failed with initial frozen solve. Retrying with flexible solve. Solving environment: failed wi..

TGFR1 DUD-E dataset 단백질 구조기반 분자 선별

TGFR1 에 대한 단백질-리간드 결합 구조 분석은 https://novelism.tistory.com/253 단백질-리간드 결합 구조와 스크리닝 예시: TGFR1 inhibitor TGFR1 (Transforming growth factor beta receptor type-1 or TGFBR1)와 저해제들의 co-crystal 구조입니다. TGFR1 는 Tyrosine Kinase Inhibitors의 일종으로, 아래 그림은 ATP가 결합하는 포켓에 결합하는 저해.. novelism.co.kr 를 참고하세요. DUD-E dataset에 있는 TGFR1의 active와 decoy에 대해 단백질 구조 기반으로 분자 선별한 결과입니다. 사용한 pdb id는 3 HMM입니다. 여기서 두가지 옵션을 비교하였습..

smina 용 금속 이온 도킹 옵션

Autodock Vina 변종중 하나인 smina에서 사용하려고 만든 금속이온에 대한 결합력 스코어입니다. smina --custom_scoring custom_scoring.txt 옵션을 추가해주면 됩니다. custom_scoring.txt 파일엔 다음 내용을 넣어줍니다. 일단 weight parameter는 -1.0으로 설정했지만, 도킹이 잘 안될경우 더 증가시키는 방향으로 조절할 수 있습니다. $ cat custom_scoring.txt -0.035579 gauss(o=0,_w=0.5,_c=8) -0.005156 gauss(o=3,_w=2,_c=8) 0.840245 repulsion(o=0,_c=8) -0.035069 hydrophobic(g=0.5,_b=1.5,_c=8) -0.587439 non_..

단백질-리간드 결합 구조와 스크리닝 예시: TGFR1 inhibitor

TGFR1 (Transforming growth factor beta receptor type-1 or TGFBR1)와 저해제들의 co-crystal 구조입니다. TGFR1 는 Tyrosine Kinase Inhibitors의 일종으로, 아래 그림은 ATP가 결합하는 포켓에 결합하는 저해제들입니다. 이렇게 보면 당연히 잘 안보이고, 클러스터들끼리 모아보겠습니다. 여기에 찍힌 구조들의 PDBID,ChainID, Ligand ID, 클러스터 번호는 다음과 같습니다. 1PY5A PY1 1 1RW8A 580 1 1VJYA 460 1 2WOTA ZZG 2 2WOUA ZZF 2 2X7OA ZOP 3 3FAAA 55F 1 3GXLA QIG 4 3HMMA 855 4 3KCFA JZO 1 3TZMA 085 1 4X0MA..

인공지능 신약개발이란 무엇인가?

저는 인공지능 신약개발 업계에서 일하고 있지만, 인공지능 신약개발이란 무엇인가 라는 질문은 참 대답하기 어려운 질문입니다. ( 사실 이 질문을 할 때, 최종적으로 알고 싶은 것은, 그래서 인공지능으로 약을 어떻게 만드냐? 인 경우가 많습니다. 아직까지 이렇게 하면 약을 만들 수 있다. 같은 대답은 하기 어렵습니다. ) 사전적인 의미는 당연히 사전에 있을 것 같지 않으니 없고요. 대략적인 통념은 인공지능으로 신약개발을 하거나, 신약개발에 인공지능을 활용하는 것이지만 의미의 범위가 넓고 모호합니다. 왜냐하면 신약개발 과정에서 얼마나 인공지능을 사용하는지, 어느 단계에 사용하는지가 확실하지 않기 때문입니다. 전 과정 중에서 별로 중요하지 않은 부분에 살짝 사용한다면 그것을 가지고 인공지능으로 신약을 개발한다고..