Drug 76

conda 로 pymol, openbabel 설치시 주의사항

pymol-open-source=2.5, openbabel=3.1.1 기준입니다. conda를 이용해서 이들을 설치할 때 순서를 잘 선택해야 합니다. conda install -c conda-forge openbabel conda install -c conda-forge pymol-open-source 이 순서로 설치 시... conda 사용 중에 매우 보고 싶지 않은 다음과 같은 것이 출력됩니다. Collecting package metadata (current_repodata.json): done Solving environment: failed with initial frozen solve. Retrying with flexible solve. Solving environment: failed wi..

TGFR1 DUD-E dataset 단백질 구조기반 분자 선별

TGFR1 에 대한 단백질-리간드 결합 구조 분석은 https://novelism.tistory.com/253 단백질-리간드 결합 구조와 스크리닝 예시: TGFR1 inhibitor TGFR1 (Transforming growth factor beta receptor type-1 or TGFBR1)와 저해제들의 co-crystal 구조입니다. TGFR1 는 Tyrosine Kinase Inhibitors의 일종으로, 아래 그림은 ATP가 결합하는 포켓에 결합하는 저해.. novelism.co.kr 를 참고하세요. DUD-E dataset에 있는 TGFR1의 active와 decoy에 대해 단백질 구조 기반으로 분자 선별한 결과입니다. 사용한 pdb id는 3 HMM입니다. 여기서 두가지 옵션을 비교하였습..

smina 용 금속 이온 도킹 옵션

Autodock Vina 변종중 하나인 smina에서 사용하려고 만든 금속이온에 대한 결합력 스코어입니다. smina --custom_scoring custom_scoring.txt 옵션을 추가해주면 됩니다. custom_scoring.txt 파일엔 다음 내용을 넣어줍니다. 일단 weight parameter는 -1.0으로 설정했지만, 도킹이 잘 안될경우 더 증가시키는 방향으로 조절할 수 있습니다. $ cat custom_scoring.txt -0.035579 gauss(o=0,_w=0.5,_c=8) -0.005156 gauss(o=3,_w=2,_c=8) 0.840245 repulsion(o=0,_c=8) -0.035069 hydrophobic(g=0.5,_b=1.5,_c=8) -0.587439 non_..

단백질-리간드 결합 구조와 스크리닝 예시: TGFR1 inhibitor

TGFR1 (Transforming growth factor beta receptor type-1 or TGFBR1)와 저해제들의 co-crystal 구조입니다. TGFR1 는 Tyrosine Kinase Inhibitors의 일종으로, 아래 그림은 ATP가 결합하는 포켓에 결합하는 저해제들입니다. 이렇게 보면 당연히 잘 안보이고, 클러스터들끼리 모아보겠습니다. 여기에 찍힌 구조들의 PDBID,ChainID, Ligand ID, 클러스터 번호는 다음과 같습니다. 1PY5A PY1 1 1RW8A 580 1 1VJYA 460 1 2WOTA ZZG 2 2WOUA ZZF 2 2X7OA ZOP 3 3FAAA 55F 1 3GXLA QIG 4 3HMMA 855 4 3KCFA JZO 1 3TZMA 085 1 4X0MA..

인공지능 신약개발이란 무엇인가?

저는 인공지능 신약개발 업계에서 일하고 있지만, 인공지능 신약개발이란 무엇인가 라는 질문은 참 대답하기 어려운 질문입니다. ( 사실 이 질문을 할 때, 최종적으로 알고 싶은 것은, 그래서 인공지능으로 약을 어떻게 만드냐? 인 경우가 많습니다. 아직까지 이렇게 하면 약을 만들 수 있다. 같은 대답은 하기 어렵습니다. ) 사전적인 의미는 당연히 사전에 있을 것 같지 않으니 없고요. 대략적인 통념은 인공지능으로 신약개발을 하거나, 신약개발에 인공지능을 활용하는 것이지만 의미의 범위가 넓고 모호합니다. 왜냐하면 신약개발 과정에서 얼마나 인공지능을 사용하는지, 어느 단계에 사용하는지가 확실하지 않기 때문입니다. 전 과정 중에서 별로 중요하지 않은 부분에 살짝 사용한다면 그것을 가지고 인공지능으로 신약을 개발한다고..

인공지능 신약개발 여름학교, 겨울학교

저는 고등과학원에 3년 10개월 (박사 후 연구원) + 6개월(학생인턴) 있었습니다. 당시 여름에는 병렬 컴퓨팅 여름학교, 겨울에는 단백질 구조 겨울학교 행사가 있었습니다. 그 외에도 정기적인, 혹은 수시로 학술행사에 많이 참여했지만... 정말 이벤트가 많은 곳이었습니다. 고등과학원 스쿨의 특징은, 수업만 하는 것이 아니라, 참가자가 스쿨 기간 동안 팀을 만들고 프로젝트도 진행한다는 점입니다. 3~5일 정도 기간이다 보니 상당히 힘들었습니다. 아침 9시부터 저녁 10시 넘어서까지 수업과 프로젝트라니.. 게다가 리조트에서 하는 경우는 중간에 2시간 정도 스키도 타고... 프로젝트하다가 조원끼리 싸우고 결별한 조도 있었습니다... (팀원 한 명이 아예 방에 들어가서 문 잠그고 안 나오고... 정작 그 조가 ..

인공지능과 분자의 bio activity, IC 50에 대해서

인공지능 신약개발을 공부할 때 곤란한 점들 중 하나는 생물학, 화학적 수치들에 대해 이해하기 어렵다는 점입니다. 특히나 개별 논문에서 수치가 어떻게 정의되었는지 확인하는 것이 아니라, ChEMBL이나 DB나 DUD-E 같은 데이터셋에서 가져온 경우 이런 수치들을 그대로 인공지능 학습에 사용해도 되는지 의문이 듭니다. 결론부터 말씀드리면, 확인 안 하고 사용하면 안 됩니다. IC 50 같은 경우도 실험마다 다르게 정의될 수 있습니다. 그것이 꼭 셀 실험과 엔자임 실험인지에 따라서만 나눠지는 것은 아닙니다. 엔자임(효소) 중에서도 ATP를 기질로 하는 kinase도 있지만, peptide를 기질로 하는 peptidase 도 있습니다. 그리고 같은 단백질에 대한 IC 50이라 할지라도, ATP의 농도에 따라서..

Marvin JS demo를 사용해서 분자 SMILES, SMARTS 얻기

이전에 SMILES와 SMARTS에 대해 포스팅을 했습니다. 직접 SMILES과 SMARTS를 만드는 건 좀 번거롭고 어렵기에 보통은 분자 그림을 변환 툴을 사용합니다. chemaxon의 marvin을 이용해서 SMILES와 SMARTS를 얻을 수 있습니다. demo 버전에서도 작동합니다. https://marvinjs-demo.chemaxon.com/latest/ Marvin JS marvinjs-demo.chemaxon.com Marvin JS demo를 사용해보겠습니다. 창에다 분자를 그려넣고, export 버튼 (디스켓 모양)을 누릅니다. format에서 SMILES를 선택하면 SMILES를 얻을 수 있고, SMARTS를 선택하면 SMARTS를 얻을 수 있습니다. Kekule form 대신 aro..

유용한 cheminfomatics 툴들

많은 툴들이 있지만, 제가 사용하는 것들 위주로 올립니다. python 모듈: rdkit - python cheminformatics 모듈입니다. openbabal - cheminformatics 프로그램입니다. python module (pybel)로도 사용할 수 있습니다. 분자 그림 그리는 툴: marvin JS: marvin Sketch의 웹버전 정도로 생각할 수 있습니다. https://marvinjs-demo.chemaxon.com/latest/index.html ChemDraw: 비슷한 툴인데, 합성 하시는 분들이 많이 쓴다고 합니다. https://chemdrawdirect.perkinelmer.cloud/js/sample/index.html SMILES 을 붙여넣어서 입력할 수도 있고, 그..

단백질-약물 결합을 분석할 때 중요한 요소

CADD 하는 사람들이 의약화학자에게 도킹 구조를 보여주면서, "이게 약이 될 것 같아요?" 라고 묻는 것은 아마 다들 경험해본적이 있을 것입니다. 의약화학자들이 어떠한 관점에서 이 문제에 대하여 답을 하는지 이해한다면, 좋은 CADD 툴을 만들 수 있을 것입니다. 많은 경우 생물학의 문제들에 대한 적절한 답은, "그때그때 달라요."입니다. 단백질-약물 결합에서도 마찬가지입니다. 주어진 타깃에 대해서 다를 것입니다. 그래도 제가 경험적으로, 그리고 많은 데이터로부터 알게 된 것에 대해 이야기하겠습니다. 저는 단백질-약물 결합에 어떠한 원리가 있는지 의문을 가지고 있습니다. 생물학에서 원리라는 것은 경험적이고, 물리학에서의 원리에 비하면 약한 것이겠지만, 그래도 좀 더 보편적으로 이해할 수 있는 무언가가 ..