분류 전체보기 396

protein bioinformatics: 3. 단백질 삼차원 구조 예측 개요

단백질은 아미노산들의 1차원 사슬로 이루어져 있고 (1차 구조), 지역적으로 helix, strand, coil 의 2차 구조를 형성하고 이들이 모여서 고유의 3차원 접힘 구조 (3차 구조)를 이룹니다. 혹은 3차 구조들이 여러개 모여 4차구조를 이루기도 합니다. 단백질 3D 구조 예측은 단백질의 서열로부터 고유의 3차원 접힘 구조를 예측하는 문제입니다. 단백질 구조 예측 문제를 어떻게 풀어야 하는가를 설명하기 위해서 일단 제 전공에 대한 이야기부터 해야겠는데요. 저는 원래 대학교, 대학원에서 물리학을 전공했습니다. 그러다가 졸업 후에 국내에서 단백질 구조 예측 연구를 전문적으로 한다는 연구실로 박사 후 연구원으로 취직을 했습니다. 저는 물리학을 전공한 사람이다보니, 처음엔 단백질도 물리적인 대상이니까 ..

볶음밥

최근에 이런저런 이유로 볶음밥을 여러번 만들었습니다. 만드는 방법은 요즘 유투브에 많이 있는 방식으로 했습니다. 1. 팬을 적당히 가열한 후 기름 두르고, 계란을 깨넣고 소금 뿌리고 대충 휘저어줍니다. 2. 미리 전날 만들어서 식혀서 냉장고에 넣어둔 밥을 넣고 볶습니다. 3. 미리 잘 썰어둔 채소류 및 기타 재료를 넣고 볶습니다. 4. 적당히 간을 합니다. 소금도 좋고, 케이준 양념도 좋고, 간장도 좋고, 굴소스도 좋습니다. 모든건 원하는대로. 마늘은 잘 안익고 매우니까 밥보다 이전에 넣는게 좋습니다. 저는 100% 현미밥을 주로 사용하는데, 꼬들꼬들한게 좋습니다. 당근을 너무 크게 썰어서 잘 안익었네요. 이제 냉장고에 남은 계란이 없어서 계란 볶음밥을 못해먹겠네요.

Food 2021.05.29

protein bioinformatics: 2.1 pdb 파일 포멧, 3d 구조 파싱 주의사항

PDB 는 protein data bank 로, 실험적으로 밝혀진 (혹은 일부 시뮬레이션된) 단백질의 구조를 업로드하고 배포하는 곳입니다. https://www.rcsb.org/ 여기서 많이 사용되는 파일포멧이 pdb 입니다. 이 파일포멧의 단점으로 다른 포멧을 사용하는 사람들도 있긴 하지만... 여전히 제일 많이 사용되는 파일 포멧입니다. pdb 파일을 파싱할 때 가장 중요한 점은 메뉴얼을 읽어야 한다는 점입니다. 메뉴얼은 여기서 찾으실 수 있습니다. https://www.wwpdb.org/documentation/file-format pdb 파일은 각 열마다 고유의 의미가 있습니다. 따라서 pdb 파일을 파싱할 때, 절대로 line.strip() 같은거 쓰면 안됩니다. 이중 단백질 구조를 담고 있는 ..

protein bioinformatics: 1. 단백질 서열 정렬 (NWalign) 및 유사성

서열정렬 (sequence alignment) bioinformatics 생명정보학, 생물정보학, 생정보학... 이 분야가 무엇이라고 한마디로 규정하기 어렵지만, 생물과 관련된 정보를 사용하는 분야이고, 대량의 데이터를 다루기에 컴퓨터를 사용하는 일이 많습니다. 대표적으로는 유전체 분석.. 유전체의 서열과 발현을 다루는 일이 있습니다. 사실 단백질도 유전체로부터 나오기에, 단백질 관련 연구도 중요한 주제입니다. 저는 단백질 구조 및 기능 분야에서 일하고 있고, 당분간 바이오인포메틱스적인 관점에서 단백질을 어떻게 연구하는지, 그리고 어떤 스킬이 필요한지에 대해 이야기하고자 합니다. 서열 정렬을 어떻게 해야하는지, pdb를 어떻게 파싱해야할지 같은 이야기입니다. 예제코드는 제 github에 있습니다. htt..

집단 지성을 이용한 신약 설계 전략

딥마인드가 등장하기 전까지 단백질 구조예측 분야에서 누가 최고냐고 묻는다면, David Baker 라고 답할 수 있었습니다. 단백질 구조 예측 뿐만 아니라, 단백질 디자인 영역에서도 여전히 선도 그룹입니다. David Baker 그룹에서 만든 Foldit 이라는 게임이 있습니다. https://en.wikipedia.org/wiki/Foldit 이것은 사람이 단백질 접힘 문제를 푸는 게임입니다. 단백질은 구조에 따라 에너지 상태가 달라지는데, 자연계에 존재하는 단백질의 구조는, 프리 에너지가 미니멈인 상태일 것이라는 가설이 있습니다. 물론 퍼텐셜 에너지와 프리 에너지에 차이가 있긴 하지만... 단백질 구조를 예측하기 위해선, 정확한 에너지 모델도 필요하지만, 구조 탐색도 매우 공들여서 해야 합니다. 단백..

고향

오랜만에 자주 가던 치킨집에나 가보려고 했는데, 건물 재건축하려는지 치킨집 포함해서가게들이 전부 문을 닫아버렸습니다. 이전한다는 공지도 없는거로 봐서 아예 닫으려는건지... (치킨 + 새우튀김이 있었는데... ) 공부하려고, 돈 벌려고 고향 떠나 여기저기 돌아다닌지도 이제 10년이 넘었네요. 그나마 대학은 학생에겐 제 2의 고향 같은 곳이고, 첫 직장은 고향 근처였지만... 멀리 떠나서 혼자 살면 우울할 때가 많습니다. 전 전 직장 다닐 때는 고향까지 편도 4시간이었습니다. KTX 라도 타면 더 빨랐겠지만 돈이 아까워서 그냥 제일 싼거 탔습니다. 그마저도 살다보면 제2 제3의 고향이 되어가는 것 같습니다. 오늘은 치킨집이 문닫아서 허탕치고, 혼자 갈만한 식당이 있을까 돌아보다 결국 집에 와서 라면 끓여먹..

Food 2021.05.14

pdbqt 파일 설명

pdbqt 는 Autodock 계열 docking 프로그램 (Autodock, Autodock Vina, Quick vina Smina 등) 에서 사용하는 파일 포멧입니다. 기본적으로 pdb와 유사합니다. 아스피린에 대해서 pdb와 pdbqt 파일을 비교해보겠습니다. 아스피린의 SMILES O=C(C)Oc1ccccc1C(=O)O 입니다. obabel로 3d 구조를 생성해봅시다. $ obabel -:'O=C(C)Oc1ccccc1C(=O)O' -O a.pdb --gen3d $ cat a.py COMPND UNNAMED AUTHOR GENERATED BY OPEN BABEL 3.1.0 HETATM 1 O UNL 1 2.800 -1.310 -0.132 1.00 0.00 O HETATM 2 C UNL 1 2.32..

카테고리 없음 2021.05.11

일 못하는 사람들의 특징, 실패하는 프로젝트의 특징

제가 살면서 경험한 이야기들입니다. 주로 대학원, 학계, 연구소, 벤처 스타트업 분야에 대한 이야기라서 그 이외 분야에선 기준이 다를 수도 있습니다. 일부는 제 대학원생 시절 이야기이기도 하지만... 일단 저는 상당히 무능한 대학원생이었고, 석사 졸업하면서 박사 입학할 때 결심이, 석사과정 때처럼은 하지 말자 였고 박사 졸업한 후 포닥 가면서 한 결심은 박사과정 때보단 더 잘해보자였고... 포닥 하던 연구실 나가면서 그때보다 더 잘해보자... 라고 항상 다시 결심합니다. 포닥하는 동안엔 최근 1년동안의 삶이 이전의 삶보다 더 중요한 것을 많이 배운 것 같다. 라고 느꼈습니다. 그만큼 여러번 분야를 바꾸기도 했고요. 분야 바꾸면 한 1~2년은 상당히 많이 배울 수 있습니다. 이젠 나이가 들어서 실패할만한 ..

이야기 2021.05.08

인간의 본성과 통치 철학

고등학생 시절부터 인간의 본성에 대한 탐구에 흥미가 많았습니다. 굳이 말하면 저는 성선설의 신봉자에 속합니다. 이유는 그냥 성악설이 마음에 안들었기 때문입니다. 그런데, 성선설과 성악설은 사실은 인간의 본성에 대한 탐구가 목적이 아닙니다. 인간의 선인가 악인가를 분석하고 밝혀내는 것이 목적이 아니라, 선과 악은 하나의 가정일 뿐이고, 그 이후가 중요합니다. 동양철학에선 성선설과 성악설이 각각 유가와 법가 사상으로 연결됩니다. 인간의 본성이 선이냐 악이냐가 중요한 것이 아니라, 인간의 본성을 존중하고 덕으로 다스릴지, 아니면 법으로 통제해야할지가 사실은 인간의 본성에 대한 논의의 본질이라 생각합니다. 제가 막연히 성악설을 싫어할 수밖에 없었던 이유도 이와 같습니다. 당연히 그때는 고등학생이었고, 제가 학생..

이야기 2021.05.07