분류 전체보기 427

초심으로 돌아가서...: 지난 날을 돌아보며...

대학생이 된 후로 매년 새로 학기가 시작할 때 나 자신이 무엇 때문이 지금 이자리에 있는지 돌아보는 시간을 가졌습니다. 애석하게도 최근 몇년간은 그런 생각조차 하지 못했었네요. 세상 풍파에 휩쓸리다보면, 어느순간 자신이 무엇을 원하고 있었는지 잊어버릴 때가 있습니다. 돌아보면 자신이 원하는 방향과는 다른 방향으로 가버리고 후회하게 됩니다. 후회하지 않기 위해선 자주 자신을 돌아보고 자신이 왜 무엇인가를 갈망했는지 생각해보는것이 좋습니다. 저는 나름 성적은 나쁘지 않다. 라고 자부하는 바보들 중 한명이었습니다. 그리고 대학원에 입학하고 자신이 무능하다는 것을 알게 되었습니다. 성적만 잘받아봐야 연구를 못하면 전혀 의미가 없죠. 그렇게 하위 30%로 떨어지고 자신이 무엇이 문제인지 생각해봤습니다. 그래서 연..

이야기 2021.06.12

protein bioinformatics: 3. 단백질 삼차원 구조 예측 개요

단백질은 아미노산들의 1차원 사슬로 이루어져 있고 (1차 구조), 지역적으로 helix, strand, coil 의 2차 구조를 형성하고 이들이 모여서 고유의 3차원 접힘 구조 (3차 구조)를 이룹니다. 혹은 3차 구조들이 여러개 모여 4차구조를 이루기도 합니다. 단백질 3D 구조 예측은 단백질의 서열로부터 고유의 3차원 접힘 구조를 예측하는 문제입니다. 단백질 구조 예측 문제를 어떻게 풀어야 하는가를 설명하기 위해서 일단 제 전공에 대한 이야기부터 해야겠는데요. 저는 원래 대학교, 대학원에서 물리학을 전공했습니다. 그러다가 졸업 후에 국내에서 단백질 구조 예측 연구를 전문적으로 한다는 연구실로 박사 후 연구원으로 취직을 했습니다. 저는 물리학을 전공한 사람이다보니, 처음엔 단백질도 물리적인 대상이니까 ..

볶음밥

최근에 이런저런 이유로 볶음밥을 여러번 만들었습니다. 만드는 방법은 요즘 유투브에 많이 있는 방식으로 했습니다. 1. 팬을 적당히 가열한 후 기름 두르고, 계란을 깨넣고 소금 뿌리고 대충 휘저어줍니다. 2. 미리 전날 만들어서 식혀서 냉장고에 넣어둔 밥을 넣고 볶습니다. 3. 미리 잘 썰어둔 채소류 및 기타 재료를 넣고 볶습니다. 4. 적당히 간을 합니다. 소금도 좋고, 케이준 양념도 좋고, 간장도 좋고, 굴소스도 좋습니다. 모든건 원하는대로. 마늘은 잘 안익고 매우니까 밥보다 이전에 넣는게 좋습니다. 저는 100% 현미밥을 주로 사용하는데, 꼬들꼬들한게 좋습니다. 당근을 너무 크게 썰어서 잘 안익었네요. 이제 냉장고에 남은 계란이 없어서 계란 볶음밥을 못해먹겠네요.

Food 2021.05.29

protein bioinformatics: 2.1 pdb 파일 포멧, 3d 구조 파싱 주의사항

PDB 는 protein data bank 로, 실험적으로 밝혀진 (혹은 일부 시뮬레이션된) 단백질의 구조를 업로드하고 배포하는 곳입니다. https://www.rcsb.org/ 여기서 많이 사용되는 파일포멧이 pdb 입니다. 이 파일포멧의 단점으로 다른 포멧을 사용하는 사람들도 있긴 하지만... 여전히 제일 많이 사용되는 파일 포멧입니다. pdb 파일을 파싱할 때 가장 중요한 점은 메뉴얼을 읽어야 한다는 점입니다. 메뉴얼은 여기서 찾으실 수 있습니다. https://www.wwpdb.org/documentation/file-format pdb 파일은 각 열마다 고유의 의미가 있습니다. 따라서 pdb 파일을 파싱할 때, 절대로 line.strip() 같은거 쓰면 안됩니다. 이중 단백질 구조를 담고 있는 ..

protein bioinformatics: 1. 단백질 서열 정렬 (NWalign) 및 유사성

서열정렬 (sequence alignment) bioinformatics 생명정보학, 생물정보학, 생정보학... 이 분야가 무엇이라고 한마디로 규정하기 어렵지만, 생물과 관련된 정보를 사용하는 분야이고, 대량의 데이터를 다루기에 컴퓨터를 사용하는 일이 많습니다. 대표적으로는 유전체 분석.. 유전체의 서열과 발현을 다루는 일이 있습니다. 사실 단백질도 유전체로부터 나오기에, 단백질 관련 연구도 중요한 주제입니다. 저는 단백질 구조 및 기능 분야에서 일하고 있고, 당분간 바이오인포메틱스적인 관점에서 단백질을 어떻게 연구하는지, 그리고 어떤 스킬이 필요한지에 대해 이야기하고자 합니다. 서열 정렬을 어떻게 해야하는지, pdb를 어떻게 파싱해야할지 같은 이야기입니다. 예제코드는 제 github에 있습니다. htt..

집단 지성을 이용한 신약 설계 전략

딥마인드가 등장하기 전까지 단백질 구조예측 분야에서 누가 최고냐고 묻는다면, David Baker 라고 답할 수 있었습니다. 단백질 구조 예측 뿐만 아니라, 단백질 디자인 영역에서도 여전히 선도 그룹입니다. David Baker 그룹에서 만든 Foldit 이라는 게임이 있습니다. https://en.wikipedia.org/wiki/Foldit 이것은 사람이 단백질 접힘 문제를 푸는 게임입니다. 단백질은 구조에 따라 에너지 상태가 달라지는데, 자연계에 존재하는 단백질의 구조는, 프리 에너지가 미니멈인 상태일 것이라는 가설이 있습니다. 물론 퍼텐셜 에너지와 프리 에너지에 차이가 있긴 하지만... 단백질 구조를 예측하기 위해선, 정확한 에너지 모델도 필요하지만, 구조 탐색도 매우 공들여서 해야 합니다. 단백..

고향

오랜만에 자주 가던 치킨집에나 가보려고 했는데, 건물 재건축하려는지 치킨집 포함해서가게들이 전부 문을 닫아버렸습니다. 이전한다는 공지도 없는거로 봐서 아예 닫으려는건지... (치킨 + 새우튀김이 있었는데... ) 공부하려고, 돈 벌려고 고향 떠나 여기저기 돌아다닌지도 이제 10년이 넘었네요. 그나마 대학은 학생에겐 제 2의 고향 같은 곳이고, 첫 직장은 고향 근처였지만... 멀리 떠나서 혼자 살면 우울할 때가 많습니다. 전 전 직장 다닐 때는 고향까지 편도 4시간이었습니다. KTX 라도 타면 더 빨랐겠지만 돈이 아까워서 그냥 제일 싼거 탔습니다. 그마저도 살다보면 제2 제3의 고향이 되어가는 것 같습니다. 오늘은 치킨집이 문닫아서 허탕치고, 혼자 갈만한 식당이 있을까 돌아보다 결국 집에 와서 라면 끓여먹..

Food 2021.05.14

pdbqt 파일 설명

pdbqt 는 Autodock 계열 docking 프로그램 (Autodock, Autodock Vina, Quick vina Smina 등) 에서 사용하는 파일 포멧입니다. 기본적으로 pdb와 유사합니다. 아스피린에 대해서 pdb와 pdbqt 파일을 비교해보겠습니다. 아스피린의 SMILES O=C(C)Oc1ccccc1C(=O)O 입니다. obabel로 3d 구조를 생성해봅시다. $ obabel -:'O=C(C)Oc1ccccc1C(=O)O' -O a.pdb --gen3d $ cat a.py COMPND UNNAMED AUTHOR GENERATED BY OPEN BABEL 3.1.0 HETATM 1 O UNL 1 2.800 -1.310 -0.132 1.00 0.00 O HETATM 2 C UNL 1 2.32..

카테고리 없음 2021.05.11

일 못하는 사람들의 특징, 실패하는 프로젝트의 특징

제가 살면서 경험한 이야기들입니다. 주로 대학원, 학계, 연구소, 벤처 스타트업 분야에 대한 이야기라서 그 이외 분야에선 기준이 다를 수도 있습니다. 일부는 제 대학원생 시절 이야기이기도 하지만... 일단 저는 상당히 무능한 대학원생이었고, 석사 졸업하면서 박사 입학할 때 결심이, 석사과정 때처럼은 하지 말자 였고 박사 졸업한 후 포닥 가면서 한 결심은 박사과정 때보단 더 잘해보자였고... 포닥 하던 연구실 나가면서 그때보다 더 잘해보자... 라고 항상 다시 결심합니다. 포닥하는 동안엔 최근 1년동안의 삶이 이전의 삶보다 더 중요한 것을 많이 배운 것 같다. 라고 느꼈습니다. 그만큼 여러번 분야를 바꾸기도 했고요. 분야 바꾸면 한 1~2년은 상당히 많이 배울 수 있습니다. 이젠 나이가 들어서 실패할만한 ..

이야기 2021.05.08