Physics and Informatics/bioinformatics 5

세포들은 서로 얼마나 다른가?

최근에 개인적으로 하고 있는 연구입니다. (사실 1년 반쯤 전에 했던 일인데, 어떻게 논문으로 정리해야할지 몰라서 계속 방치하고 있었습니다. )우리 몸에는 다양한 기관이 있고 기관은 다양한 조직으로, 그리고 조직은 세포로 구성되어 있습니다. 기관과 조직들은 눈으로만 봐도 상당히 달라보입니다. 근육, 간, 폐, 장, 피부등은 서로 모양도 질감도 구성도 기능도 큰 차이가 있습니다. 물론 이 차이는 세포에서부터 시작합니다. 여기서 각 조직을 구성하는 세포들은 서로 얼마나 다른가 라는 질문을 던져보겠습니다. 그런데 이런 질문을 던지면 결국 다르다 혹은 유사하다 라는 것이 무엇인가부터 시작할 수밖에 없습니다. 이 개념은 개념으로서는 존재하지만, 구체성이 부족하기에 현실적으로 지표화 할 때는 임의로 어떠한 정의..

연구 이야기

저는 관심 분야가 좀 넓은 편입니다. 그만큼 깊이와 지식, 해당 분야에 대한 상식이 부족합니다. 몇 년 전부터 그냥 흥미가 있어서 혹은 자신에게 필요해서 한 연구들이 있습니다. 이걸로 논문을 어떻게 써야 하나 영 모르겠습니다. 유사한 연구가 있는지 잘 모르겠고.. 검색해 봐도 뭔가 비슷은 하지만 취지는 많이 다른 것 같고... 전공 분야가 아니다 보니 딱히 제가 아는 사람 중 그 분야에 대해 잘 알고 도와줄 사람도 없습니다. 제가 생각하는 취지가 잘 전달될지 모르겠습니다. 그래도 ChatGPT는 잘 이해하더군요. 그다음에 유사한 연구 찾으라니까 찾아오는 게 다 좀 다른 거 같아서 문제이지... 연구에 대해 자세한 이야기를 하고 싶지만, 아직 공개하기는 어렵네요. 그중 하나는 전사체 발..

bioinformatics: CCLE expression 데이터 gene symbol, entrez id로 찾기

Cancer Cell Line Encyclopedia (CCLE) 는 천여개의 Cancer Cell line에 대해 copy number, sormatic mutation, expression 등을 수록한 데이터베이스 입니다. 지금은 DepMap (Dependency Map) 과 통합되었고, DepMap portal을 통해서 제공됩니다. DepMap은 Cancer Cell line의 gene knockout/knockdown 에 대한 세포 생장 변화 여부를 수록한 데이터베이스 입니다. 최신 공개 버전은 23Q4 입니다. https://depmap.org/portal/download/all/ 포털에서 데이터를 그래프로 볼 수도 있고 다운로드를 할 수도 있습니다. protein coding genes에 대한..

bioinformatics: gene symbol, entrez id 변환

이전 글 ( https://novelism.tistory.com/381 )에서 언급한 gene symbol과 entrez ID 를 변환하는 코드 예시입니다. DB를 배포할 때, 서로 중복될 여지가 있는 gene symbol 말고도 풀네임이나 ID 를 함께 배포하면 좋겠습니다만, 그렇지 못한 경우가 여럿 있습니다. 일단 저는 정보를 추출할 때 다음 2개의 파일을 사용합니다. 하나는 HGNC이고, 다른것은 NCBI gene info 입니다. HGNC는 당연히 HGNC symbol 이 기준이고, NCBI는 entrez id 가 기준입니다. https://ftp.ebi.ac.uk/pub/databases/genenames/hgnc/tsv/hgnc_complete_set.txt https://ftp.ncbi.nl..

bioinformatics: gene symbol, 유전자 이름에 대해서

보통 bioinformatics라고 하면 주로 DNA, RNA에 대한 연구를 생각합니다. 저는 단백질 구조예측으로 단백질 서열-구조-기능-진화에 대한 연구에서 시작하였습니다. 관련 분야중에는 단백질체학이라는 분야도 있지만, 개개의 단백질에 대해 보는 것이 아니라 단백질체로 분석하기에 차이가 있습니다. 단백질 구조에 대한 연구는 물리화학이나 생물물리학적인 접근방법도 있지만, 저는 bioinfomatics에 가까운 방향으로 연구를 했습니다. 다양한 서열정보를 활용한다는 점에서 그렇습니다. 그동안 단백질 구조와 관련된 약물 탐색 관련 일을 했지만, 원래는 유전체 관련 연구를 하고 싶었습니다. 고등과학원을 그만두면서 유전체 분석 예비 전문가 과정 교육을 받기도 했고, 후에 회사로 갈 때도 유전체에 대한 연구를 ..