저는 관심 분야가 좀 넓은 편입니다. 그만큼 깊이와 지식, 해당 분야에 대한 상식이 부족합니다.
몇 년 전부터 그냥 흥미가 있어서 혹은 자신에게 필요해서 한 연구들이 있습니다.
이걸로 논문을 어떻게 써야 하나 영 모르겠습니다.
유사한 연구가 있는지 잘 모르겠고.. 검색해 봐도 뭔가 비슷은 하지만 취지는 많이 다른 것 같고...
전공 분야가 아니다 보니 딱히 제가 아는 사람 중 그 분야에 대해 잘 알고 도와줄 사람도 없습니다.
제가 생각하는 취지가 잘 전달될지 모르겠습니다. 그래도 ChatGPT는 잘 이해하더군요.
그다음에 유사한 연구 찾으라니까 찾아오는 게 다 좀 다른 거 같아서 문제이지...
연구에 대해 자세한 이야기를 하고 싶지만, 아직 공개하기는 어렵네요.
그중 하나는 전사체 발현량 비교를 위한 새로운 정규화 방법인데...
굳이 새로운 정규화 방법이 필요한가 잘 모르겠습니다.
그냥 FPKM이나 TPM이 너무 마음에 안 들어서 만든 방법입니다.
특정 gene의 과발현, 저 발현 등을 샘플 간 비교를 통해서 분석해야 하는데,
TPM은 총 발현량의 수로 정규화를 하여, 총 발현량 대비 특정 유전자의 발현량 비율에 가까운 값이 됩니다.
그런데 세포 안의 총전사체의 수가 중요한지, 그 비율이 중요한지... 무엇을 기준으로 해야 옳은지 잘 모르겠습니다.
비율을 사용할 때 위험한 점은 때때로 소수의 유전자의 발현량이 높을 경우(분모의 절반 정도보다 커질 경우) 다른 gene들이 평범한 수치만큼 발현이 되었지만, 분모가 커지는 바람에 저 발현처럼 수치가 떨어지는 것입니다.
그럼 절대적인 양을 쓴다면 괜찮을까... 만약 세포의 크기가 크고 그에 따라 전사체가 더 많다면?... (그게 생물학적으로 맞는지는 잘 모르겠습니다) 이게 적절한 비교인가...
뭐 동일한 종류의 세포끼리 비교할 때라면 이런 문제는 없을 것 같지만...
제가 아는 게 없어서 의문은 참 많은데 그것들을 어떻게 해야 할지 모르겠습니다.
연구는 모르는 거 하는 것이고 그래서 재미있습니다.
이런 문제에 대한 한 가지 아이디어는 하우스 키핑 유전자들의 발현량을 레퍼런스로 하여 상대 값으로 변환하는 것입니다.
제가 한 연구는 이것은 아니고 비슷하지만 더 확장한 방법입니다만...
아무튼 재미로 한 연구지만 제가 생각하기에 참 신기한 결과가 나왔습니다.
'Physics and Informatics > bioinformatics' 카테고리의 다른 글
bioinformatics: CCLE expression 데이터 gene symbol, entrez id로 찾기 (0) | 2023.12.25 |
---|---|
bioinformatics: gene symbol, entrez id 변환 (0) | 2023.12.25 |
bioinformatics: gene symbol, 유전자 이름에 대해서 (0) | 2023.11.18 |