분류 전체보기 439

Enrichment Factor

Enrichment factor (EF)는 약물 가상 탐색에서 성능 평가를 할 때 사용하기 적절한 지표입니다. 약물의 유효성을 예측하여 스코어를 주는 메서드가 있을 때, Enrichment Factor는 다음과 같습니다. $$EF=\frac{\text{precision}}{\text{active rate}}$$ 이때, \(\text{precision}=\frac{\text{True Positive}}{\text{Positive}}\), \(\text{active rate}=\frac{\text{Active}}{\text{Total Number}}\) 입니다. 즉, Enrichment factor는 전체 분자 중에서 active의 비율에 비해서 선별된 분자들 중에서 active의 비율이 얼마나 증가하는가를..

막회

포항에서 유명한 음식으로 막회가 있습니다. 특별히 정해진 어종은 아니고, 가리지 않고 대충 썰어서 주는 것입니다. 특징으로 가격이 무척 저렴합니다. 인터넷에서 택배로 보내주는 업체를 찾아서 주문했습니다. 회 1kg, 채소, 초장 한통에 배송비까지 해서 3만 원 정도였습니다. 접시에 담아봤는데 양이 엄청납니다. 금방은 다 못 먹겠고 다시마 숙성을 시켜볼까 해서 통에 다시마와 함께 넣었습니다. 회덮밥을 만들었습니다.

Food 2022.03.11

오븐으로 텍사스 브리스킷 만들기

호주산 브리스킷(차돌양지) 3.5kg입니다. 가격은 45000원 정도 했습니다. 저번에는 미국산으로 했는데, 호주산이 좀 더 질겨서 더 오래 익혀야 하는 것 같습니다. 아침 8시에서 저녁 8시까지 총 12시간 동안 요리했습니다. 그래도 약간 질긴 느낌이 남아있었습니다. 저는 고기가 완전히 으스러지고 녹아내리는 것을 좋아합니다. 고기는 아름답습니다. 냉동이니까 하루정도 해동시켜줍니다. 고기가 너무 커서 오븐에 안 들어가서 조금 잘랐습니다. 브리스킷 럽을 발라줍니다. 로켓 직구로 구매했습니다. 재료는 설탕, 파프리카 가루, 고춧가루인 것 같고, 살짝 라면수프 같은 맛이 나고, 염분도 많이 들어있어서 소금을 추가로 넣어주지 않아도 됩니다. 처음 샀을 때는 브리스킷 럽 맞는지 의문이었는데, 완성된 것을 먹어보니..

Food 2022.03.07

생포도주스 만들기

캔디 드림이라는 품종으로 구매했습니다. 칠레산이고 씨 없는 포도입니다. 당도는 22 브릭스입니다. 4kg 25000원입니다. 1L 병 2개가 나왔습니다. 씨 있는 포도는 믹서기로 씨째로 갈면 안 됩니다. 포도씨를 갈면 아린 맛이 나서 마시기 힘듭니다. 포도를 세척하고 물기를 제거합니다. 물기가 적당히 제거되면 통에 담고 믹서로 갈아줍니다. 손으로 으깨려 했더니 조금 단단해서 힘들더군요. 통을 봉해서 서늘한 곳에 두면 과육이 녹아내립니다. 2~3일 정도 두면 과육이 충분히 녹아내립니다. 채로 걸러서 건더기를 제거하고 주스만 따로 모아줍니다. 갈고 바로 마셔도 되긴 하지만, 숙성과정을 거치면 맛이 더 부드러워집니다. 숙성을 안 하면 풋내 같은 것이 납니다. 22 브릭스 포도는 엄청나게 답니다. 작년엔 위니아..

Food 2022.03.07

머신러닝 기반 분자 활성 예측 정확도가 낮은 이유

딥러닝으로 분자의 다양한 특성을 예측하는 연구는 최근 수년 사이에 인기 있는 주제 중 하나입니다. 여러 특성들 중에서도 신약개발에서 가장 중요한 task는 분자의 bioactivity (단백질에 대한 결합, 혹은 효능)을 예측하는 것일 것입니다. 하지만, 다른 특성 예측과 비교하면 bioactivity 예측은 정확도가 낮습니다. 저는 그 이유가 단지 머신의 아키텍처나 학습 방식의 문제가 아니라고 생각합니다. 좀 더 근본적으로 데이터 자체가 가지는 문제를 생각해볼 수 있습니다. 호 머신러닝은 말 그대로 데이터로부터의 학습이고, 통계 이론의 적용을 받습니다. 통계에서 하는 일은, 표본 데이터로부터, 모집단의 확률분포를 유추하는 것이고, 머신러닝도 크게 다르지 않습니다. 그런데, 학습에 사용하는 데이터가 추정..

VHTS와 병렬 컴퓨팅: 2. python multiprocessing 을 이용한 분자 처리

VHTS와 병렬 컴퓨팅: 1. 기초 개념, file split 에 이어 python multiprocessing을 이용한 분자 특성 계산방법을 설명하겠습니다. python에서 병렬 컴퓨팅을 지원하는 모듈은 여러 가지가 있습니다. 저는 multiprocessing을 선호합니다. concurrent.futures 도 사용해보긴 했는데, 구현 자체는 쉽지만 core수가 많아지면 병렬화 효율성이 크게 떨어집니다. 작업환경은 EPIC 64 cores*2 cpus입니다. 분자 데이터 처리, 혹은 특성 계산은 많음은 수의 독립적인 데이터에 대해서 동일한 함수로 처리할 경우에 해당됩니다. 이런 경우에 적합한 병렬구조는 master/workers로 이루어진 구조입니다. master가 잡을 관리 하면서 worker에게 잡..

Computer 2022.02.27

VHTS와 병렬 컴퓨팅: 1. 기초 개념, file split

저는 컴퓨터 전공자는 아니라 체계적으로 개념을 배운 것은 아니고, 연구에 필요해서 실용적으로 배우다 보니 용어에 오개념이 있을 수도 있음을 양해해주시기를 부탁드립니다. 작업 환경은 linux입니다. 신약개발에서 가상탐색 virture high throuput screening (VHTS)이 사용된 것은 아마도 CADD의 역사와 비슷할 것이지만, 최근에는 ultra large scale이라 불릴 정도의 규모... 수천만, 수억, 수십억 이상의 분자를 가상 탐색하는 것이 트렌드입니다. 여기에 필요한 기술 중 하나가 병렬 컴퓨팅입니다. 병렬 컴퓨팅의 필요성은 다음과 같습니다. 기본적으로 하나의 프로세스는(소프트웨어) 하나의 프로세서를(하드웨어) 사용합니다. 하지만 하나의 프로세서로 낼 수 있는 성능에는 한계가..

Computer 2022.02.27

리더에게 제일 필요한것

왜인지 모르겠지만, 리더에 대해 이야기할 때 삼국지가 생각났습니다. 전통적인 관념에서 인기 있는 군주인 유비는 대체 무엇을 가지고 있었을까요? 유비 세력에 유능한 사람이 많지만, 왜 유비가 군주인 것일까요? 단지 한 황실 종친이라는 이유로? 명확한 증거가 있는 것도 아니고, 당시에 황실 종친은 상당히 많은 상황인데 그리 유력자도 아닌 유비가...? 능력치 사기 캐릭터 조조 때문인지, 유비가 그렇게까지 유능한 군주로 보이진 않습니다. 도원결의 이후로 적벽대전 이전까지 제대로 기반을 닦지 못하고 끊임없이 떠돌기만 했습니다. 전투력으로는 당시 최강이라 할 의형제들과 불리할 때마다 이세력, 저 세력에 붙을 수 있을 만큼의 외교적 교섭력을 가진 부하들이 있었지만 말이죠. 유비가 가는 세력마다 망해버린다는 게 문제..

이야기 2022.02.16