분류 전체보기 396

VHTS와 병렬 컴퓨팅: 3. job list 파일 공유를 이용한 병렬처리

멀티 코어가 보급되기 이전에 등장한 병렬 컴퓨팅은 기본적으로 여러 컴퓨터를 사용하는 방식이었습니다. 그중 가장 대표적인 것이 MPI (massage passing interface)입니다. 여러 프로세스 사이에서, massage를 주고받는 인터페이스입니다. 이는 서로 다른 컴퓨터에서 실행 중인 프로세스에서도 성립합니다. massage라고 표현했지만, 거대 데이터가 될 수도 있습니다. mpi를 실행할 때는 mpirun 같은 명령어를 사용하고, 실행 시에 MPI common world로 노드들이 묶여서 프로세서가 실행됩니다. 실행 이후에 common world를 변화시킬 수 없습니다. 특정 node에서 에러가 발생 시, 전부 종료하고 다시 시작해야 합니다. mpi 같은 메모리 상의 massage를 공유하는 ..

Computer 2022.03.28

신약개발에 활용되는 인공지능의 해석 가능성

머신러닝 결과를 해석하는 것은 쉬운 일은 아니지만, 불가능하진 않습니다. 기본적으로 머신러닝은 통계분석의 응용이기에 주어진 데이터를 학습하고, 새로운 데이터를 예측할 때, 학습 데이터 중에서 주어진 데이터와 유사한 것이 있다면 그 영향을 크게 받습니다. 하지만 유사성이라는 것은 그리 간단한 것이 아닙니다. 입력 공간상의 거리(distance)와 임베딩 된 공간상에서의 거리는 다릅니다. 적절한 공간 변환을 일으키고, 유사성을 최적화하는 것이 딥러닝의 핵심입니다. 즉, 입력 공간에서 별로 유사해 보이지 않는 데이터가 임베딩 된 공간에선 한 곳에 모을 수 있습니다. 이것이 왜 중요한지 생각해봅시다. 우리는 굳이 딥러닝을 사용하지 않더라도, 분자의 fingerprint를 만들고, Tanimoto 같은 simil..

일을 쉽게 하기 위해 노력합니다.

우리가 본질적으로 생각을 해봅시다. 우리가 무언가를 하는 이유는 원하는 것이 있기 때문입니다. 안될 일을 하는 것은 어떨까요? 해봐야 안되니까 마음만 불편하고 피곤하고 성과는 없습니다. 우리가 해야 할 일은 해야 할 이유가 명확한 일, 해서 원하는 결과를 얻을 가능성이 있는 일, 내가 할 수 있는 일입니다. 이런 일이 아니라면, 해봐야 결국 되는 일은 없고 마음은 괴롭고 피곤하고 시간은 그래도 흐르죠. 제가 대학원생 시절 4년 정도를 무 성과자로 보냈습니다. 그러다가 5년 차쯤에 갑자기 괜찮은 연구주제가 있어서 했더니 좋은 결과가 나오고 시작하고 3개월 정도로 마무리되었습니다. 4년간 했던 일들은 잘 안 풀리고 정작 될만한 일은 3개월이면 되는 것을 경험하고 보니 굳이 안될 일에 시간 쓰는 것보다는 될 ..

이야기 2022.03.26

삼겹살 풀드포크 만들기

이번에는 삼겹살로 풀드포크를 만들었습니다. 아직 안 먹어서 맛은 모릅니다. 4kg짜리 삼겹살을 사서 반은 동파육, 반은 풀드포크를 만들었습니다. 뭐 늘 하던 대로... 고기에 시즈닝을 바르고(브리스킷 시즈닝) 오븐 100~110도에서 2시간 구워줍니다. 2시간 후에 꺼내서 종이 포일에 싸서 2차로 120~150도에서 4시간 정도 구워줍니다. 지방에 열을 가해서 녹여야 하니 껍질이 있는 부위를 위로 향하게 합니다. 목표 심부온도는 90도 이상입니다. 심부 온도계를 꽂을 때, 저항 없이 쑥 들어가면 잘 익은 것입니다. 1시간 정도 레스팅 합니다. 내일 직장에 가져갈 도시락을 만들었습니다. 동파육, 청경채, 풀드 포크, 새우 볶음밥입니다. 이게 요리한 것의 절반 정도 됩니다. 볶음밥에 동파육 간장을 넣었습니다..

Food 2022.03.20

동파육 만들기

정통 동파육 레시피를 따르고 있지 않아서 이게 동파육이라 해야 할지 차슈라 해야 할지 모호하지만 맛있는 요리입니다. 동파육과 풀드포크를 만들려고 돼지 삼겹살 4kg를 샀습니다. 박피를 안 한 미박 삼겹살이니 오겹살이라 불러야 할까요? 잘라서 반은 풀드 포크, 나머지 반은 동파육을 만들 것입니다. 일단 채소와 향신료를 먼저 끓여줍니다. 채소는 양파, 무, 파, 마늘, 말린 표고버섯, 다시마입니다. (한국인에게 마늘은 향신료가 아닙니다.) 양파에서 단맛이 나오도록 한 시간 이상 끓였습니다. 향신료는 그냥 집에 있는 거 대충... 팔각(저는 팔각향 안 좋아하지만.. 없으면 섭섭하니 1개만... 이거 향 엄청 강합니다. 그래도 완성될 때쯤엔 약해집니다.), 피클링 스파이스 (정향, 코리엔더, 겨자, 계핏가루 약..

Food 2022.03.20

인공지능 신약개발에서 데이터 생산의 중요성

기계학습은 당연히 데이터가 있어야 할 수 있습니다. 공공 데이터는 적은 것은 아니지만, 여러 문제가 있습니다. 원하는 타겟에 대한 데이터는 많지 않고, ChEMBL처럼 active위주로 수집이 되어있거나, 저는 학계에서 인공지능 신약개발 연구를 하다가, 공공데이터에만 의존하고 자체적인 데이터가 없이는 어렵다는 생각이 들어서 인공지능 신약개발 회사로 이직했습니다. 회사는 돈 벌기 위해서 연구하는 곳이니까, 아무래도 돈을 들여서 데이터를 많이 만들 줄 알았죠. 회사에서 돈 들여서 데이터를 만들거나, 파트너로부터 데이터를 얻어서, 그 데이터를 학습하고 분자를 선별하고 그것을 다시 학습에 활용하고, 이 과정을 반복해나가면서 신약개발을 할 거라 생각했지만, 전혀 그런 것 하지 않더군요. 그냥 공공데이터 가지고 학..

민어전

민어 철은 아니지만, 인터넷에서 민어를 싸게 파는 곳이 있어서 5kg짜리 주문했습니다. 아는 분이 대신 주문해주셨는데, 1kg에 14000원, 손질, 택배비 1만 원이라고 하네요. 일부는 회로 먹고, 민어 머리는 오래 끓였더니 곰탕처럼 국물이 뽀얗게 나오는데 맛있었습니다. 사실 저는 회를 별로 안 좋아합니다... 안 좋아하는데 왜 사 먹는 걸까요...? 남은 민어로 전을 만들었습니다. 필렛을 떠서 보내주니까 전 만들기도 쉽습니다. 5mm 정도로 좀 두껍게 썰었습니다. 부침가루를 묻히고, 계란을 입혀서 부쳐줍니다. 스텐 팬이지만 예열만 잘하면 안 달라붙습니다. 다 익은 것은 종이에 올려서 기름을 제거합니다. 계란이 애매하게 남아서 호박전도 만들었습니다. 내일 직장에 가져가려고 도시락통에 담았습니다. 맛있습..

Food 2022.03.13

Enrichment Factor

Enrichment factor (EF)는 약물 가상 탐색에서 성능 평가를 할 때 사용하기 적절한 지표입니다. 약물의 유효성을 예측하여 스코어를 주는 메서드가 있을 때, Enrichment Factor는 다음과 같습니다. $$EF=\frac{\text{precision}}{\text{active rate}}$$ 이때, \(\text{precision}=\frac{\text{True Positive}}{\text{Positive}}\), \(\text{active rate}=\frac{\text{Active}}{\text{Total Number}}\) 입니다. 즉, Enrichment factor는 전체 분자 중에서 active의 비율에 비해서 선별된 분자들 중에서 active의 비율이 얼마나 증가하는가를..

막회

포항에서 유명한 음식으로 막회가 있습니다. 특별히 정해진 어종은 아니고, 가리지 않고 대충 썰어서 주는 것입니다. 특징으로 가격이 무척 저렴합니다. 인터넷에서 택배로 보내주는 업체를 찾아서 주문했습니다. 회 1kg, 채소, 초장 한통에 배송비까지 해서 3만 원 정도였습니다. 접시에 담아봤는데 양이 엄청납니다. 금방은 다 못 먹겠고 다시마 숙성을 시켜볼까 해서 통에 다시마와 함께 넣었습니다. 회덮밥을 만들었습니다.

Food 2022.03.11