저는 조금 다양한 분야를 연구한 것 같습니다. 그중에서도 저에게 가장 흥미 있는 분야는 생물정보학이라고 생각합니다. 오늘은 단백질 생물정보학과 머신러닝의 관계에 대해 이야기하겠습니다. 저는 단백질 생물정보학에서 처음 머신러닝을 접하였습니다. 머신러닝에서 중요한 주제 중 하나는 데이터의 분포와 매니폴드입니다. 예를 들어 28*28 픽셀의 그림에서, 오직 흑과 백 두 가지 경우만 존재한다고 생각해 봅시다. 이때, 이 픽셀에 흰점과 검은 점을 조합할 수 있는 총경우의 수는 2^(28*28) 가지입니다. 이 그림 파일의 각 가능한 조합의 경우를 28*28 bit로 표현할 수 있을 것입니다. 그런데, 대부분의 조합들은 아마도 우리가 신호 없는 모니터에서 보는 흑백이 랜덤 하게 뿌려진 노이즈에 해당할 것입니다. 질..