2022/03/26 2

신약개발에 활용되는 인공지능의 해석 가능성

머신러닝 결과를 해석하는 것은 쉬운 일은 아니지만, 불가능하진 않습니다. 기본적으로 머신러닝은 통계분석의 응용이기에 주어진 데이터를 학습하고, 새로운 데이터를 예측할 때, 학습 데이터 중에서 주어진 데이터와 유사한 것이 있다면 그 영향을 크게 받습니다. 하지만 유사성이라는 것은 그리 간단한 것이 아닙니다. 입력 공간상의 거리(distance)와 임베딩 된 공간상에서의 거리는 다릅니다. 적절한 공간 변환을 일으키고, 유사성을 최적화하는 것이 딥러닝의 핵심입니다. 즉, 입력 공간에서 별로 유사해 보이지 않는 데이터가 임베딩 된 공간에선 한 곳에 모을 수 있습니다. 이것이 왜 중요한지 생각해봅시다. 우리는 굳이 딥러닝을 사용하지 않더라도, 분자의 fingerprint를 만들고, Tanimoto 같은 simil..

일을 쉽게 하기 위해 노력합니다.

우리가 본질적으로 생각을 해봅시다. 우리가 무언가를 하는 이유는 원하는 것이 있기 때문입니다. 안될 일을 하는 것은 어떨까요? 해봐야 안되니까 마음만 불편하고 피곤하고 성과는 없습니다. 우리가 해야 할 일은 해야 할 이유가 명확한 일, 해서 원하는 결과를 얻을 가능성이 있는 일, 내가 할 수 있는 일입니다. 이런 일이 아니라면, 해봐야 결국 되는 일은 없고 마음은 괴롭고 피곤하고 시간은 그래도 흐르죠. 제가 대학원생 시절 4년 정도를 무 성과자로 보냈습니다. 그러다가 5년 차쯤에 갑자기 괜찮은 연구주제가 있어서 했더니 좋은 결과가 나오고 시작하고 3개월 정도로 마무리되었습니다. 4년간 했던 일들은 잘 안 풀리고 정작 될만한 일은 3개월이면 되는 것을 경험하고 보니 굳이 안될 일에 시간 쓰는 것보다는 될 ..

이야기 2022.03.26