최근 10년 사이에 인공지능에서 가장 인기 있는 분야는 딥러닝입니다.
이것은 인공지능 신약개발 분야에서도 마찬가지입니다.
인공지능 신약개발은 최근 5년 사이에 상당히 급성장을 이루고 있습니다. 국내에만 해도 40여 곳 이상의 회사가 설립되었고, 이들 중에는 시리즈 A에서 100억, B에서 200억 정도 규모로 투자받는 회사들도 있습니다. 누적 투자금액은 수천억 원 단위로 추정합니다. 딥러닝에 대한 인기와(그중 하나는 알파폴드이죠.)과 코로나로 인한 신약개발에 대한 관심이 이 분야의 성장을 이끌었다고 생각합니다. 인력에 대한 수요가 높다 보니 평균 연봉도 인공지능 신약개발이 도입되기 이전의 신약개발 연구자의 평균에 비해서 많이 높아지고 있습니다. 굳이 인공지능 신약개발 연구자가 아니더라도, AI회사에서 제약사 연구자들을 대량으로 채용하면서 신약개발 연구자나 CADD나 전반적인 연봉이 높아지고 있다고 합니다.
하지만 현 상황에서 우려되는 일이 몇 가지 있습니다.
일단, 인공지능은 신약개발 전주기, 혹은 그 외 (기초연구나 데이터 수집부터 임상 이후 시판되는 시기까지) 영역에도 활용될 여지가 있지만, 한국에서 인공지능 신약개발 회사들은 대부분이 유효물질 발굴 단계에서 사업을 하고 있습니다. 타깃 발굴 분야에 대한 사업도 어느 정도 수는 있지만, 이미 논문으로 알려진 데이터 등을 활용하는 경우가 많아서 신규 타깃을 발굴할 수 있는 방법인지에 대한 검증이 부족해 보입니다. 전임상이나 임상단계로 가면 더 적습니다.
독성 예측에 대한 모델을 가지고 있는 회사들은 전임상 주기에 대한 사업이라 이야기하긴 하지만, 사실은 약물 최적화 단계에서도 동물실험과 독성 검토를 하기에 이것을 전임상으로 봐야 할지 아니면 유효물질 발굴 단계로 봐야 할지 모호합니다. 효력이나 부작용 검증을 위한 동물모델 설계 같은 곳에 활용한다면 좀 더 전임상 영역이라고 생각할 수 있을 텐데요.
임상 단계에 대한 사업을 진행중인 회사도 많진 않습니다. 몇몇 의대 교수님들께서 창업한 회사들이 이 단계에 대한 사업을 진행 중입니다.
또한 유효물질 발굴에서, 인공지능보다 도킹이나 분자동역학 등 시뮬레이션을 포함한 CADD에 대한 의존성이 높은 것처럼 보입니다. 물론 CADD는 단독으로만 사용하는 것이 아니라, AI와 함께 사용할 수도 있습니다. 하지만 이런 모호함 때문에 CADD를 AI로 포장하는 것이 아닌가?라는 의문이 제기됩니다. 최근 컴퓨터 성능 향상과 지속된 연구와 데이터들로 도킹이나 분자동역학은 예전보다 많이 나아졌기에 CADD도 매우 유용하다고 할 수 있습니다만, 그래도 AI신약개발로 투자받은 후에 AI를 활용하지 않는다면 그것은 정직한 일이 아닙니다.
저는 이런 점들이 데이터의 활용성이 떨어지기 때문이라고 생각합니다. 저도 학계에 있다가 데이터의 한계 때문에 회사로 갔지만, 정작 회사에서도 데이터 생산이나 제휴를 통한 사설 데이터 확보 같은 것은 어려웠습니다. 당연히 학습시킬 데이터가 부족하다 보니, 딥러닝보단 데이터에 대한 의존이 낮은 컴퓨터 시뮬레이션을 사용하게 되었습니다. 사람들이 많이 하는 연구들을 보면, 결국 공개된 데이터로 할 수 있는 것들을 하는 것처럼 보입니다. 약물 탐색은 시뮬레이션으로도 할 수 있으니, 특별한 데이터를 확보하지 못한 회사들도 약물 탐색으로 몰린 것이 아닌가 라는 생각이 듭니다.
정부에서 바이오 데이터 관련 사업을 많이 진행하고 많은 돈을 투자했다고 합니다만, 그에 비하면 생산된 데이터에 대한 활용이 떨어지고 그 데이터를 신약개발에 활용한 사례가 부족합니다. 정작 AI회사는 데이터가 부족하여 AI다운 AI를 만들지 못하고 있습니다. 저는 정부의 역할이 중요하다고 생각합니다. 사실 많은 사업들은 정부의 지원 하에서 진행이 됩니다. 회사 설립 시 다양한 지원 프로그램과 투자, 세금 혜택이나 병역특례, 연구과제 등 다양한 지원이 이루어지고 있습니다. 정부가 나서서 육성하려고 하는 산업들도 있고, 반대로 규제를 통해 산업을 제한하기도 합니다. 사업을 한다는 사람이 정부의 정책에 관심이 없다면, 그리고 정부에 사업에 대한 의견 제시를 하지 않는다면 그것이 오히려 더 이상한 일이라고 생각합니다. 결국 데이터 문제도 정부와 함께 해결해야 할 문제입니다. 전문가는 그 데이터로 무슨 일을 할 수 있는지, 어떤 유용성이 있는지를 정부에 설명하고 데이터를 활용할 방안을 제시하고, 정부는 애초에 돈을 들여서 데이터를 생산하였다면, 그 데이터가 산업적으로 활용될 수 있도록 적극적으로 나서야 합니다.
'Drug > Computer-Aided Drug Discovery' 카테고리의 다른 글
인공지능신약개발 스터디 모임 카페 개설 (0) | 2022.10.02 |
---|---|
컴퓨터, 인공지능 활용 신약개발 스터디 모임 커뮤니티 (6) | 2022.09.17 |
인공지능 신약개발 온라인 교육 플랫폼 LAIDD 2.0 open (0) | 2022.09.01 |
reference 를 이용하여 pdbqt를 pdb 로 변환하기 (0) | 2022.08.29 |
알파폴드가 예측한 단백질 구조는 완벽한가? (3) | 2022.08.05 |