오랜 시간과 비용, 시행착오 큰 개발 과정에 AI 투입
‘AI제약’으로 표적-화합물 대조 등 기존 신약 개발 어려움 대폭 해소
영국 등지선 임상시험 수준, 국내서도 ‘경진대회’ 등 날로 관심 커

제약회사의 신약 개발을 위한 연구실 장면. 본문과 직접 관련은 없음. [대웅제약]
제약회사의 신약 개발을 위한 연구실 장면. 본문과 직접 관련은 없음. [대웅제약]

[중소기업투데이 조민혁 기자] 신약 개발에도 인공지능(AI)이 본격적으로 활용되고 있다. 국내에서도 과학기술정보통신부와 한국제약바이오협회, 한국생명공학연구원 등이 오는 9월까지 ‘신약개발 인공지능 경진대회’를 열고, 공모전을 실시하고 있는 등 ‘AI제약’의 실현 가능성이 커지고 있다.

본래 신약 개발은 많은 시간과 비용, 그리고 표적과 리드 화합물 간의 수많은 경우의 수, 데이터 부족 등으로 어려움이 크다. 이런 문제점을 해결하는 유용한 방안으로 AI를 활용하는 ‘AI 제약’이 주목을 받고 있다. 이는 현존 디지털트윈의 최첨단 사례라고 할 수 있다.

현재 제약 기술은 오랜 시간과 비용 뿐 아니라, 설사 개발이 됐다고 해도 유효성이 인정되지 않거나 중대한 부작용이 발견되기라도 하면 중단할 수 밖에 없다. 그래서 개발이 성공할 확률은 약 2만5000분의 1이라는게 전문가들 얘기다. 확률적으로 ‘0’에 가까운 셈이다.

이에 제약 분야에서도 약을 연구 개발하는 과정에서 AI를 활용하는 기업이 증가하고 있다.

한국제약바이오협회 등 전문기관과 전문가들에 의하면 신약 개발 가정에선 표적에 해당하는 인간 신체의 단백질을 찾은 다음, 신약 후보인 리드 화합물을 찾아낸다. 그러나 생체 내의 그 많은 단백질을 일일이 대조해 최적의 조합을 찾아내야 하는데, 사실상 이는 불가능에 가깝다.

그러나 AI를 적용하면, “방대한 데이터를 이용함으로써 개발 시간을 단축하고, 적절한 분자를 설계할 수 있을 것”이란 기대다. 또한 딥러닝을 활용하면 기존 방식으론 분별할 수 없는 특징이나 차이점을 발견, 개발에 속도를 낼 수 있을 것으로 예상된다.

물론 해결 과제도 있다. 대표적인게 학습을 위한 데이터 수집이다. 현재 국내법상 전국의 의료기관이 지니고 있는 환자 정보나 진료기록 등은 개인정보보호법 등에 의해 제약을 받는다. 설사 이를 제공받을 수 있다고 해도, 의료기관의 데이터를 AI에게 학습시키려면 포맷을 통일시키거나, 별도의 스토리지를 구축해야 한다. 그래서 제도적, 기술적 해결책을 마련하는 것 또한 시급하다는 조언이다.

이번 과기정통부 등의 경진대회는 그런 점에서 눈길을 끄는 대목이 있다. 이 행사에선 참가자들이 AI를 접목한 ‘화합물 대사안정성 예측모델’을 개발하도록 했다.

문제는 이에 활용될 데이터다. 그래서 과기정통부 등 관계부처가 육성 중인 14대 바이오 소재 클러스터의 합성화합물 분야 데이터를 제공할 것으로 알려졌다. 이는 ‘한국화합물은행’에서 독자 생산한 신뢰도가 높은 고유 연구소재 특성 데이터다.  AI신약 개발을 위한 학습 데이터를 생성하는 방법을 시사하는 셈이어서 주목된다.

한편 국제적으론 이미 영국 등에서 AI신약이 임상시험에 들어갈 정도로 속도를 내고 있다.

2020년 영국의 Exscientia(엑사이언시아)는 강박성 장애의 치료제 후보 화합물 ‘DSP-1181’의 임상시험이 시작됐음을 알리는 발표를 했다. 이 회사는 신약 개발을 위한 하는 임상시험 1단계에 들어간 것은 최초 사례에서 전 세계의 시선을 끌었다.

당시 알려지기론 보통 4~5년이 걸리는 신약 개발 전단계의 연구가 1년 미만에 끝난 것으로 전해졌다.

앞으로도 의료 분야의 AI 시장은 확대될 전망이다. 이미 구글의 모회사인 알파벳은 AI 제약 사업을 수행하는 새로운 회사 ‘Isomorphic Labs’을 설립한 바 있다.

영국에선 AI가 류마티스 관절염 치료제의 ‘코로나19’ 치료 효과를 예측, 코로나19 치료제 개발의 단서를 제공했다. 미국에선 AI가 섬유증 질환의 치료제 후보물질을 개발하기도 했다.

한국바이오제약협회 등에 따르면 2020년에 82억 달러를 돌파한 의료 분야의 AI 시장은 앞으로도 두 자릿수 성장 속도를 보이면서, 2030년에는 1944억 달러에 달할 것으로 예상된다.

한편 이번 과기정통부 등의 ‘경진대회’에서 참가자(팀)들은 인간과 쥐의 간 세포에 대한 화합물의 대사안정성을 실험한 학습용 데이터 3498종을 제공받아 예측모델을 개발한다. 또 평가용 데이터 490종을 이용해 예측결과를 제출하게 된다. 그 결과 10월에 가장 우수한 최종 5팀을 선발할 예정이다. 국내에서도 AI제약의 가능성을 엿보게 하는 모습이다.

저작권자 © 중소기업투데이 무단전재 및 재배포 금지