AI가 세상을 바꾸고 있다. 사람처럼 대화하고 나를 알아보는 첨단 기술과의 조우가 내 핸드폰에서 가능한 것이 더 이상 새롭지 않다. 자율주행을 가능하게 하고 우리의 생활을 편리하게 만드는 AI의 핵심이 바로 딥러닝이다. 베스트셀러 저자이면서 미국 의과대학의 현직 교수인 조태호 저자를 만나본다.
2년만에 7문 7답에서 다시 만나게 되었습니다. 전에는 브런치북 대상작 『당신의 이유는 무엇입니까』 출간으로 인터뷰를 나누었는데, 이번에는 『모두의 딥러닝』이라는 인공지능 기술 서적으로 만나게 되었네요. 작가님 소개와 새로 나온 책에 대해서도 간략히 알려주시겠어요?
다시 이 인터뷰를 하게 되어 반갑고 감사합니다. 저는 현재 인디애나 의과대학에서 AI, 딥러닝으로 치매를 연구하고 있습니다. 지난 번 책 『당신의 이유는 무엇입니까』가 지금 이 일을 하기까지의 과정이 담겼다면, 『모두의 딥러닝』은 저의 본업인 딥러닝을 풀어낸 책입니다.
저는 딥러닝이 알파고로 국내에서 유명세를 타기 훨씬 전부터 딥러닝을 사용해 연구를 해왔는데, 생화학, 생명 과학을 전공한 사람이 컴퓨터 사이언스 분야인 딥러닝을 배우려니 어려움이 많았습니다. 따라서 비전공자로서 겪는 어려움들을 누구보다 잘 알고 있다고 생각합니다. 그래서 저와 같은 어려움을 겪고 있는 분들에게 도움이 되고 싶은 마음에 『모두의 딥러닝』을 집필했습니다. 다행히 많은 분에게 사랑을 받는 베스트셀러가 되어 이번에 개정 3판까지 나오게 되었습니다.
벌써 개정 3판이라는 것이 놀랍습니다. 이 책을 처음 접하는 분들을 위해 『모두의 딥러닝』에 대한 소개와 초판부터 개정3판까지 흘러온 과정을 간략히 말씀해주세요.
『모두의 딥러닝』 초판은 2017년 겨울에 세상에 나왔습니다. 그때는 딥러닝을 기초부터 차근차근 안내해주는 국내 저자의 책이 거의 없었을 때였습니다. 그래서 출간 직후부터 AI, 딥러닝에 관심이 있는 분들에게 지속적인 주목을 받아왔고, 감사하게도 지금까지 IT 분야 베스트셀러 목록에서 빠진 적이 없었습니다. 하지만 책 출간 이후 더 나은 기술들이 주목받는 일들이 생겼습니다. 그래서 2년이 지났을 무렵 가장 많이 쓰이는 알고리즘 4가지를 추가해 개정 2판을 냈고, 그 후 2년이 더 지난 지금, 새로운 챕터 3개와 머신 러닝 알고리즘 10개, 데이터 관리 코드 92개 등을 추가해 개정 3판이 나오게 된 것입니다.
이제 딥러닝의 발전 속도가 가속화되는 시기는 지났다고 여겨집니다. 또 딥러닝을 학습하는 순서도 표준화되어 개정 3판은 이러한 수준의 딥러닝과 학습 과정을 고스란히 담을 수 있었습니다. 특히 복잡한 설치 과정 없이 어떤 환경에서도 웹 브라우저만으로 딥러닝을 실행할 수 있게끔 구성했고, 오랜 기간 준비한 동영상 강의도 함께 마련하는 등, 독자분들이 조금이라도 편하게 딥러닝을 익힐 수 있도록 하고자 노력했습니다. 쉽고 정말로 실용적인 딥러닝 책으로 다시 찾아 뵙게 된 것이 기쁘네요.
지금 의과대학에서 알츠하이머를 연구한다고 하셨는데, 어떻게 딥러닝을 접목하게 됐고 왜 딥러닝 책을 쓰게 되셨나요?
딥러닝은 대학에서 질병을 연구하는 저 같은 사람뿐만 아니라, 회사, 연구소, 병원, 혹은 자영업을 하거나 교육 현장에 계시는 분들 누구나 알아야 할 기술입니다. 예를 들어 제가 최근 만든 모델은 딥러닝에 CT 영상 데이터를 입력해서 알츠하이머 치매의 조짐을 미리 발견하는 것입니다. 알츠하이머가 발병하기 2년 전에 미리 조짐을 잡아내는 딥러닝 모델을 만들었는데, 이 모델의 코드 상당 부분이 『모두의 딥러닝』에 들어 있습니다. 책을 보신 분은 아시겠지만 정말 간략한 코드만으로 이러한 일을 해내고 있지요. 딥러닝 모델을 만들어 쓸 수 있는 곳이 무궁무진할 수 있다는 것을 말해주는 사례라 할 수 있을 것 같습니다.
문제는 이렇게 유용한 딥러닝에 대해 들어본 사람은 많지만, 실제로 이것을 내 데이터에 적용해 실험할 수 있는 사람은 많지 않다는 것입니다. 딥러닝을 소개하는 그림과 설명으로 만들어진 유튜브 영상 자료들은 많은데, 이것을 보고 파이썬 코드를 짜며 직접 자신의 모델을 만들기는 어렵지요. 보는 것과 실제로 하는 것은 완전히 다릅니다. 따라서 직접 해볼 수 있게끔 코드를 제공하고 쉬운 설명을 더해주어 실제로 딥러닝을 내 것으로 만들어줄 수 있는 책이 필요하다고 생각되었고, 이에 대한 수요와 맞물려 지속적으로 개정되며 출간되고 있습니다.
『모두의 딥러닝』을 쓰게 된 가장 큰 계기는 이러한 도움을 요청했던 어느 학생의 질문이었습니다. 그런데 일단 책을 내고 나니 제가 할 일이 있다는 생각을 했습니다. 불필요한 과정을 생략하고 최소한 필요한 것들을 정확히 이해하며, 자신의 연구에 실제로 딥러닝을 활용할 수 있게 하는 책이 될 수 있도록 지난 4년간 끊임없이 고민해왔습니다. 그 오랜 시간의 결과 지금의 모두의 딥러닝 개정 3판이 나오게 된 것입니다.
박사님이 쓰신 책의 목표가 딥러닝을 최대한 쉽게 이해시키는 것인 만큼, 이 인터뷰를 보는 분들에게 딥러닝이 무엇인지 최대한 간략하게 설명해주실 수 있으신지요?
아무리 쉽게 설명을 해도 결국 책 한 권이 필요한 게 딥러닝입니다. “딥러닝은 결국 OOO입니다”라고 설명하면서 딥러닝을 다 설명한 것처럼 착각하게 만드는 영상물로 인한 피해는 결국 자기 자신에게 돌아온다고 생각합니다. 피상적인 내용만 이해하고 도전하다가 막상 해보니 안 되는 경험을 하게 되면서 좌절하게 되는 것이지요.
딥러닝은 1943년으로 그 기원이 거슬러 올라가는 오랜 노력의 산물입니다. 한 스텝 한 스텝의 발전 안에는 평생을 이 분야에 헌신한 학자들의 삶과 노력이 배어 있습니다. 너무 쉽게 이해하려고 하면 딱 그 정도의 실력을 가지게 될 뿐입니다.
딥러닝은 무엇인가, 이 질문에 대한 답을 주어진 조건 내에서 해보자면 이렇습니다. 2000년대 초반만 해도 인공지능은 냉장고의 온도를 조절해 주고, 게임 캐릭터의 움직임을 조절해주는 정도의 수준으로 대중에게 다가왔습니다. 그런데 지금은 사람처럼 대화하는 챗봇이 나오고, 우리의 잠에서 깬 얼굴도 알아보며, 운전을 해주고, 우리가 보는 SNS의 피드를 조정합니다. 이러한 기술의 진보를 이루게 한 것이 바로 ‘딥러닝’입니다. AI, 인공지능이라고 흔히 말하지만, 구체적으로는 딥러닝이 그 일을 한 것입니다. 기술적인 측면에서 볼 때 딥러닝 발전의 가장 커다란 스텝은 제프리 힌튼 교수의 ‘오차 역전파’(*실제 값과 비교하여 모델의 가중치를 수정해 주는 방법)였다고 생각합니다. 그리고 여기에 GPU와 같은 컴퓨팅 환경의 발전, 몇몇 실용적인 함수들의 개발이 제 때에 더해졌습니다. 한마디로 딥러닝을 배우는 것은 오차 역전파가 무엇을 이루었는지를 정확히 알고, 여기서 말한 실용적인 함수란 무엇이며, 그것이 어떻게 해서 ‘과적합’을 피하게 했는지를 배우는 과정이라고 할 수 있습니다. (책에는 이보다 훨씬 쉽고 자세하게 쓰여 있습니다)
딥러닝을 쉽게 이해하게 해준다는 영상이나 자료에 의지하지 말라는 의미는 잘 알겠습니다. 그런데 막상 박사님도 유튜브 강의를 진행하시는 것으로 알고 있습니다. 지금 운영하시는 유튜브 강좌는 다른 딥러닝 강좌와 어떤 차별점이 있는지요?
네, 유튜브에서 딥러닝을 이해하고 실제 활용할 수 있게끔 도와주는 채널을 운영하고 있습니다. 『모두의 딥러닝 개정 3판』의 내용을 바탕으로 강의를 찍고 있으며, 이 인터뷰를 하는 현재 전체 22장 중 18장까지에 해당하는 강의가 업로드되어 있습니다. 제 채널도 결국 쉬운 그림과 설명으로 딥러닝을 쉽게 전하는 유튜브 채널들 중 하나라는 틀에서 벗어날 수는 없겠지요. 게다가 연구와 더불어 주말에 촬영하고 있고, 모든 편집도 제가 직접 하고 있다 보니 힘에 부치는 면도 있고요.
다만, 제가 진행하는 채널은 언제나 소스 코드를 먼저 열고 실습할 수 있게끔 모든 준비가 미리 되어 있다는 점이 차별성을 가진다고 생각합니다. 말로만 설명하는 것이 아니라, 자신의 프로젝트에 바로 쓸 수 있는 소스를 동시에 제공합니다. 한 쪽에 강의를 틀어 놓고, 구글 코랩에 준비된 소스 코드를 열어 한 줄 한 줄 의미를 파악하다 보면 아 지금까지 들어온 이론이 바로 이렇게 활용되는구나를 아실 수 있을 겁니다. 또한, 책이 없어도 강의를 듣는 데 지장이 없습니다. 딸과 함께 강의 인트로를 찍다가 포복절도하는 장면도 보실 수 있습니다.
박사님의 책과 강의를 들으며 배운 딥러닝을 과연 어디에 어떻게 활용할 수 있는지 궁금합니다. 딥러닝이 우리에게 무엇을 해줄 수 있나요? 딥러닝은 우리의 삶을 어떻게 바꾸게 될까요?
먼저 이야기할 것이, 딥러닝은 마법이 아니라는 것입니다. 딥러닝은 과거에 없던 것을 창조하는 것이 아닙니다. 과거에 있었던 것들의 패턴을 아주 잘 파악하는 알고리즘일 뿐입니다. 그런데 여기서 중요한 것은 딥러닝이 다루는 그 ‘과거’의 범위가 우리의 인지 정도를 넘어설 만큼 넓다는 것입니다. 그래서 항상 놀라운 정확도의 예측을 해내고, 전에 보지 못했던 것들을 만들어냅니다. 우리 생각의 범위를 넘어서는 분량의 데이터를 학습한 딥러닝 모델은 그래서 우리에게 도전이 될 수도 있고, 커다란 도움이 될 수도 있으며 어쩌면 위협이 될 수도 있습니다.
한 가지 예를 들면, 단백체학 연구자들은 지난 50여 년간 단백질의 구조를 예측해내기 위해 노력해왔습니다. 그런데 딥러닝을 앞세운 딥마인드가 ‘알파폴드’라는 것을 들고 나오면서 단 4년여 만에 최고 수준의 예측을 달성했습니다. 이것은 네이처지가 이 기술이 이제 모든 것을 바꿀 것이라는 찬사를 보냈을 만큼 뛰어난 과학적 성과입니다. 하지만 이면에는 그 50여 년간 단백질 구조 연구를 해오던 사람들이 있습니다. 그들이 느낀 허무함은 상당할 것이라는 점을 쉽게 상상할 수 있습니다. 이 게임의 승자는 오직 딥러닝을 도입한 단백질 구조 연구자의 몫이 되어 버렸습니다. 즉, 먼저 알고 도입한 사람이 독식하는 시대라는 것입니다. 어떤 이들에게는 조력자가 되고 어떤 이들에게는 승리의 카드가 되며 어떤 이들에게는 수십 년간의 노력을 퇴색시키는 위협이 되기도 한다는 것을 잘 말해주고 있습니다. 여러분에게, 저에게, 딥러닝은 어떤 카드인지, 스스로에게 물어봐야 할 때입니다.
끝으로 이 책을 누구에게 권하고 싶은지요? 누가 읽어야 하고, 누가 배워야 합니까?
이러한 질문을 많이 받습니다. 그런데 마치 백년쯤 전 자동차가 처음 나왔을 때 이건 누가 타고 누가 운전해야 합니까라고 묻던 질문과 통하는 바가 있습니다. 이제 더 이상 자동차를 누가 타야 하는가라고 질문하지 않지요. 필요하면 누구나 타는 것이니까요. 딥러닝도 마찬가지입니다. 필요하면 누구나 이용하는 것이지요. 게다가 딥러닝은 주인이 없습니다. 딥러닝이 할 수 있는 것들을 생각해 보면 이를 배우고 활용하는 것이 너무나 당연합니다. 다만 잘 모르고 있을 뿐입니다.
딥러닝에 대한 대중의 이해 정도가 자동차를 이해하는 것만큼 빠르지 않은 이유 중 하나는 진입장벽이 있기 때문입니다. 얼마간의 파이썬 코드를 다룰 수 있어야 하고 컴퓨팅 환경이 조성되어야 합니다. 기술의 발전이 점점 우리에게 유리한 쪽으로 흐르고 있다는 것은 좋은 소식입니다. 코드는 여러 라이브러리의 도움으로 점점 쉬워지고 있고, 누구나 웹 브라우저만 있으면 딥러닝 컴퓨팅 환경을 걱정하지 않아도 되는 시대가 되었습니다. 이제 제대로 된 책 한 권과, 웹 브라우저만 있으면 그 딥러닝이 내 것이 될 수 있습니다. 누구나 자동차를 타듯이, 그리고 누구나 웹 브라우저로 인터넷을 서핑하듯이, 이제 누구나 딥러닝을 만들고 나의 현업이나 연구에 도입할 수 있는 시대인 것입니다.
딥러닝은 누구나 알고 배워야 하는 기술입니다. 이 글을 읽는, 전혀 딥러닝에 무지한 독자들도 도전해 볼 만한 시대입니다. 일단 무료로 제공되는 조박사의 편안한 딥러닝 유튜브 채널부터 방문해보시기 바랍니다. 그리고 무료로 제공되는 소스 코드를 실행해 보시기 바랍니다. 5분도 안 걸립니다. 한 번 해보세요! 해보지 않으면 해낼 수 없습니다!
*조태호 머신 러닝, 딥러닝을 이용해 알츠하이머 질병을 연구하며 틈틈이 책을 쓰고 번역한다. 일본 도쿄의과치과대학에서 단백질 구조 예측으로 박사학위를 받았고, 미국으로 이주해 단백질 구조 예측에 딥러닝을 도입하는 연구를 했다. 2018년부터 미국 인디애나 대학교 의과대학에 재직하며 딥러닝을 이용한 알츠하이머 진단(2019), 딥러닝을 이용한 알츠하이머 원인 단백질 추적(2020), 딥러닝을 이용한 유전자 변이 예측(2021) 등을 연구하고 진행했다. 저서로는 『모두의 딥러닝』, 제7회 브런치북 대상 수상작 『당신의 이유는 무엇입니까』 등이 있다. |
추천기사
‘대한민국 No.1 문화웹진’ 예스24 채널예스
출판사 제공
출판사에서 제공한 자료로 작성한 기사입니다. <채널예스>에만 보내주시는 자료를 토대로 합니다.