지난 50여 년을 되돌아보며 최근 20여 년을 평가할 때, 가장 혁신적인 기술 중 하나로 딥러닝이 꼽힐 것입니다. 딥러닝의 이론적 기반은 1950년대에 세워졌지만, 2012년이 되어서야 비전문가의 눈에도 딥러닝의 잠재력이 보이기 시작했습니다. 그로부터 10년이 지난 현재, 우리의 목소리를 텍스트로 매끄럽게 바꿔주는 스마트 스피커부터 사람의 능력을 초월한 수많은 분야까지, 딥러닝은 우리의 삶 구석구석에 스며들어 있습니다. 이 책은 아직까지 그 가능성이 간과된 정형 데이터(행과 열로 구조화된 데이터)에 딥러닝을 적용하는 내용을 다룹니다.
일반적인 통념은 정형 데이터에 딥러닝을 적용하는 일은 피해야 한다는 것입니다. 그리고 딥러닝의 유명한 응용 사례는 이미지 인식과 같은 비정형 데이터에 대한 것들이 대부분이죠. 그렇다면 비정형 데이터를 위한 딥러닝이라는 주제의 책을 읽어야 하는 이유는 무엇일까요? 첫째, 1장과 2장에서 이야기하겠지만 딥러닝으로 정형 데이터 문제를 해결하는 것에 대한 부정적인 시각 중 일부(딥러닝이 너무 복잡하다거나, 정형 데이터셋이 너무 적다는 등)는 오늘날 적용되지 않습니다. 어떤 머신러닝 접근법을 정형 데이터 문제에 적용할지 판단할 때는 열린 마음으로 딥러닝 또한 하나의 잠재적인 해결책으로 고려해야 합니다. 둘째, 딥러닝이 적용된 많은 대표적인 분야에는 비정형 데이터가 연관되어 있지만(이미지 인식, 목소리를 텍스트로 변환, 기계 번역 등), 소비자, 고용인, 시민으로서의 우리 삶은 대체로 표 형식의 정형 데이터로 정의됩니다. 모든 은행 거래, 세금 납부, 보험금 청구 등 우리 일상의 수많은 부분은 정형 데이터를 통해 흐르죠. 딥러닝에 관한 한 초보든 숙련자든 상관없이, 정형 데이터와 관련된 문제를 해결해야 할 때면 언제든 딥러닝을 사용할 준비가 되어 있는 편이 좋습니다.
이 책을 읽으면서 여러분은 다양한 정형 데이터 문제에 딥러닝을 적용하는 데 필요한 내용을 터득해나갈 것입니다. 실세계 데이터셋을 통해 딥러닝을 응용하는 전반적인 과정을 배울 것입니다. 즉 딥러닝 모델을 훈련시키기 위해 데이터를 준비하는 것부터 훈련된 모델을 배포하는 전 과정을 경험하게 되는 것이죠. 이 책이 제공하는 예제 코드는 머신러닝 분야의 공통어로 간주되는 파이썬으로 작성됐으며, 산업에서 가장 일반적으로 사용되는 딥러닝 플랫폼인 케라스(Keras)와 텐서플로(TensorFlow)를 활용합니다.