생물학적 빅데이터를 구축하는 블록체인(blockchain) 회사인 데이터마인드(Datamined)의 공동 창립자이자 최고기술책임자(CTO)다. 또한 신약 개발에 딥러닝을 적용하는 DeepChem1 라이브러리의 수석 개발자이자 MoleculeNet의 공동 개발자다.
UC 버클리에서 EECS와 수학 분야 학사 학위를 받았으며, 최근 스탠퍼드 대학교에서 컴퓨터과학으로 박사 학위를 받았다. 또한 과학 분야 최우수 대학원생을 지원하는 허츠 펠로우십(Hertz Fellowship)에 선정돼 비제이 판데(Vijay Pande) 교수에게 연구 지도를 받았다.
최근 로봇공학의 발전으로 많은 생명과학 실험이 자동화돼 엄청난 양의 데이터를 만들어내고 있다. 약 20년 전에는 한 명의 과학자가 평생 동안 모아야 했을 데이터가 오늘날에는 하루면 쌓인다. 이로 인해 생명과학과 데이터 과학(data science)의 경계가 빠르게 사라지고 있으며, 데이터의 홍수 속에서 빠르게 데이터를 분석하는 능력은 생명과학자의 필수 자질이 되고 있다. 이제 엑셀(Excel)로 실험 데이터를 처리하고 그래프를 그리는 시대는 지났다. 현대의 생명과학자에게는 거대한 실험 데이터 속에 숨겨진 패턴을 찾아내고 새로운 지식을 얻어 과학적 결론을 도출하는 능력이 가장 필요하다.
지난 몇 년간 딥러닝(deep learning)은 데이터의 패턴과 의미를 찾아내는 강력한 도구로 활용돼 왔으며, 주로 이미지 분석, 외국어 번역, 음성 인식과 같은 빅데이터 분석에서 놀라운 성능을 보여줬다. 이 책에서는 딥러닝을 생명과학 분야에 적용하는 방법으로 유전체학, 신약 개발, 질병 진단 등의 다양한 분야에 사용하는 과정을 소개한다. 또한 실무에 바로 사용할 수 있는 예제 코드를 제공해 독자들의 시간을 아껴줄 것이다.