현대 사회는 데이터 중심의 사회로 빠르게 변화하고 있습니다. 기업들은 데이터를 기반으로 의사결정을 내리고, 정부는 데이터를 활용하여 정책을 수립하며, 개인들은 데이터를 통해 자신의 삶을 더욱 풍요롭게 만들고 있습니다. 이러한 변화 속에서 데이터의 중요성은 점점 더 커지고 있으며, 데이터를 다루는 능력은 현대인의 필수적인 역량 중 하나로 자리 잡고 있습니다.
이 책을 통해 데이터 정제와 변환에 대한 전문적인 지식을 습득하고, 데이터를 효율적으로 처리하는 능력을 키울 수 있기를 바랍니다. 또한, 데이터를 활용하여 새로운 가치를 창출하는 데에도 큰 도움이 되기를 바랍니다.
제1장 데이터 정제. part1. 누락 데이터 처리
1. 누락 데이터 확인 | 6p
2. 누락 데이터 제거 | 16p
3. 누락 데이터 치환 | 20p
제2장 데이터 정제. part2. 데이터 전처리
1. 중복 데이터 | 26p
2. 데이터 정렬 | 37p
3. 데이터 부분 선택 | 47p
제3장 데이터 변환. part1. 데이터 표준화
1. 데이터 표준화 | 58p
2. 범주형 데이터 처리 | 74p
제4장 데이터 변환. part2. 시계열 데이터 변환
1. 시계열 객체로 변환 | 82p
2. 시계열 데이터 활용 | 93p
제5장 텍스트 데이터
1. 자연어 처리 | 105p
2. 긍정&부정 예측 | 115p
3. 워드 클라우드 | 119p
제6장 문장 데이터
1. 자연어 처리 기술 동향 및 전망 | 135p
2. 로이터 뉴스 카테고리 분류 | 143p
3. 영화 리뷰 분류 | 150p
제7장 이미지 데이터
1. 이미지 데이터 전처리 | 155p
2. 이미지 데이터와 딥러닝 | 162p
3. 컨볼루션 신경망(CNN)으로 이미지 인식 | 167p
제8장 가상 이미지 데이터
1. 가상 이미지 데이터 | 178p
2. 가상 이미지의 생성과 판별 : 적대적 신경망 | 188p
3. 이미지 특징 추출 : 오토인코더 | 192p
제9장 음성 데이터
1. 음성 데이터 동향 | 199p
2. 음성 데이터 다루기 | 202p
제10장 처리 데이터 저장
1. 파일 읽고 쓰기 | 211p
2. CSV파일 처리 | 222p
3. 이미지 파일 저장 | 228p
제11장 데이터 품질관리 이해
1. 데이터 품질관리 이해 | 235p
2. 품질관리 개요 | 239p
제12장 데이터 시각화
1. 데이터 시각화 | 246p
2. 다양한 그래프 그리기 | 249p