Скачать
파이썬 Pandas 데이터 전처리 끝판왕: API 데이터 수집부터 메모리 최적화까지
Автор: darkgreenchloeJJ
Загружено: 2025-08-15
Просмотров: 19
Описание:
이 영상에서는 서울시 부동산 데이터를 활용해 실제 데이터 파이프라인을 구축하는 방법을 알려드립니다. 파이썬 pandas와 concurrent.futures 라이브러리를 활용해 데이터를 효율적으로 처리하는 모든 과정을 담았습니다.
✅ 초고속 데이터 수집: ThreadPoolExecutor를 사용한 멀티스레딩으로 API 데이터를 순차 처리보다 빠르게 가져오는 방법을 보여드립니다.
✅ 데이터 가공 및 최적화: 수집한 JSON 데이터를 pandas DataFrame으로 변환하고, 데이터 타입을 최적화하여 메모리 사용량을 획기적으로 줄이는 실전 팁을 공개합니다. '제곱미터당 가격' 같은 분석용 파생 변수 생성도 함께 다룹니다.
✅ 압축 파일로 효율적인 저장: gzip 압축 형식(.csv.gz)으로 데이터를 저장하여 파일 크기를 줄이고 저장 공간을 절약하는 방법을 소개합니다.
데이터 전처리 능력을 한 단계 업그레이드하고 싶은 분들께 이 영상을 추천합니다!
#파이썬 #데이터분석 #데이터전처리 #판다스 #Pandas #멀티스레딩 #데이터파이프라인 #API수집 #메모리최적화 #Gzip #Python #DataScience
Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: