웹페이지 표 데이터를 엑셀로 정리해야 할 때 제일 귀찮은 순간
웹페이지에 있는 표나 리스트 데이터를 엑셀로 정리해야 할 때가 종종 있다. 처음 한두 번은 괜찮은데, 이 작업이 반복되기 시작하면 생각보다 꽤 피곤해진다.
복사해서 붙여넣으면 컬럼이 깨지거나 줄이 뒤섞이고, 조금 복잡한 페이지에서는 원하는 형태로 정리하는 데 시간이 더 든다.
기존 방식의 한계
보통은 이런 방법들을 떠올린다.
- 마우스로 드래그해서 복사 → 엑셀에 붙여넣기
- 크롬 확장 프로그램 사용
- 개발자라면 간단한 스크래핑 코드 작성
문제는 대부분 페이지 구조가 조금만 바뀌어도 다시 작업해야 한다는 점이다. 특히 여러 페이지를 한 번에 정리해야 할 경우, 데이터 분석보다 정리 작업에 시간을 더 쓰게 된다.
웹페이지 구조를 그대로 엑셀로 옮기는 방식
이런 불편함 때문에 웹페이지 구조를 그대로 읽어서 엑셀 파일로 만들어주는 방식의 도구를 테스트해봤다.
방식은 단순하다.
- 웹페이지 URL 입력
- 필요한 데이터 영역 선택
- 엑셀 파일 다운로드
HTML 구조를 기준으로 데이터를 읽어오기 때문에 단순 복사·붙여넣기보다 컬럼이 훨씬 깔끔하게 유지되는 편이었다.
실제로 써보면서 느낀 점
가장 편했던 부분은 코드를 전혀 작성하지 않아도 된다는 점이었다. 개발자가 아니더라도 웹페이지에 있는 데이터를 그대로 엑셀로 정리할 수 있다는 점은 반복 업무가 많은 사람에게 꽤 큰 장점으로 느껴졌다.
특히 아래 같은 상황에서 체감이 컸다.
- 반복 보고서를 만드는 경우
- 참고용 데이터를 빠르게 정리해야 할 때
- 구조가 일정한 페이지를 여러 개 처리할 때
작은 작업이지만 누적되면 시간을 꽤 잡아먹는데, 이런 구간에서 작업 시간이 확 줄어드는 느낌이었다.
이런 사람에게 잘 맞을 것 같다
- 마케터/기획자처럼 웹 데이터를 자주 다루는 사람
- 개발 지식 없이 데이터를 정리해야 하는 경우
- 단순 복붙 작업에 시간을 쓰고 싶지 않은 사람
반대로 로그인 필요한 페이지나 아주 복잡한 SPA 구조의 사이트에서는 한계가 있을 수 있다. (이런 경우는 페이지 구조/권한 때문에 도구가 제대로 동작하기 어려울 수 있음)
마무리
웹페이지 데이터를 엑셀로 옮기는 작업은 작아 보이지만 은근히 시간을 잡아먹는 작업 중 하나다. 비슷한 일을 자주 하고 있다면 이런 방식도 하나의 선택지가 될 수 있다.
댓글
댓글 쓰기