기본 콘텐츠로 건너뛰기

웹페이지 표 데이터를 엑셀로 정리해야 할 때 제일 귀찮은 순간

웹페이지 표 데이터를 엑셀로 정리해야 할 때 제일 귀찮은 순간

웹페이지에 있는 표나 리스트 데이터를 엑셀로 정리해야 할 때가 종종 있다. 처음 한두 번은 괜찮은데, 이 작업이 반복되기 시작하면 생각보다 꽤 피곤해진다.

복사해서 붙여넣으면 컬럼이 깨지거나 줄이 뒤섞이고, 조금 복잡한 페이지에서는 원하는 형태로 정리하는 데 시간이 더 든다.


기존 방식의 한계

보통은 이런 방법들을 떠올린다.

  • 마우스로 드래그해서 복사 → 엑셀에 붙여넣기
  • 크롬 확장 프로그램 사용
  • 개발자라면 간단한 스크래핑 코드 작성

문제는 대부분 페이지 구조가 조금만 바뀌어도 다시 작업해야 한다는 점이다. 특히 여러 페이지를 한 번에 정리해야 할 경우, 데이터 분석보다 정리 작업에 시간을 더 쓰게 된다.


웹페이지 구조를 그대로 엑셀로 옮기는 방식

이런 불편함 때문에 웹페이지 구조를 그대로 읽어서 엑셀 파일로 만들어주는 방식의 도구를 테스트해봤다.

방식은 단순하다.

  1. 웹페이지 URL 입력
  2. 필요한 데이터 영역 선택
  3. 엑셀 파일 다운로드

HTML 구조를 기준으로 데이터를 읽어오기 때문에 단순 복사·붙여넣기보다 컬럼이 훨씬 깔끔하게 유지되는 편이었다.


실제로 써보면서 느낀 점

가장 편했던 부분은 코드를 전혀 작성하지 않아도 된다는 점이었다. 개발자가 아니더라도 웹페이지에 있는 데이터를 그대로 엑셀로 정리할 수 있다는 점은 반복 업무가 많은 사람에게 꽤 큰 장점으로 느껴졌다.

특히 아래 같은 상황에서 체감이 컸다.

  • 반복 보고서를 만드는 경우
  • 참고용 데이터를 빠르게 정리해야 할 때
  • 구조가 일정한 페이지를 여러 개 처리할 때

작은 작업이지만 누적되면 시간을 꽤 잡아먹는데, 이런 구간에서 작업 시간이 확 줄어드는 느낌이었다.


이런 사람에게 잘 맞을 것 같다

  • 마케터/기획자처럼 웹 데이터를 자주 다루는 사람
  • 개발 지식 없이 데이터를 정리해야 하는 경우
  • 단순 복붙 작업에 시간을 쓰고 싶지 않은 사람

반대로 로그인 필요한 페이지나 아주 복잡한 SPA 구조의 사이트에서는 한계가 있을 수 있다. (이런 경우는 페이지 구조/권한 때문에 도구가 제대로 동작하기 어려울 수 있음)


마무리

웹페이지 데이터를 엑셀로 옮기는 작업은 작아 보이지만 은근히 시간을 잡아먹는 작업 중 하나다. 비슷한 일을 자주 하고 있다면 이런 방식도 하나의 선택지가 될 수 있다.

댓글

이 블로그의 인기 게시물

Java Servlet Request Parameter 완전 정복 — GET/POST 모든 파라미터 확인 & 디버깅 예제 (Request Parameter 전체보기)

Java Servlet Request Parameter 완전 정복 — GET/POST 모든 파라미터 확인 & 디버깅 예제 Java Servlet Request Parameter 완전 정복 웹 애플리케이션에서 클라이언트로부터 전달되는 Request Parameter 를 확인하는 것은 필수입니다. 이 글에서는 Java Servlet 과 JSP 에서 GET/POST 요청 파라미터를 전체 출력하고 디버깅하는 방법을 다양한 예제와 함께 소개합니다. 1. 기본 예제: getParameterNames() 사용 Enumeration<String> params = request.getParameterNames(); System.out.println("----------------------------"); while (params.hasMoreElements()){ String name = params.nextElement(); System.out.println(name + " : " + request.getParameter(name)); } System.out.println("----------------------------"); 위 코드는 요청에 포함된 모든 파라미터 이름과 값을 출력하는 기본 방법입니다. 2. HTML Form과 연동 예제 <form action="CheckParamsServlet" method="post"> 이름: <input type="text" name="username"><br> 이메일: <input type="email" name="email"><b...

PostgreSQL 달력(일별,월별)

SQL 팁: GENERATE_SERIES로 일별, 월별 날짜 목록 만들기 SQL 팁: GENERATE_SERIES 로 일별, 월별 날짜 목록 만들기 데이터베이스에서 통계 리포트를 작성하거나 비어있는 날짜 데이터를 채워야 할 때, 특정 기간의 날짜 목록이 필요할 수 있습니다. PostgreSQL과 같은 데이터베이스에서는 GENERATE_SERIES 함수를 사용하여 이 작업을 매우 간단하게 처리할 수 있습니다. 1. 🗓️ 일별 날짜 목록 생성하기 2020년 1월 1일부터 12월 31일까지의 모든 날짜를 '1 day' 간격으로 생성하는 쿼리입니다. WITH date_series AS ( SELECT DATE(GENERATE_SERIES( TO_DATE('2020-01-01', 'YYYY-MM-DD'), TO_DATE('2020-12-31', 'YYYY-MM-DD'), '1 day' )) AS DATE ) SELECT DATE FROM date_series 이 쿼리는 WITH 절(CTE)을 사용하여 date_series 라는 임시 테이블을 만들고, GENERATE_SERIES 함수로 날짜를 채웁니다. 결과 (일별 출력) 2. 📅 월별 날짜 목록 생성하기 동일한 원리로, 간격을 '1 MONTH' 로 변경하면 월별 목록을 생성할 수 있습니다. TO...

CSS로 레이어 팝업 화면 가운데 정렬하는 방법 (top·left·transform 완전 정리)

레이어 팝업 센터 정렬, 이 코드만 알면 끝 (CSS 예제 포함) 이벤트 배너나 공지사항을 띄울 때 레이어 팝업(center 정렬) 을 깔끔하게 잡는 게 생각보다 어렵습니다. 화면 크기가 변해도 가운데에 고정되고, 모바일에서도 자연스럽게 보이게 하려면 position , top , left , transform 을 정확하게 이해해야 합니다. 이 글에서는 아래 내용을 예제로 정리합니다. 레이어 팝업(center 정렬)의 기본 개념 자주 사용하는 position: absolute / fixed 정렬 방식 질문에서 주신 스타일 top: 3.25%; left: 50%; transform: translateX(-50%) 의 의미 실무에서 바로 쓰는 반응형 레이어 팝업 HTML/CSS 예제 1. 레이어 팝업(center 정렬)이란? 레이어 팝업(레이어 팝업창) 은 새 창을 띄우는 것이 아니라, 현재 페이지 위에 div 레이어를 띄워서 공지사항, 광고, 이벤트 등을 보여주는 방식을 말합니다. 검색엔진(SEO) 입장에서도 같은 페이지 안에 HTML이 존재 하기 때문에 팝업 안의 텍스트도 정상적으로 인덱싱될 수 있습니다. 즉, “레이어 팝업 센터 정렬”, “레이어 팝업 만드는 방법”과 같이 관련 키워드를 적절히 넣어주면 검색 노출에 도움이 됩니다. 2. 질문에서 주신 레이어 팝업 스타일 분석 질문에서 주신 스타일은 다음과 같습니다. <div class="layer-popup" style="width:1210px; z-index:9001; position:absolute; top:3.25%; left:50%; transform:translateX(-50%);"> 레이어 팝업 내용 <...