Java 실무: Apache POI로 Excel 데이터 수정 및 업무 자동화 구현하기
Java 환경에서 Apache POI 라이브러리를 활용해 기존 Excel 파일을 읽고, 특정 셀 데이터를 안전하게 수정한 뒤 저장하는 전체 프로세스와 핵심 객체 구조를 상세히 알아봅니다.
1. Apache POI 라이브러리 의존성 설정
Java 애플리케이션에서 Excel 파일을 프로그래밍 방식으로 제어하기 위해서는 Apache POI 라이브러리가 필요합니다. Maven 기반 프로젝트에서는 pom.xml 파일에 아래 의존성을 추가하여 환경을 구성합니다.
이 설정은 구버전 포맷인 .xls(HSSF)와 신버전 포맷인 .xlsx(XSSF)를 모두 지원하기 위한 구성입니다.
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>5.2.3</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>5.2.3</version>
</dependency>
2. Excel 읽기 및 수정 전체 코드 예제
로컬 스토리지에 위치한 기존 Excel 파일(22222.xls)을 로드하여 특정 좌표의 셀 데이터를 수정하고, 이를 새로운 파일로 저장하는 전체 코드입니다.
이 예제는 HSSF(Horrible Spreadsheet Format) 방식을 사용하여 레거시 Excel 파일(.xls)을 처리합니다.
import java.io.FileInputStream;
import java.io.FileOutputStream;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
public class ExcelWrite {
public static void main(String[] args) throws Exception {
// 1. 파일 시스템에서 기존 Excel 파일 로드
FileInputStream fis = new FileInputStream("C://test/22222.xls");
POIFSFileSystem fs = new POIFSFileSystem(fis);
HSSFWorkbook wb = new HSSFWorkbook(fs);
// 2. 첫 번째 시트(Index 0) 접근
Sheet sheet = wb.getSheetAt(0);
System.out.println("Target Sheet: " + sheet.getSheetName());
// 3. 데이터 수정: 4번째 행(idx 3), 6번째 열(idx 5)
Row row = sheet.getRow(3);
Cell cell = row.getCell(5);
if (cell != null) {
cell.setCellValue("홍길동"); // 값 변경
}
// 4. 데이터 수정: 4번째 행, 11번째 열
cell = row.getCell(10);
if (cell != null) {
cell.setCellValue("555555");
}
// 5. 데이터 수정: 6번째 행, 6번째 열
row = sheet.getRow(5);
cell = row.getCell(5);
if (cell != null) {
cell.setCellValue("www.google.com");
}
// 6. 변경된 내용을 신규 파일로 저장 (리소스 해제 필수)
FileOutputStream fileout = new FileOutputStream("C://test/22222Save.xls");
wb.write(fileout);
fileout.close();
fis.close();
System.out.println("Excel 파일 수정 및 저장 완료!");
}
}
3. 핵심 객체 구조 및 메서드 분석
Apache POI를 통해 Excel을 제어할 때 이해해야 할 주요 컴포넌트와 계층 구조입니다. 아래 구조를 이해하면 코드를 작성하는 순서(Workbook → Sheet → Row → Cell)를 명확히 알 수 있습니다.
- FileInputStream / POIFSFileSystem: 물리적인 파일을 Java 스트림으로 읽어와 POI가 해석 가능한 파일 시스템 구조로 변환합니다.
- HSSFWorkbook: Excel 파일 전체를 관장하는 워크북 객체입니다. (
.xlsx파일은XSSFWorkbook을 사용) - Sheet, Row, Cell: 엑셀의 데이터 계층입니다. 반드시 Row(행) 객체를 먼저 획득한 뒤, 해당 Row 안에서 Cell(열)을 선택해야 합니다.
- FileOutputStream: 메모리 상에서 변경된 워크북 데이터를 실제 파일로 출력(Write)하여 저장을 완료합니다.
4. 실무 활용 포인트 및 요약
Java와 Apache POI 조합은 단순 데이터 입력을 넘어 정기 리포트 자동 생성, 대량 데이터 일괄 업데이트, 레거시 데이터 마이그레이션 등 다양한 업무 자동화에 활용됩니다.
💡 Tip: 실무 코드 작성 시에는 NullPointerException 방지를 위해 getRow()나 getCell() 호출 결과에 대한 null 체크를 반드시 수행해야 하며, 셀의 데이터 타입(String, Numeric, Formula 등)에 맞는 적절한 메서드를 사용하는 것이 안정성을 높이는 핵심입니다.
댓글
댓글 쓰기