본문 바로가기
카테고리 없음

Apache POI 소개 및 가이드 : Excel 분석 LIB

by Nomangs 2022. 7. 26.
반응형

오늘은 Apache 재단에서 Open Source 로 배포하고 있는 ~ POI 를 알아보겠습니다.

Apache POI 를 이용하여 Excel 파일을 분석하거나 생성하는 작업을 수행할 수 있습니다.

아파치 POI 소개

응용 프로그램을 개발하는 동안 Excel 파일을 처리하거나 데이터를 파일 형식으로 사용자에게 표시하는 것을 포함할 수 있는 클라이언트의 다양한 요구 사항에 직면할 수 있으므로 apache poi는 문제를 해결하고 이러한 종류의 작업을 관리하는 API입니다. . 이를 통해 Java 코드를 작성하여 응용 프로그램에서 MS Office 파일을 쉽게 처리하고 관리할 수 있습니다. 이것을 사용하려면 몇 가지 구성을 수행해야 합니다. 이 API는 우리의 작업을 쉽고 빠르며 오류 없이 만들어줍니다. 우리는 사용자의 데이터를 파일 형태로 업로드해야 하는 요구 사항을 발견했고 이 경우에도 이를 처리할 수 있는 프로그램이 필요할 수 있으므로 이 위치에서 Apache POI를 사용할 수 있습니다.

 

아파치 POI란 무엇입니까?

  • 우선, 이 API는 오픈 소스 라이브러리인 Apache Software Foundation에서 제공하므로 Java 프로그램을 제자리에 사용하여 MS 파일을 수정하거나 설계하는 데 도움이 됩니다. 즉, 개발자를 허용하거나 Java 프로그램을 사용하여 MS Office 파일을 설계, 수정, 생성 및 표시할 수 있습니다.
  • 이것은 파일에서 사용자 데이터를 읽거나 해당 사용자 데이터를 기반으로 새 파일을 작성하거나 생성하는 데 도움이 되는 해당 클래스와 메서드가 포함된 API입니다.

Apache POI를 읽는 데 사용되는 구성 요소

Apache POI를 읽는 동안 사용할 주요 구성 요소는 다음과 같습니다. 이 API에는 Java 프로그램을 통해 모든 MS Office 파일을 작업하고 처리하는 데 도움이 되는 많은 메서드와 클래스가 포함되어 있습니다.

  • HPBF: 이것은 Horrible Publisher Format의 약자인 Apache poi의 주요 구성 요소 중 하나입니다. 이 구성 요소는 특히 MS-Publisher 파일인 파일을 읽고 쓰는 데 사용됩니다.
  • HSSF: 이것은 Horrible Spreadsheet Format을 나타내는 또 다른 구성 요소입니다. 이 유형의 구성 요소는 특히 우리가 가지고 있는 MS Excel 파일의 xls 형식을 읽고 쓰는 데 사용됩니다.
  • HPSF: 이것은 Horrible Property Set Format을 나타내는 또 다른 구성 요소입니다. 이 구성 요소는 기본적으로 속성 집합을 포함하는 MS Office 파일의 속성을 추출하는 데 기본적으로 사용됩니다.
  • HSLF: 이것은 끔찍한 슬라이드 레이아웃 형식을 나타내는 또 다른 구성 요소입니다. 이것은 기본적으로 편집, 생성 및 읽기와 같은 작업을 지원하는 PowerPoint 프레젠테이션에 사용됩니다.
  • HDGF: 이것은 Horrible Diagram Format을 나타내는 또 다른 구성 요소입니다. 이것은 기본적으로 바이너리 파일을 포함하고 처리합니다. 여기에는 MS Visio 관련 바이너리 파일을 처리하기 위한 메서드와 클래스가 내부적으로 포함되어 있습니다.
  • POIFS: 이것은 Poor Obfuscation Implementation File System을 나타내는 apache poi의 또 다른 com입니다. 이것은 우리가 사용한 모든 poi 요소의 기본 요소 또는 기본 요소로 간주됩니다. 다른 파일 유형을 읽고 싶다면 명시적으로 코드를 작성하여 이를 사용할 수 있습니다.
  • HWPF: 이것은 끔찍한 워드 프로세서 형식을 나타내는 아파치 poi의 또 다른 구성 요소입니다. 이 구성 요소는 기본적으로 확장자가 doc인 MS 워드 파일을 지원합니다.
  • XSSF: 이것은 XML 스프레드시트 형식을 나타내는 아파치 poi의 또 다른 구성 요소입니다. 이 구성 요소는 기본적으로 MS Excel의 xlsx 확장 파일을 읽는 데 사용됩니다.
  • XWPF: 이것은 XML 워드 프로세서 형식을 나타내는 또 다른 구성 요소입니다. 이 구성 요소는 기본적으로 확장자가 docx인 MS Word 파일을 읽고 쓰는 데 사용됩니다.

종속성 및 Apache POI 설치

아래는 Java 프로젝트 내에서 Apache POI를 사용하여 파일을 효율적으로 처리하는 방법을 보여줍니다.

 

Gradle 이나 maven 등 다양한 방안이 있는데~

maven repository 링크로 보시는게 편하겠죠 ?

https://mvnrepository.com/artifact/org.apache.poi/poi

 

클래스

  • HSSFWorkbook: 이 클래스는 HSSFWorkbook의 객체를 생성하는 데 사용됩니다.
  • XSSFWorkbook: 이 클래스는 XSSFWorkbook의 개체를 만드는 데 사용됩니다.
  • HSSFSheet: 이 클래스는 HSSFSheet의 객체를 생성하는 데 사용됩니다.
  • XSSFSheet: 이 클래스는 XSSFSheet의 개체를 만드는 데 사용됩니다.
  • XSSFRow: 행을 구현하는 데 사용됩니다.
  • XSSFCell: 셀 인터페이스를 생성하는 데 사용됩니다.
  • XSSFCellStyle: 이 클래스는 셀의 스타일을 지정하는 데 사용됩니다.

중요한 기능

  • 스트림 기반 처리를 제공합니다.
  • XLS와 XLSX를 모두 처리할 수 있습니다.
  • 추가 Excel 기능을 잘 지원합니다.
  • 또한 메모리가 덜 필요합니다.

결론

Apache POI를 사용하여 이미 선언된 클래스와 메서드가 있는 Java 프로그램을 통해 MS Office 파일을 읽고 쓸 때의 이점과 기능을 단계별로 보여주므로 개발자가 빠르고 쉽게 처리할 수 있습니다.

 

반응형

댓글