Apache POI是一个开源的Java读写Excel、WORD等微软OLE2组件文档的项目。目前POI已经有了Ruby版本。
结构:
HSSF - 提供读写Microsoft Excel XLS格式档案的功能。
XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的功能。
HWPF - 提供读写Microsoft Word DOC格式档案的功能。
HSLF - 提供读写Microsoft PowerPoint格式档案的功能。
HDGF - 提供读Microsoft Visio格式档案的功能。
HPBF - 提供读Microsoft Publisher格式档案的功能。
HSMF - 提供读Microsoft Outlook格式档案的功能。
一段处理 EXCEL 文档的示例代码:
// Define a few rows
for(short rownum = (short)0; rownum < 30; rownum++) {
HSSFRow r = s.createRow(rownum);
for(short cellnum = (short)0; cellnum < 10; cellnum += 2) {
HSSFCell c = r.createCell(cellnum);
HSSFCell c2 = r.createCell(cellnum+1);
c.setCellValue((double)rownum + (cellnum/10));
c2.setCellValue(new HSSFRichTextString("Hello! " + cellnum);
}
}
Apache POI 3.11-beta2 发布,更新内容如下:
56812 – XSLF 图像提供一个获取外部链接图片的 URI
54764 – 支持 XML 解析器版本 (Xerces 或者 JVM 内置, XMLBeans 2.6),实施合理的 OOXML 文件条目扩展限制,确保后续正常文件能通过(CVE-2014-3574)
建议 Apache XMLBeans 版本升级到 2.6.0 (任意从 2.3.0 扩展的版本)
56800 – 当 XSSFWorkbook 通过一个 .xlsb 文件时,提供一个有帮助的异常:XLSBUnsupportedException
56814 – dom4j 切换成 JAXP