JODConverterを試す
JODConverterはOpenOfficeを利用したドキュメントコンバーター。なんとなく試してみました。
まずは、OpenOfficeをサービスとして立ち上げておきます。
OSXの場合はこんな感じ。
/Applications/OpenOffice.org.app/Contents/MacOS/soffice.bin -headless -accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizard
Wordをhtml形式に変換して画像を取り出す。
java -jar jodconverter-2.2.1/lib/jodconverter-cli-2.2.1.jar test.doc test.html
java -jar jodconverter-2.2.1/lib/jodconverter-cli-2.2.1.jar test.xls text.cvs
とかしてみました。