|
|
|
Writte by Administrator
|
|
2008/08/13 水曜日 13:05 |
高速にPDFファイルからテキストを抽出する
抽出するには、xpdfに含まれている「pdftotext」を使用する。
xpdfがインストールされていない場合は、aptを使いインストール。
$ apt-cache search xpdf $ apt-get install xpdf
インストールが終わったら、pdftotextがあるか確かめる。
$ which pdftotext
無事に終われば、以下のようなコマンドでテキスト部分を抽出 することが出来る。
$ pdftotext -enc Shift-JIS -raw a.pdf a.txt
Add as favourites (19) | Quote this article on your site | Views: 1109
|
|
|
|
|
|
|
|
|
|
|
- Please keep the topic of messages relevant to the subject of the article.
- Personal verbal attacks will be deleted.
- Please don't use comments to plug your web site. Such material will be removed.
- Just ensure to *Refresh* your browser for a new security code to be displayed prior to clicking on the 'Send' button.
- Keep in mind that the above process only applies if you simply entered the wrong security code.
|
Powered by AkoComment Tweaked Special Edition v.1.4.6 AkoComment © Copyright 2004 by Arthur Konze - www.mamboportal.com All right reserved |
|