画像からテキストを抽出
聞いてみるものだ
画像からテキストを抽出できたら実に便利だが、
長い間、それはできないことと思っていて、あきらめていたが、
(株)リクルートの『キーナビ相談室』の質問に出したら、回答があり、できると分かった。
キーマンズネットは非常に広い範囲から、多くの腕利きが、即座に回答してくれる。
質問等のやりとりの一部
>>画像画面から直接文字をテキストとして読込むソフトないですか?
>>できればフリーソフトか、アプリケーションの一部機能として。
>>OCRのように。一度紙に印刷してOCRで読めばできるかも知れないが、
>>それは面倒だし。
>
>フリーかどうかは別として、スキャナなんかについているソフトに結構そういうのはあります。
>有名なところでは「読んでココ」とかあります。
>スキャナのホームページを調べて同梱製品を調べてみると結構あるので、
>調査してみたらどうでしょう?
>また、ソフトの販売店にもOCRソフトが結構あったと思うので、
>行って見たらどうでしょうか?
>値段も2〜3万円程度あれば十分に帰ると思います。
>
>ただし、読み取れる画像の種類に制限があるものがほとんどだと思うので、
>それだけは気をつけてください。
>OCRソフトと画像フォーマット変換ソフトが両方必要になる可能性はありますね。
早速のご回答ありがとうございます。
JPG、GIF等やホームページの画像画面から文字を読みたいという、
向こう見ずの質問も、できたら良いなと常々思いつつも、
できるわけないと、あきらめていましたが、切実に思う場面もしばしば。
あまた、質問のサイトはありますが、キーナビの回答は感度良く、
もしかしたらと、質問出してみました。
やーおどろきましたね。聞いて良かった。あるんですね、そーいうのが。
確か「読んでココ」というのは見覚えがあり、自分も持っていると思います。
早速ためしてみようと思います。
OCRの説明書や機器の取扱説明書類はどうも、ろくに読まず、
手探りですぐいじくりまわすだけの傾向が強く反省しております。
具体的なソフト名、画像フォーマット変換ソフト名等が分かりましたら、
または分かる方や他のご意見も引き続きお待ちしております。
この際、多くの人にも紹介したいですね、そういうソフトは。
ではまた。ありがとうございました。
[別の回答]
画像画面とは、tiffやjpegなどの画像ファイルのことでしょうか。
だとしたらOCRソフトでテキスト変換できますよ。
紙をスキャナーで読ませて変換するだけでなく、ファイルから直接変換する機能を
備えた市販のOCRソフトがあります。
フリーソフトやアプリケーションの一部機能としてはちょっとわかりません。
Re:具体的には
内容
>画像画面とは、tiffやjpegなどの画像ファイルのことです。
>OCRソフトでテキスト変換できるのですか、
>現有のOCRソフトを少し試してみようと思います。
>TYPIST2ではだめでしょうね?
>ファイルから直接変換する機能を備えた市販のOCRソフトがあるんですか。
お使いのソフトで、読み込み先を"スキャナー"の他に"ファイル"と指定できるなら
画像ファイルの変換が可能かと思います。
いくつかのソフトを調べましたが、対象となるファイルはtiff、jpeg、BMP形式の3つが
主で、あとはソフトによってFAX形式やその他の形式が読み込めるようです。
読んでココの話題が出ていましたが、バージョンによっても異なると思いますが、私
が知っているバージョン6には[ファイル]-[画像ファイルを開く]という項目がありま
す。
あとはそこから対象となるファイルを選択して、(領域を選択して)、認識となります。
申し訳ありませんが、TYPIST2というソフトについてはわかりません。
>もし、ソフト名が分かりましたらお願いいたします。
>自分でも調べてみようと思いますが、ご存知の方がいらしたら、
>具体名を出していただくと、多くの方にもありがたいです。
ソフトの実名を出していいのかわかりませんが、読んでココというソフト名が既に出て
いるということで…。
独断と偏見になりますが、メディアドライブのe.Typist v.6.0、Panasonicの読取革命
2001は、読み込み先をスキャナーまたはファイルを選択でき、その他、使い勝手が
良かったです。
認識率は、対象となる画像ファイル、使用するソフト等によって変わりますので、こ
れが絶対のおすすめソフトというのは断言できません。
これを受けて、早速やってみた。
「読んde!!ココ」というアイコンがディスクトップに2年ぐらい前からあり、
やってみた。EPSONのスキャナーに付属のソフトだ。
EPSONのスキャナーの使い方が良く分からなかったので、お蔵入りしていたものだ。
「読んde!!ココ」(Yonde.exe)のツールバーの
「ファイル」-「画像ファイルを開く」で.bmpや.tifや.pcxの画像ファイルを読んでくる。
「領域抽出の実行」-「認識パラメータの設定」-「認識処理の実行」でできる。
その前に.jpgや.gifは画像変換フリーソフト(IrfanView32)等で、
「Image 」-「Decrease Color Depth」-「2 Colors(Black/White)」で
白黒画像にしておく必要がある。
保存は「.bmp」、「.tif」、「.pcx」の何れかにする。
ここでは3種類やってみて、「.pcx」が一番ファイル容量が小さい。
参考 元画像と読取文字例
この拡大写真の右の文字を読み取る。
BMP、TIF、PCXの白黒画像にする。
本文
県営牧場からの富士(大泉村)
県営八ヶ岳牧場は、川俣川の東沢と西沢に挟まれ
た高原一帯にある。広さは分場と合わせて約620ヘクタール
にも及ぶ。草原に緑が増す晩春から初夏にかけ、
放牧が始まり、牛がのんびりと草をはむ。そのか
なたに残雪を輝かせる富士がある。
BMP、TIFでの読取判別例
粍営牧場からの富士(大泉紆)
虐九嘗八ヶ島蛤肌場は、川俣川の頁力爪と而山刀八に挟ま机
た高原一帯に」のる。広さは分壕と合わせて▲阿州刑hJ
にも租ぷ。草津に穎か仇環す晩壷Mからmm具にかけ、
W仙竹≠「乃姶蒙ハン、牛丼りのんムUnノとぎ丁をほ計V。フて爪叫打
なたに礁仙雪を輝かせる宅士ぷ什」のるD
PCXでの読取判別例
県営牧場かちの富士(大泉科)
層爪宮八ヶ「告牧場は、川俣川の頁や"と丁四天に挟ま机
亡盲岡原一放叩に」のる。広さは‥冗壕と人□hHせて附■到hさ
にも盈ぶ。章」緑に掩が仇零す陣【+背から¶偲票にかげU、
W肌」祝「コ姶土サ∩ノ、牛丼り爪〃ん叶Unノとぎ丁を{け卜山b フて爪りむ
なたに禁蘭を渾灯せこV富」⊥一か」のるD
もうすこし大きな字なら十分実用になる。
見出し文字の判読はほぼできている。
文字も大きくてはっきりしていればこれだけ読めれば実用になる。
ここでは縦書きだし、紙をスキャナーで読み取った小さいにじんだ字だし。
修正文字候補も出て、対象しながら修正できる。
しかしなんで牛を牛丼と読むのか!!(よけいなことだが)
AI(artificial intelligence:人工知能)も組み込まれているようだ。
あと、CANONのスキャナーとOCRソフト(Typist2)はあるけど、
こちらの方はまだ試していない。
たしか、画像ファイルを読込む機能はなかったと思うが。
「読んde!!ココ」はEPSONのだが、メーカに関係なく使えるようだ。
読取精度の良いものが必要なら、有料のもあるようだけど、
キーナビのソフトウェア検索(このサイトも貴重ですな)
で検索してみたら活字OCR類はあるけど、OCR類は高額のものが多く、
「読んde!!ココ」は貴重なソフトだとわかった。
取りあえず、これなら実用になる。
我がディスクトップ上には自分でも訳の分からないアイコンがいくつかある。
落語にこういうのあったな。いけすのうなぎか何かで古だぬきがいて、
なかなか食い物にならず、「旗本退屈男」という仇名をつけていたとか。
食おうとするとギョロギョロと睨みつけ、
いけすの中を長年逃げまわっていたとかいう話。
何となく削除するには惜しかったいぶし銀ソフトの驚くべき隠し技。
死んどった奴が生き返った。
良かった
キーナビのおかげです。皆さんにもぜひ薦めたい。
私ももう少しこのソフトの研究を継続するつもりです。
● 回答いただいたキーマンのacha様よりの追伸
araicさん、こんにちは
>http://araichi.hoops.livedoor.com/jpgtotext.htm
>ぜひお越し下さい。
>できれば感想などもよろしく。
HPを公開しているとはすごいですね。
自分もいつかはHPを…と思っているのですが、なかなかそこまではいきません。
拝見させていただきました。
サンプルの画像ですが、解像度が72dpiとOCR変換するにはちょっとつらいですね。
一般的にOCR変換するには、対象の解像度が400dpi以上を推奨しているソフトが
ほとんどです。
個人的な意見になりますが、200dpiあれば(原稿にもよりますが)それほど遜色のな
い変換はできると思います。
ただ、100dpiを下回ると認識率は一気に下がるようです。
字の大きさを指摘されているようですが、解像度を重視された方が良いのではない
かと思います。
解像度を上げれば新聞の字もかなりの認識率で変換してくれます。
OCRは完璧なものはないので、いかに修正の手間を減らすかだと思います。
そのためには認識率を上げることは必須となってきます。
あまりにも修正があれば、原本と見比べて修正するよりも、はじめから文字を打ち込
んだ方が早いですからね。
自分の思うままに書かせていただきましたが、結局は使う人がどのような基準で判
断するかだと思います。
一つの意見として参考にしていただければ幸いです。
(返答)
● ありがとうございます。
サンプルの画像の解像度は確かに悪く、認識率が悪いですが、
白黒画像にした字を見ても、相当分かりにくい文字を、
ある程度判別できたので、これは使えると思ったのですが、
全くのどんぶり勘定、感覚的な判断で、本当は何DPIでどう、..と、
データで言われているところはさすがですね。
ところで、画像のDPIが72DPIと、どこで判別できるのですか?
よろしければお教えいただけるとありがたいです。
ピクセルとか画素がいくつとか、ここで今後、
私も客観的な数字で捉えるようにしようと思います。
● ところで、ホームページお誉めいただき感謝しております。
でも、意外に簡単で、絶対お勧めです。
HTML等で何かの文章作成されて、
取りあえず、無料ホームページプロバイダー等にFTPでアップロードすれば、
後は、徐々に更新、充実させて行くだけです。
FTPのアップロードだけが初め少し分かりにくいだけで、
これも、FTPのフリーソフトにID等いくつか設定するだけです。
ライブドアは無料ホームページプロバイダーのトップです。他にも色々ありますが、
取りあえず試されることをお勧めいたします。
ライブドア 無料プロバイダ、無料ホームページ、無料Webメールとは
● ホームページの長所は一杯ありますが、いくつかの推奨点は、
1.メールだと一回限りで、後に残らないという欠点(長所かも)も、
ホームページだと、こうしてページとして残し、広く他にも公開できます。
2.メールだと絵だとか図がないのが普通でやや分かりにくい場合、
ホームページだと、図や写真や色つきでの説明も可能です。
面倒だとか難しいというのは一番初めだけで、問題ないです。
3.いつでもどこでも、時間と場所を選ばない点です。
無料ホームページプロバイダーでは無料メールも使えます。
(追記)「読んde!!ココ」 エー・アイ・ソフト株式会社 03-3376-7122 http://www.aisoft.co.jp/
P.9 [先頭へ] [常に一つ前へ戻る]
〒メール〒araichi@livedoor.com