第521夜:オンラインOCR(Online OCR)の紹介


ずいぶん以前に、市販のOCRソフト(「読取革命」など)をいくつか使っていました。 しかし、最近は全く使っていません。その間にOSも変わったので、当時のOCRソフトは今は使えない気がします。 そもそも、今のPCにOCRソフトはインストールしていませんし、パッケージもどこかにいってしまいました。 PDFをワードやエクセルに変換する機能については、ソースネクストの「いきなりPDF Complete」というソフトを持っているので、そのOCR機能で可能となっています。 しかし、「いきなりPDF Complete」にはJPEGなどの画像から文字情報を読み取る機能はついていません。

 今回、JPEGになった表をエクセル形式ファイルに変換したくて、フリーソフトを探してみました。 すると、「Online OCR」というフリーソフトというか、フリーサイトを見つけました。 無料で利用できますが、無料だと制限(読み込むファイルの容量に)があります。 しかし、数個の画像を読み込むだけであれば、問題ありません。 そこにアクセスして、目的のJPEG画像を選択し、言語として、「Japanese」を選び、出力として、「xlsx」を選びます。 すると、結構正確に読み取ってくれました。 (もとになったJPEG画像は8ビット白黒、150bpsでスキャンしたものです。) (OCRをかける前に、フォトショップでレベル補正をかけて、背面を白に近づけ、文字とのコントラストを高めています。) ソフトを購入したり、インストールしたりしなくてもすむので、おすすめです。

 話は変わりますが、英和や和英翻訳も同じようなフリーサイトで行なったことがあります。 大昔に、「こりゃ英和」とか、「Logo Vista」 (けっこう高価だった。)という翻訳ソフトを持っていましたが、 これらのソフトもどこかに行ってしまいました。 翻訳機能とOCR機能については、無料で何とかなる時代みたいです。


ホームへ戻る INDEXへ戻る 1つ戻る 1つ進む