こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

解決済みの質問

スキャナーの基本知識

スキャナーを使うに当たって、基本的な知識を、お教えいただけませんか?

本をスキャナーに掛けると、画像ファイルとして保存されるのですね?
それは、何ファイルというのですか?
PDFファイルやJPEGファイルとどう関係するのですか?
また、文字検索や編集の為に、OCR変換するのは、上記のどのファイルを、OCR変換済ファイルに変換するのですか?

キャノンのScanSnap iX1500を購入して、教科書や問題集をスキャンして、iPadなどで利用したいと思っているのです。
このスキャナーは、変換されたファイルがいきなりPDFやJPEGファイルになっているようですが…。それをOCR変換するには如何すれば良いのでしょうか?
初心者ですので、知っておいたら良い関連事項も、ご指摘戴けるととても有り難いです。

投稿日時 - 2019-01-12 09:31:27

QNo.9576854

困ってます

質問者が選んだベストアンサー

ご存じの通り、スキャナーは画像、解像度の点毎に色として、色と明るさですが、記録します。コンピューターですから、全ては単なる点でしかなく、文字コードのような意味は持ちませんから、点の集まりである絵として認識されます。
その点のデータがPCに取り込まれ、PCにインストールされたソフトウェア、ここではいわゆる画像ソフトですが、が絵のデータとして認識し、任意のフォーマットで記録する事ができます。自動的にjpegになるわけでもなく、単にデフォルトの設定がそうなっているからjpegに「圧縮」して保存しているだけです。
圧縮して劣化させたくないならBMPなどの無圧縮方式も選べるはずです。
その設定に応じて、画像ファイルがjpegだったりbmpファイルになったりします。
PDFは画像ファイルとは少し違います。アドビが開発したソフトですが、画像と文字コードを混在させて一体化したというような方式です。単に画像ファイルではなく文字コードも含まれるので、その部分だけテキストデータで拾う事もできなくはありません。ただ、一般の画像ソフトだとテキストコードにはならず、文字も画像のままだろうと思います。単にPDF形式になっているだけという事。

単なる画像になっている文字の絵を、テキストデータにするのがOCRソフトです。画像認識ソフトとも言えますが、単なる点の集まりでしかないデータを文字として認識させるのはなかなか難しく、高価なソフトでないと認識率が低いです。もちろん、元の画像データの質も大いに関係します。あくまで点ですからゴミなども拾ってしまい、人間が認識するような訳にはいかないのです。
活字はだいぶいいですが、手書きやくせ字などは全然読めなかったりします。達筆の草書を読むようなもんですね。

OCRソフトは各種出ており、数百万からフリー、スキャナにおまけで付いている場合も多いです。
一旦、画像ファイルにし、それをOCRソフトに読み込ませる事で、ある程度は、、テキストデータが作れます。誤変換の部分は手入力で直すしかありません。
元の画像が鮮明、色などなく、コントラストがはっきりしている活字なら、かなりの率で正確に変換されます。100%という事はまず有り得ないと思います。自動翻訳ソフトを思い浮かべていただかれば、おおよそのニュアンスは掴めるかと。

投稿日時 - 2019-01-12 10:08:54

ANo.1

このQ&Aは役に立ちましたか?

0人が「このQ&Aが役に立った」と投票しています

回答(5)

ANo.5

tasatさん キャノンではなく、富士通のix1500の間違いですよね。 それは読み込み速度は確かに速いですが、オートフィード方式ですよ。 よって、教科書をばらばらにしなければ読み込ませる事は出来ませんよ。 それでは困ってしまうでしょう。 富士通の製品で教科書や参考書の読み取りに最も適しているのはSV600でしょう 3秒/枚の読み取り速度はそれ程、速くないですが、非接触型ですから、原稿を傷めないで、読み取る事が出来ますし、又、複合プリンタで使用されるフラットベッドスキャナーよりは速いし、きれいに読み取れます。 只、結構、高価なんですよね。 (でも私は、これは使った事はありません。 私は新聞の囲み記事を読み取る用途等に使いたいので、そのような使い道にはキングジムのマウスタイプのスキャナが向いているんですよね。 よく考えて一番目的に適したものを選んで下さいね。

投稿日時 - 2019-01-12 20:58:03

お礼

スキャナーのご紹介有り難うございます。
キャノンではなく富士通でした。

投稿日時 - 2019-01-13 08:10:22

ANo.4

>本をスキャナーに掛けると、画像ファイルとして保存されるのですね?
>それは、何ファイルというのですか?
>PDFファイルやJPEGファイルとどう関係するのですか?
>また、文字検索や編集の為に、OCR変換するのは、上記のどのファイルを、OCR変換済ファイルに変換するのですか?

本体の設定で保存方法を切り替えます。詳しくは、取扱説明書を熟読してください。これは何もドキュメントスキャナだけではなく、WordでもPowerPoint、Excelなどでもそうですが、保存するときにどのファイル形式で保存するのか選ぶことができます。

画像で例えるならば、あなたがWindows 8.1以下のOSを使っているのであれば、それに付属している「ペイント」ソフトを起動して保存項目を見れば意味がわかると思いますよ。「PING」「JPEG」「BMP」「GIF」「その他(ユーザー指定による保存)」と選ぶことができます。


>キャノンのScanSnap iX1500を購入して

キヤノンにScanSnap iX1500はありませんが・・・?


>このスキャナーは、変換されたファイルがいきなりPDFやJPEGファイルになっているようですが…。それをOCR変換するには如何すれば良いのでしょうか?

ですので、この質問に答えることはできませんね。あなたの思っているドキュメントスキャナの公式ホームページか取扱説明書をダウンロードするなりして研究してください。大抵は、付属のソフト(ダウンロードする必要があるメーカーもありますし、ソフトが付属しない機種もあります)である程度は可能です。


>初心者ですので、知っておいたら良い関連事項も、ご指摘戴けるととても有り難いです。

他の方も指摘していますが、この手のドキュメントスキャナは、本をスキャンしようとすると本を一枚づつにバラさなくてはなりません。要するに、教科書であれば教科書の1ページを切り離して1枚用紙にすることになります。

それが無理なのであれば、Plustekの「OpticBook 4800」の様なブックスキャナを買うか、富士通の「ScanSnap SV600」の様な書画カメラ型のスキャナを購入したほうがいいでしょうね。それ以上に高度なことをしたいというのであれば、巷にはいろいろ編集ソフトなりが売られています。個人的には膨大な時間をかけて文字検索などできるPDFを作り上げる時間よりも、真面目に従来どおりの勉強をしたほうがいいとは思いますけれどもね。

投稿日時 - 2019-01-12 12:42:09

お礼

有り難うございます。

投稿日時 - 2019-01-13 08:14:23

ANo.3

>教科書や問題集をスキャンして、iPadなどで利用したいと思っているのです
そんな面倒なことをするよりも、Ipadでスキャンしたらいいのでは。

投稿日時 - 2019-01-12 10:50:57

お礼

有り難うございます。

投稿日時 - 2019-01-13 08:15:50

ANo.2

スキャナーにはある大きさの「紙」であることが必須です。
なので、本にしたものは読み込めません。
教科書や問題集はバラバラに切り裂いて「紙」にするしかありません。
学校や権利関係に問題がなければあなたの好きにして構いませんが。

投稿日時 - 2019-01-12 10:40:50

お礼

有り難うございます。

投稿日時 - 2019-01-13 08:15:23

あなたにオススメの質問