2022年09月17日

赤入れの手書き文字をGoogleレンズでテキストにする

DTP作業者にとっての難易度 ★☆☆☆☆(1)

私が修正作業で最も面倒だと感じるのは校正紙(PDF)に書き込まれた手書き文字をテキスト化する作業です。キーボードで入力する以外に方法はないかとiPhone+Googleドキュメントの音声入力(なかなか便利でした)も試しましたが、最近それよりも更に使えるものに出会いました。それがGoogleレンズです。GoogleレンズはGoogle Chromeが入ったパソコンがあればすぐに使えます。

作業の手順(パソコンで完結)


@PDFのスクリーンショット(必要な箇所のみ)を撮り、画像として保存します。

002.pngAGoogle Chromeで画像を開き、右クリックで「Googleレンズで画像を検索」を実行するとウインドウが左右に分割され、右側にも画像が表示されます。


005.png右側に画像が表示されない場合は右側上部「Google Lens」ロゴ右側の別ウインドウで開くマークをクリックします(こちらのほうが動作は安定している印象です)。


012.pngB「テキスト」をクリックします。


013.pngC「テキストをすべて選択」をクリックします(画像上をドラッグして選択することも可能です)。


025.pngD「コピー」をクリックします。これでクリップボードにテキストが記憶されます。


Eテキストエディタにペーストし、画像と見比べて必要に応じて修正します。



作業の手順(パソコン+iPhone)


校正紙が現物(紙)の場合、いちいちスキャンするのは面倒です。iPhoneに「Googleアプリ」をインストールしておけば校正紙を撮影し、認識したテキストをパソコンに転送することが可能です(その他のスマートフォンでも使えるようです)。

@202.pngiPhoneのGoogleアプリを起動し、カメラマークをタップします。

201.pngA「テキスト」をタップします。


207.pngB撮影ボタンをタップします。


204.pngC「画像の中にテキストが見つかりました」と表示されたら「すべて選択」をタップします(ドラッグ選択も可能)。


205.pngD「パソコンにコピー」をタップします。

※あらかじめパソコン側でGoogle Chromeを起動しておく必要があります。


206.pngEパソコンを選択するとテキストがパソコンのクリップボードに転送されます。


Fパソコン側でテキストエディタにペーストし、必要に応じて修正します。



私の感想


Googleレンズは文字形状だけでテキストを認識しているのではなく、文脈からテキストを分析・調整しているような印象で、かなり精度が高いと感じます。文脈からは判断しにくい数字などが省かれるケースなどはありますが、これまで試したOCRとは全く違う「使えるツール」です。機会があれば、一度試してみてはいかがでしょうか。
posted by 照山裕爾 at 04:31| Comment(2) | TrackBack(0) | InDesign-書式・スタイル | このブログの読者になる | 更新情報をチェックする

2022年01月24日

箇条書きの番号と記号をテキストに変換するスクリプト【InDesign】

DTP作業者にとっての難易度 ★☆☆☆☆(1)
取引先から「InDesignデータからMicrosoft Wordデータを書き出してほしい(体裁はアバウトで構わない)」と言われることが時々あります。この場合、InDesignデータからRTFテキストを書き出し、Wordでスタイルを調整してdocx形式で保存……という作業をおこなうのですが、いくつか問題になることがあります。その1つが「InDesignの箇条書き自動番号がRTFテキストに反映されない」ことでした。

※Word側の段落スタイルで段落番号を設定することもできますが、自動番号のリセット箇所は反映されないという問題があります。これを確認・処理するのは大変ですし、ミスが起こる可能性も高く気が進みません。


このため、通常はInDesign上で全テキストを選択して「書式 > 箇条書きリスト > 箇条書きをテキストに変換」を実行して自動番号部分をテキスト化してからRTFテキストを書き出すことにしています。しかし表組み、脚注、後注は個別に処理する必要があり面倒でした。そこで本文、表組み、脚注、後注を一気に処理するスクリプト(とても簡単なもの)を作成しました。以下、動画をご覧ください。

ドキュメントに変更を加えるスクリプトなので、かならずバックアップをとってからお試しください。
サンプルデータはこちら《2022_0124a.zip》です。
posted by 照山裕爾 at 19:23| Comment(0) | InDesign-書式・スタイル | このブログの読者になる | 更新情報をチェックする

2021年05月18日

InDesign/配置ドキュメントの文字を検索するためのスクリプト

DTP作業者にとっての難易度 ★☆☆☆☆(1)
InDesignドキュメント(※1)に他のInDesignドキュメント(※2)を配置した場合、基本機能では配置ドキュメント内の文字までは検索できず用語統一などの際に不便です。今回はこれを解決するためのスクリプトを書いてみました。

※1/ここでは「レイアウトドキュメント」と呼びます。

※2/ここでは「配置」ドキュメントと呼びます。


以下、動画をご覧ください。

準備:「検索と置換」ダイアログの設定

レイアウトドキュメントを開き「検索と置換」ダイアログの「正規表現」で「検索文字列」を設定します。

※「置換文字列」は設定してもしなくても構いません。スクリプトでは使用しません。

※「検索形式」を設定した場合は検索に反映されます。ただし段落スタイルや文字スタイル、スウォッチ、フォントなどはレイアウトドキュメントで使用しているものしか選択できませんのでご注意ください。

※各種検索オプション(「ロックされたレイヤーおよびロックされたオブジェクトを含める」など)はどのように設定しても構いません。スクリプトでは実行前の設定内容を記憶した後、一時的に全設定をオンにして検索を行います(配置ドキュメント側でロックされているようなケースでも検索できるようにするため)。そしてスクリプトの最後で実行前の設定に戻します。


スクリプトの実行:対象文字列が含まれるファイルをすべて開く

スクリプト「search_importedPages_0000.jsx」ではレイアウトドキュメントのリンクパネルに表示される各ファイル(拡張子が「.indd」のファイルのみ)について以下の作業をおこないます。
@ファイルを開く→A開いたドキュメント内を検索する→B1件もヒットしない場合はファイルを閉じる(ヒットした場合は開いたままにする)。
スクリプトが終了した時点では検索文字列が含まれたファイルだけが開いた状態になっています。

※本スクリプトはレイアウトドキュメントにも配置ドキュメントにも変更を加えません。


スクリプト実行後の作業:検索と置換

検索対象を「すべてのドキュメント」とした上で検索と置換を行います。正規表現の設定によっては「すべてを置換」では思わぬ箇所まで置換してしまうこともあります。このような場合は1件ずつ確認しながら進めるのが良いでしょう。

※スクリプト実行後、検索オプションは実行前の設定に戻っています。一部がオフになっていて検索されない文字列があるかもしれませんので注意してください。

※検索オプションの設定に関わらず、ロックされたレイヤー上の文字列などは検索できても置換はできません。置換する必要がある場合はロックを解除しましょう。



ご使用になる場合は十分にテストをするようお願いします。
サンプルデータはこちら《minimum_2021_0516d.zip》です。
posted by 照山裕爾 at 05:09| Comment(0) | InDesign-書式・スタイル | このブログの読者になる | 更新情報をチェックする