ヘルプファイルを全文検索するには?

●MS-WordやMS-Excelなどのアプリケーション画面の上段右端のヘルプメニューを選ぶとヘルプ情報が表示されます。このヘルプ情報の元になるのがヘルプファイルと呼ばれるものです。ヘルプファイルにはリッチテキストファイルから作成される Win ヘルプファイルとハイパーテキストから作成されるコンパイルド HTML ヘルプファイル(略称 HTML ヘルプファイル)の二種類があります。前者のファイル拡張子はHLPで、後者のファイル拡張子はCHMです。後者は最近出現してきたもので現時点ではまだまだ前者が主流です。しかし Windows 98 以降の OS 用ヘルプや Office 2000 のヘルプは HTML ヘルプファイルが主体になっています。

●多数のヘルプファイルを一挙に全文テキスト検索するにはどうすれば良いのでしょうか? 幸い HTML ヘルプファイル(拡張子 .chm)については AnoSoft から最近リリースされた全文テキスト検索ソフト WideGrep の最新バージョン(詳細はこちら)で一挙に検索することが可能になりました。しかし Win ヘルプファイル(拡張子 .hlp)に関しては、全文検索できるソフトは今のところ市場には見当たりません。そこで Win ヘルプファイルを全文検索するには、テキスト検索ソフト WideGrep などで読めるファイル形式(テキストファイルやリッチテキストファイル)に事前に変換しておき、それを検索ソフトで一挙に検索するようにします。ここでは Win ヘルプファイルをテキストファイルやリッチテキストファイルに変換する方法や、 WideGrep をお持ちでない方のために敢えて HTML ヘルプファイルを ハイパーテキストファイルに変換する方法を紹介いたします。

-----------------------------
目次

Win ヘルプファイル

Win ヘルプファイルの特徴
Win ヘルプファイルのトピック単位にコピーアンドペースト
Win ヘルプファイル単位にテキストファイルに変換
複数のWin ヘルプファイルをテキストファイルに一括変換

HTML ヘルプファイル

HTML ヘルプファイルの特徴
HTML ヘルプファイルのトピック単位にコピーアンドペースト
HTML ヘルプファイル単位にハイパーテキストファイルに変換

-----------------------------

Win ヘルプファイル

Help Workshopと称するMicrosoft社製ソフト(HCW.EXE)を使ってリッチテキストファイル(拡張子RTF)をコンパイルすると Win ヘルプファイルができあがります。ファイル拡張子は hlp です。

Win ヘルプファイルの特徴
●Win ヘルプファイルの内部はバイナリ-形式でありヘルプビューア(Winhelp.exe)を使わないと通常は読めません。特に圧縮指定でコンパイルされたWin ヘルプファイルはバイナリ-ファイルとして内部をテキスト検索しても殆ど無意味な情報しか得られません。

Win ヘルプファイルのトピック単位にコピーアンドペースト
●原始的な方法としてはヘルプを表示させ、トピック毎にテキストエディター(例えばNotepad)にコピーアンドペーストしてテキストファイルを作る方法があります。ちょっと大きなヘルプファイルでトピック数が増えると非常に手間が掛かります。何よりもこの単純作業を延々と繰り返すのは精神的苦痛以外の何物でもありません。

Win ヘルプファイル単位にテキストファイルに変換
●Win ヘルプファイルを一旦リッチテキストファイルに変換してからテキストファイルに変換する方法があります。ドイツ人Herd氏が開発したシェアウエアー HLP2RTF.EXE を使用すれば簡単に Win ヘルプファイルをリッチテキストファイルに変換(逆コンパイル)することができます。これをMS-Wordに読みこんでテキスト形式で保存すればよろしい。都合2ステップで Win ヘルプファイルからテキストファイルに変換できることになります。
⇒HLP2RTFの詳細はこちら(英文)
⇒HLP2RTFのダウンロードはこちら
●一本二本の Win ヘルプファイルならほんの数分で変換できるでしょう。ただし何十、何百の Win ヘルプファイルを変換する場合は大仕事になるものと心得てください。

複数の Win ヘルプファイルをテキストファイルに一括変換
●近々AnosoftからリリースされるHLP2TXT.EXE(仮名)を使用すれば複数の Win ヘルプファイルをテキストファイルに一括変換できます。大量のヘルプファイル(HLP)を変換処理するときにはとても便利になる予定です。

HTML ヘルプファイル

HTML Help Workshopと称するMicrosoft社製ソフト(HHW.EXE)を使ってハイパーテキストファイル(HTML ファイル)をコンパイルすると HTML ヘルプファイルができます。この HTML ヘルプファイルはシェアウエアソフト WideGrep を使えば簡単かつスピーディに複数のファイルを一括してテキスト全文検索できます。したがって WideGrep をお持ちであれば以降の記事を読む必要はありません。ここでは WideGrep をお持ちでない方のために、敢えてHTML ヘルプファイルをハイパーテキストに変換する方法について説明します。

HTML ヘルプファイルの特徴
●この HTML ヘルプファイルの内部もやはりバイナリ-形式でありヘルプビューア(HH.EXE)を使わないと通常は読めません。

HTML ヘルプファイルのトピック単位にコピーアンドペースト
●原始的な方法としてはヘルプを表示させ、トピック毎にテキストエディター(例えばNotepad)にコピーアンドペーストしてテキストファイルにする方法があります。ただしコピーが出来ないようになっているヘルプファイルも存在します。また、大きなヘルプファイルでトピック数が増えると非常に手間が掛かります。何よりもこの単純作業を延々と繰り返すのは精神的苦痛以外の何物でもありません。

HTML ヘルプファイル単位に HTML ファイルに変換
●前記のHTML Help Workshop(HHW.EXE) を利用すれば HTML ヘルプファイルを ハイパーテキストファイルに逆変換できます。これには次の操作を行ってください。
●HTML Help Workshopの「File」メニューのサブメニュー「Decompile」を選択して下さい。するとDecompileダイアログが表示されます。ここで入力枠「Destination folder」に逆コンパイル後のファイルを格納するディレクトリを、入力枠「Compiled help file」に対象のHTML ヘルプファイルのファイル名を入力すればよろしい。逆コンパイル後 Destination folderにはソースのハイパーテキストファイルと図形ファイルなどが格納されます。
●次に HTML Help Workshop で逆コンパイルされたハイパーテキストファイルをインターネット エクスプローラに読み込んでテキストファイル形式で保存すれば テキストファイル が出来あがります。もっともハイパーテキストファイルはトピック毎に作られており、逆変換すればトピックの数だけハイパーテキストファイルができることになります。数千個のハイパーテキストファイルになることも珍しくあります。従って先ほどのカットアンドペースト方式よりも手間と時間が掛かることになるかもしれません。従ってHTML Help Workshopを利用する場合はハイパーテキストファイルが検索できるソフトを使うことを前提にして、テキスト変換までは行わないのが得策でしょう。ハイパーテキストファイルに変換するだけなら HTML ヘルプファイル一本当たり数十秒から数分で作業は終わるでしょう。

おことわり
当初 AnoSoft により計画されていた HTML ヘルプファイルの一括テキスト変換ソフト chm2txtWideGrep の HTML ヘルプファイル検索機能の出現によりその存在意味が薄れたので発売は見送られております。

AnoSoftとWideGrepのミラーサイト一覧
   anosoft.org
   anosoft.html.xdomain.jp
   anosoft.world.coocan.jp
   homepage2.nifty.com/AnoSoft/

トップページに戻る

Written by AnoSoft, 4/14,2016.