ブログ方法・手法

文書管理で属性情報検索と全文検索の見本サンプル ‘分かち書き’とは?

CAD conversion

どんな会社でも文書管理でやりたいことは「大量の文書データをしっかり保管し、必要な時に早く見つけたい」ということではないでしょうか?その中でも特に「検索をして素早く見つけたい」という思いは強いはすです。そこで文書管理の検索時の2つのポイント、属性情報検索と全文検索を見本サンプルでわかりやすくご紹介します。 ‘分かち書き’という耳慣れない検索用語もご説明いたします。

文書管理システムに求められる役割 「早く探したい!」

文書管理システムで求められる役割として大きく以下の2機能に分けられます。

1.大量の文書データを記録、保管しておくこと
日々の業務運用は、いろいろな文書をもとに活動が行われています。どんどん集まってくる文書を利用するには、ファイリング手順に従って整理し、紙の状態で保管するための保管場所が必要です。

文書管理システムでは紙の文書をデジタル化して保管することになります。文書管理システムに記録・保管し後々の検索で取り出しやすくする目的で文書データとは別に属性情報を登録します。属性情報を登録して様々な条件で目的の文書を検索しやすくしています。

2.蓄積した文書データから必要な文書を探し出すこと
以前作成した見積書をそのまま利用して新しい見積書を作成したりする作業は、日常的な業務でよく行われます。「必要な時に必要な文書を取り出したい」誰でもこんな風に思うでしょう。目的に合った文書を大量に保管された文書から探し出すことは大変手間もかかる作業です。

よく使われる検索機能のひとつに、属性検索や全文検索があります。各々に関して見本・サンプル例を解説していきます。

文書管理システムでの属性情報の付与 見本・サンプル1

従来の紙で運用されている運用でも、日々の業務で出てくる書類を一定のルールに従い分類・整理しファイリングしています。文書管理システムを利用してデジタル化運用を行う場合も、一定のルールに従い分類・整理し管理していくことになります。

文書管理システムへ文書データを登録するときに、ファイル名称に加えて属性情報を付与して登録します。文書管理システムに登録された文書データやフォルダに属性情報を付与することで、さまざまな文書データの管理が可能なります。属性情報はテキスト型、数字型、日付型などの属性値で登録でき、登録した属性情報を検索して目的の文書データを見つけます。
 
属性情報を付与することで、登録した文書デー多を必要なときに、いつでも利用できるようにします。どのような文書を保管し、どう活用するか?どんな情報で文書を検索するのか?を考えることが属性情報を決める鍵になります。

「過去の製品検討会議資料を参考に、会議に向けた資料を用意したい」
このような場合、以下のような属性情報を設定すると探しやすいのではないでしょうか。
     会議日時
     議案(テーマ)
     商品カテゴリ
     対象商品

また、登録した文書データを計画的に捨てる運用も必要になります。文書データを整理し、保存期間を経過した文書データ、重複保存している文書データなど廃棄できるものは廃棄します。

保管期限が決まっている文書は、以下のような属性情報を設定すると管理しやすいのではないでしょうか。
     文書登録日
     文書更新日
     分類
     保存期間

必要なものだけを保存して効率的な運用を図るようにしましょう。

全文検索での文字列入力「わかち書き」 見本・サンプル2

Windowsのエクスプローラーで検索を行うと、通常ではファイル名称のみで検索されます。
オプション設定で「全文検索」機能も用意されており、ファイル名称が判らなくてなっても文書内容を覚えていれば、関連するキーワードからファイルを探し出すことが出来ます。

全文検索は、ファイル名称での検索や単独文書内の文字列検索とは違って、複数の文書データを対象に、文書データに含まれる文書全体を対象に検索することになります。文書管理システムの全文検索も同様に、探したい文字列を入力して目的の文書データを探し出すことが可能です。

全文検索は当たり前の機能なのですが、対象の全文データが大容量だと、処理が遅くなるという課題があります。これを解決し検索を早くできるように全文検索専用の仕組みが組み込まれて動いています。

全文検索用の仕組みはいくつかありますが、文書管理システムのように大量の文書データを記録、蓄積する場合の例をご紹介します。例えば、蓄積されている文書データから事前に‘本の索引’のように言葉と記載ページを調べて、検索に必要な索引をつくっておき高速に実行します。

全文検索を行う場合の検索条件入力を「分かち書き」で入力すると検索しやすくなります。

・分かち書き
日本語の「私はペンを持っています」が 英語では「I HAVE A PEN」のように言葉の区切りに空白を入れる書き方になります。このように、単語と単語の間に空白が入る書き方が、分かち書きです。

日本語の漢字仮名交じり文書では、分かち書きをしないのがふつうです。
  
隣の客はよく柿食う客だ。(べたがき)
TONARI NO KYAKU HA YOKU KAKIKUU KYAKUDA(単語での分かち書き)
分かち書きの目的は、読みやすさです。
読みやすい言葉は、検索のしやすさにもつながります。

検索条件の文字列入力も、
「私はペンを持っています」を分かち書きで
「私」、「ペン」、「持っている」の3つの単語に分けて入力します。

分かち書きして単語するというのが、ピンと来ないかもしれません。
具体的に、以下のような文書があったとします。

 文書1 「白色/の/犬/が/好き」
 文書2 「白色/の/猫/が/嫌い」

これらの文書から名詞と動詞に絞って全文用に索引を作成するとなると以下のようになります。
「白色」文書1,文書2
「犬」 文書1
「猫」 文書2
「好き」文書1
「犬」で検索すれば文書1しかマッチしませんし、「白色」で検索すれば両方ともマッチします。文章全体で検索するよりも「分かち書き」で検索した方が見付かり易くなります。  

まとめ

文書管理システムで業務効率を向上させるためには、文書の属性情報を定義することが必要になります。 まずは、目的に応じた分類方法や情報整理を行うところからはじめましょう。

保管されている大量の文書データから、目的の文書にすばやくアクセスするには管理に必要な情報を属性情報で紐づけて登録することが重要です。全文検索などの検索方法を利用する場合、検索対象になる文章をまずバラバラにしましょう。そしてその中から検索させる単語を選ぶ方法で、検索にかかる時間を短縮することができます。

当サイトでは、「D-QUICKシリーズ」についてわかりやすく説明している資料をご用意しております。安心・安全に図面・文書管理を行うためのポイントが理解できる資料になっています。ぜひ、ダウンロードページより資料をご覧ください。

まだ情報収集レベルで、学びを優先されたい方
「図面・文書管理で困ったときのハンドブック」~製造業・完成図書・テレワーク・クラウド、すべての解決策をお見せします~

システムやクラウドサービス等の具体的な解決策を探している方
図面・文書管理システム「D-QUICKシリーズ」基本ガイドブック

より詳しい事例を知りたい方
「製造業の図面・文書管理 自治体の完成図書管理 D-QUICK導入事例集」

「方法・手法」の関連ブログ