出版

アフィリエイトリンクまたはスポンサーシップを通じて、ベンダーから収益を得る場合があります。これにより、サイト上の商品配置が影響を受ける可能性がありますが、レビューの内容には影響しません。詳細は利用規約をご覧ください。
多くのビッグデータ導入ではドキュメント管理システムが後回しにされていますが、DMSには大量の非構造化データが保管されています。データアナリストは再考すべきでしょうか?
最も初期の文書管理システム(DMS)は1980年代に登場しました。物理的なファイルキャビネットやPCサーバーストレージを超えて、ネットワーク上に登場し、企業内の複数の人や部門が電子化された膨大な文書にアクセスできるようになりました。
それ以来、文書管理システムは企業のデジタル化を推進する原動力となってきました。これらのシステムは、文書のスキャン、インデックス作成、保存、検索、そして変換を行います。紙ベースの文書や画像をファイルキャビネットや保管室から取り出し、誰もが利用できる広域分散ネットワークへと移行させる上で重要な役割を果たしてきました。
問題は、企業がドキュメント管理をビッグデータ戦略と結び付けているかどうかです。
多くの場合、企業は遅れをとっています。
参照: Microsoft Power Platform: 知っておくべきこと (無料 PDF) (TechRepublic)
構築中のビッグデータリポジトリは、記録システム(SOR)データと、IoT(モノのインターネット)から入力されるデータ、そして外部ソースの非構造化データを統合します。このプロセスでは文書管理システム(DMS)が活用されていますが、ビッグデータ戦略において、DMS内のすべてのデータを最大限に活用するための一貫した取り組みが必ずしも行われているわけではありません。
DMS 側では、ユーザーはデータを検索し、デジタル化して整理しますが、データのクリーニングと正規化、人工知能、機械学習、より高度なアルゴリズム開発などの他のビッグデータ技術はまだ広く使用されていません。
もちろん、ニッチな例外もあります。
こうした例外の一つが、企業の文書管理システムに保管されている膨大な量の文書を精査する法的証拠開示プロセスです。法的証拠開示ソフトウェアの目的は、非構造化文書を分析し、AIと機械学習を用いて、数千もの文書の中から、今後の訴訟に最も関連性の高い文書とそうでない文書を特定することです。
この場合、DMSからビッグデータリポジトリにドキュメントをインポートする必要があるかどうかについて、企業内で長々と議論する必要はありません。ユースケース自体は明確です。
しかし、場合によっては、DMSとビッグデータリポジトリを連携させる十分な理由がないこともあります。例えば、ゲノムシーケンシング実験は、DMSに通常含まれる機能に本当に依存しているのでしょうか?
参照: デジタルトランスフォーメーション: 組織が見逃してはならない 3 つのこと (TechRepublic)
重要なのは、ビッグデータリポジトリにDMSが必要かどうかではなく、検討すべきだということです。データサイエンティストやITデータアナリストがDMSを見落としがちなため、ビッグデータ戦略においてDMSはしばしば異質なものとなってしまいます。
ビッグデータリポジトリに流入する情報の潜在的なソースとして自社のDMSシステムを確実に組み込むには、企業は何をすべきでしょうか?ここでは4つのステップをご紹介します。
- DMS にあるデータの種類を文書化して、ビッグ データ リポジトリに含めるかどうかを評価できるようにします。
- 企業が使用している DMS システムに、ビッグ データ リポジトリへのデータ転送を容易にする完全な API (アプリケーション プログラミング インターフェイス) セットが備わっていることを確認します。
- DMS から受信したデータを取得し、ビッグデータ リポジトリで使用できるように準備できる標準的な抽出、変換、ロードの方法論を開発します。
- ユーザーがアクセスできるように DMS システムにエクスポートする必要があるビッグ データ分析からの出力結果を決定します。
こちらもご覧ください
- アナリティクス:ビッグデータサイエンスをビジネス戦略に活かす(無料PDF)
- 採用キット: データアーキテクト
- 地理空間データはパンデミックや緊急事態の追跡に役立てられている
- Akamai はエッジコンピューティングによりトラフィックを 350% 増加させながらもエネルギー使用量は横ばいに抑えています
- データサイエンティストになる方法:チートシート
- ビッグデータ:さらに読むべき記事

メアリー・シャックレット
メアリー・E・シャックレットは、技術調査・市場開発会社であるトランスワールド・データの社長です。同社設立以前は、金融サービス企業TCCU, Inc.でマーケティング・テクノロジー担当シニアバイスプレジデント、コンピュータソフトウェア企業Summit Information Systemsで製品研究・ソフトウェア開発担当バイスプレジデント、そして半導体業界の多国籍製造企業FSI Internationalで戦略計画・テクノロジー担当バイスプレジデントを務めました。彼女は基調講演者であり、1,000本以上の論文、調査研究、テクノロジー関連の出版物を出版しています。