数週間前、私は MLW20 の「製造業ブレイクアウトセッション」に参加していました。そこで交わされていた、「企業内ナレッジを促進しインダストリアライズするための最適なデータ統合プロセス」に関する議論に私は魅了されました。これはいわば、「データをナレッジに変換するためのプロセス」に関する議論です。
講演者(デュポン、米空軍研究所、イートン、シェブロンなど)は、全員、これを企業レベルでシステマティックに実現するには「セマンティックデータ」が重要だと述べていました。
このブログを今読んでいる方は、すでにセマンティックデータについて聞いたことがあることでしょう。しかしデータをナレッジへと変換する際に、セマンティックデータが極めて重要な役割を担うことはご存じないかもしれません。
本ブログでは、セマンティックデータがデータトランスフォーメーションの中核となる理由に加えて、セマンティック技術によりプラットフォーム、アプリケーション、製品の価値が向上した実例をいくつかご紹介していきます。
「プロジェクトの成功と失敗の分かれ目となるのは、利用できるナレッジの量ではなく、それが発見可能になっているかどうかなのです」
アメリカ航空宇宙局(NASA)
セマンティックデータの役割と重要性を理解するには、データをナレッジへと変換するステップの概要を確認しておく必要があります。
これらのステップはビジネス環境では、ビジネスインテリジェンス(BI)あるいはナレッジマネジメント(KM)のプロセス/システムと呼ばれることが多いです。通常KMにはBIの活動が含まれており、それ以外にもナレッジの創出や組織全体におけるナレッジ共有に関連する活動があります。
BIやKMに分類されるエンドユーザーアプリケーションは多様です(検索、データビジュアライゼーション、データマイニング、OLAP、コンテンツ管理など)。ただし、こういったアプリケーションの価値は、データのキュレーションステップ(上記#2)からアプリケーションに渡されるデータの質に大きく依存します。
データをコンテキスト化することにより、情報の発見が楽になります。また情報の方がこちらを発見してくれるようになります。「データのディスカバリー」ステップ(上記#3)の前にデータにコンテキストを与えていないと、必要なデータを検索するのに長い時間がかかってしまい、有用な情報やインサイトを生み出すための時間が減ってしまいます。
データディスカバリーの効率性は、生産性に大きく影響します。ある調査によると、ナレッジワーカーはただ情報を探すためだけに20%から30%の時間を費やしています。これを金額に換算すると一社当たり数億円規模の生産性が失われていることになります。
コンテキスト化されたデータのこのような需要に応えるために、データディスカバリーやインサイトを改善する根幹としてセマンティックデータのアプリケーションが必要となってきます。
セマンティックグラフ技術(単に「セマンティック」とも呼ばれます)は、複雑な関係性をモデリングしてコンピュータがコンテキストを理解できるようにします。これにより、データレイヤーにさらにインテリジェンスがもたらされます。
セマンティックにより、分断されていたファクト間の関係の定義やこれらのファクトへのコンテキストの提供に関する標準フォーマットがもたらされます。セマンティックデータの標準的な表現方法としてRDFトリプル(Resource Description Framework)があります。また標準的なクエリ言語は SPARQL です。
トリプルによりナレッジグラフの繋がりが形成され、検索やディスカバリーが改善されます。たとえば、ロンドンを検索している際にロンドンに関するファクトが提示されたり、ある会社を検索している際にその会社のオーナーや支店に関するファクトが表示されたら便利でしょう。
また重要なこととして、セマンティックでは推論ができます。推論は極めて強力なメカニズムで、データベース内のファクト間の関係を自動的に想定できるようになります。これによりこれまで知らなかった関係性が明らかになることがあります。
セマンティックには、データおよび情報のディスカバリーを大幅に改善できる強力な能力があり、生産性の向上、リスク削減、インサイトの促進が実現されます。
MLW20 の製造業セッションでは、セマンティックによるデータディスカバリーの改善や、従来よりスマートなアプリケーションの提供といった内容が取り上げられました。ここではそのうちのいくつかをご紹介します。
ボーイングは最大手の航空宇宙機器製造会社です。MarkLogic のセマンティックでデータの一元化、ガバナンス、保護を実現し、社員、パートナー、顧客が安全にアクセス・共有できるようにしています。またボーイングはMBSE(Model-Based Systems Engineering)を実践しています。MarkLogic を使って、安全かつ極めて拡張性の高い方法でデータのディスカバリー、関係付け、共有、管理を行うことで、システム開発のライフサイクルを改善しています。
このユースケースの詳細については、ボーイングのビデオをご覧ください。
デュポンは200年以上の伝統を持つ科学企業で、栄養食品、バイオテクノロジー、電子機器、交通、安全装備、建設といった多様なビジネスポートフォリオを有しており、コーポレートデジタルサービスのビジョンおよびロードマップをMarkLogicを使って提供しています。デュポンはMarkLogicで製品とマーケットインテリジェンスを捕捉・統合し、「加速されたインサイト」を提供することで、競争力のあるマーケティング、製品開発、テクニカルサービスをサポートしています。
このユースケースの詳細については、デュポンのビデオをご覧ください。
米空軍研究所(AFRL)は、米空軍資材コマンドが運営する科学研究機関で、MarkLogic 上に HyperThought™ データ管理プラットフォームを構築しています。これはエクサバイト規模のデータを700人の科学者・エンジニアおよび数千人の外部協力者が発見可能かつ安全に共有可能できる、拡張性のあるアジャイルかつ柔軟なプラットフォームです。
このケースの詳細については、米空軍研究所のビデオをご覧ください。
MarkLogic では、豊富な機能のデータベースでデータを高速で効率的に統合します。また、MarkLogic のビデオ、データシート、ブログなどをご参照ください。
エド・ダウンズは、MarkLogicでカスタマーソリューションマーケティングを担当しています。公共機関や民間企業向けに大規模なビッグデータプロジェクトや業務および分析ソリューションを提供してきた豊富な経験を生かし、MarkLogicプラットフォームの認知度の向上と採用の促進に取り組んでいます。
より優れた業務アプリケーションやウェブサイトの開発に役立つ、ニュース、情報、チュートリアルをご案内します。
The specified form no longer exists or is currently unpublished.