エンタープライズデータの利用を合理化
このたび、MarkLogic用Tableauコネクタの提供が開始されたことをここに喜んで発表いたします。これはTableauのフル機能に素早く、容易に、リアルタイムで接続できるもので、Tableauコネクタの「拡張ギャラリー」から提供されます。これにより、MarkLogicの統合/検索/ガバナンス/ビルトインのキュレーション機能、およびTableauのダイナミックかつ視覚的な分析とレポーティングを併用することで、データから価値を生み出せるようになります。
課題:従来の分析手法では全体像が得られない
組織において分析は極めて重要な役割を担っています。しかし今日、従来のような構造化データの分析だけでは不十分です。どんどん変わり続ける非構造化データから、より深い知見を得ることも重要なのです。往々にして、これが大きな課題となっています。
- データ集約とデータ利用の断絶 データのアジリティを実現するのは容易ではありません。実際のところ、57%の組織は適切なデータへのアクセスが遅い/うまくいかないことから派生する問題に苦しんでいます(出典:Exasol、「2019 Data Decisions Survey」)。ソースデータを読み込み/抽出/変換するためのスキーマを作るデータモデリングには、多くの作業が必要です。将来必要になるようなソースデータは無視され、それを使いたくなった時点で、時間のかかるデータモデリングを最初からやり直す必要があります。さらに悪いことに、今日のソースデータはリレーショナルなものだけではありません。これまで集められてきた非構造化データには、価値のある情報が埋もれています。データサイロが増殖した結果、ビジネスアナリストは企業内のほんの一部のデータにしかアクセスできていません。
- 質の悪いデータを分析してもあまり役に立たない データはあらゆる分析タスクの基礎となりますが、データの質を確実なものとするには、データのリネージ(経緯)を適切に保守するのが最善の方法です。データのリネージが信頼できないならば、このデータを分析した結果も信頼できないでしょう。KPMGのアンケートによると、自社内のデータの使用や分析を強く信頼している経営陣は、わずか35%でした(出典はこちら)。また多くの部署やプロジェクトチームにとって、エンタープライズモデリングを行う「スーパースキーマ」アプローチはあまり魅力的ではないため、独自にBIや分析ツールを採用しているのが現状です。彼らはデータを一般的な形式(CSVなど)でエクスポートするよう、IT部門に依頼します。 この結果、ガバナンスが効かないデータのサイロが生み出され、質がよくわからないデータを分析することになってしまいます。
- 「知見を得るための機密データへのアクセス」と「セキュリティリスクの最小化」の間で適切なバランスを取る データの探索や分析において、セキュリティは極めて重要です。ビジネスを保護するには、誰がデータにアクセスしたのか/データを共有したのか/いつそれらが行われたのかについて把握する必要があります。こういったデータに対する適切なガバナンスがない場合、保険/ヘルスケア/金融といった業界では莫大な罰金が課せられます。分析用データウェアハウスの多くは、大量のデータを処理し、大勢のアナリストにアクセスを許可しているため、セキュリティの維持は困難です。「機密情報へのアクセスを必要な人にだけ制限する」ことは容易ではありません。願わくば、きめ細かなセキュリティを構造化および非構造化データの両方に適用したいところです(ノード/ドキュメントレベルで)。現代のデータウェアハウスのほとんどにおいて、セキュリティ制御はテーブルレベルあるいは列レベル(=データマスキング)では可能ですが、行レベルではできません。
MarkLogicで分析を強化する
MarkLogicでデータ統合の課題を解決することにより、人々はビジネスの全体像を把握し、より複雑な問いにさらに素早く回答できるようになります。
- データを統合し、構造化データのみならずすべてのデータを活用する MarkLogicは、サイロに分断されたさまざまな構造のデータを統合し、キュレーションし、下流の利用に合わせて変換することで、こういった問題を解決します。あらゆる形式のデータを扱うことができるので、分析し易いデータだけでなくあらゆるデータから知見を得ることができます。ドキュメント/セマンティックグラフ/地理情報/リレーショナルモデルの利点を1つのプラットフォームに統合し、JSON/XML/テキスト/RDFトリプル/地理情報/バイナリを簡単に格納できます。検索およびクエリ用の一元化されたインターフェイスがあるので、すぐに知見が得られます。またTDE(Template Driven Extraction)により、ドキュメントデータをリレーショナル的に表現することでNoSQLデータに対してSQLでクエリできます。
- 扱っているデータの正当性を確保する 十分なデータリネージがあれば、透過的に分析結果からソースまで辿ったり、エラーをトラッキングしたりできます。これにより、価値のある分析が実現されます。MarkLogicでは、同一ドキュメント内にメタデータ/ソースデータ/カノニカルデータのすべてを一緒に格納できます。メタデータがあれば、データソースの収集/統合/分析の処理を大幅に合理化し強化できます。またメタデータによって、ある時点における監査証跡が得られます。これは規制がある業界においては極めて重要です。
- データガバナンスを実現する MarkLogicを使うと、誰がどのデータを見られるのか/共有できるのかを細かく制御することで、知的財産の保護/規制順守/データ漏洩対策に対処できます。これに加えて、新しい規制に合わせて、分析に影響を及ぼすことなくセキュリティを変更できます。MarkLogicの要素レベルのセキュリティでは、ドキュメント内の一部分へのアクセスを制限することによりデータを最大限活用できます。またコンパートメントセキュリティにより、複数の適切なロールの組み合わせがないとデータを閲覧できないようにできます。
Tableauとの統合によりシームレスな分析を実現
データの質を担保しこれを統合しおわったならば、これまで使ってきたデータアクセスツールをそのまま利用できることが重要です。Tableauはデータ視覚化およびデータ分析の最先端を担ってきており、最も人気のあるツールの1つです。「直感的かつ視覚的な分析によって組織をさらにデータドリブンにする」という彼らのミッションは、MarkLogicの長所によってさらに強化されます。
どのデータが役に立つのか、あるいはどのような知見を求めているのかが事前にわかっていないこともよくありますが、MarkLogicはすべてのデータをまとめてこれをキュレーションし、高い品質を実現することで、分析に使われるデータの正当性を確保します。Tableauは、データに埋もれた新しい知見を発見し、視覚化およびダッシュボードにより得られた価値を共有します。
またこれにより、MarkLogic内のデータへのアクセスがこれまでにないほどシンプルになります。MarkLogic用のTableauコネクタは、Mac/Windows/Linuxでご利用いただけます。これはPostgreSQLのオープンソースODBCドライバに基づいています。 MarkLogic用TableauコネクタはTableau SDK上で構築されおり、ビジネスアナリスト/データエンジニア/下流のエンドユーザーへのデータ提供者すべてにとって、信頼できる容易な接続を提供します。非公式のコネクタを探したり、手作業でODBCを設定したり、自分で接続の課題に取り組むことなく、数クリックでMarkLogicからTableauにデータを渡せます。
この新しいMarkLogic用Tableauコネクタを利用するには、まずこのコネクタをダウンロードし、ダウンロードされたtacoファイルをMy Tableau Repositoryフォルダに入れます。次にTableauを起動して、[Connections]タブからMarkLogicコネクタを選択します。これによりデータをTableauにスムーズに渡せるようになり、すぐにデータを分析できます。
MarkLogicはデータを活用したい組織に向けて、キュレーション済みデータへのアクセス方法として以前からPower BIに対応していましたが、今後はTableauもご利用頂けるようになりました。MarkLogicとTableauを一緒に使うことで、インテリジェントかつデータドリブンな意思決定が実現されます。
まとめ
組織は、データから得られる価値を最大化するよう努めていますが、この価値は、あらゆるデータにアクセスできた場合に最大となります。データの整理/統合/クエリによって、新しい知見を発見したり「360ビュー」を実現したりできます。これにより、KPIのチェックや、ビジネスに好影響を与える業務上の意思決定が可能になります。MarkLogicは、構造化データのみならずすべてのデータを統合/管理/キュレーションするソリューションのリーダーです。MarkLogic用のTableauコネクタを使うと、すべてのデータをBIツールのリーダーであるTableauで活用できるようになるので、アナリストは全体像を把握できます。
さらに詳しく
コネクタをダウンロードするBIおよび分析のウェビナー