MarkLogic データと AI

リレーショナルの視点から見たMarkLogic：パート4

Rusty and Shinny Gears Working Together.

投稿者: デイヴィッド・カーレット投稿日: 2020年2月28

データ活用の最適なパートナー

本記事は、リレーショナルデータベースのバックグラウンドを持つユーザーに向けたブログシリーズの第4回です。MarkLogicのデータ統合およびアクセス処理はどのように違うのかを理解するのに役立ちます。

要約：最適なソリューションを構築するには、適切なテクノロジーとサポートの両方が必要です。MarkLogicには、複数なデータ統合プロジェクトを成功へと導くための機能、ツール、経験がすべて揃っています。

データテクノロジー業界には、これまでにない数の機能と選択肢が存在します。数の多さに圧倒されずに、最適な選択肢を活用できるソリューションやプラットフォームを構築するにはどうすればよいのでしょうか。

実際には、理想的なテクノロジーがあっても、実現は容易ではありません。状況によって、モデリングと実装の選択肢も様々です。最適な開発計画を立てるには、それぞれの選択肢の長所と短所を理解し、その両方を組み合わせてちょうどよい落としどころを見極める必要があります。

そこでMarkLogicの出番です。これまでにないデータ管理テクノロジーで、データの統合とデータハブの構築に必要なプラットフォームとアプリケーションの開発を強力に支援します。

データだけでなくデータ管理テクノロジーを統合し、各機能を活用してそれらの機能の相乗効果を引き出すことができるのは、MarkLogicにしかない強みです。

データ活用のパートナーとして、ぜひMarkLogicをご検討ください。

はじめに

MarkLogicは、データ統合のための、優れたソフトウェアプラットフォームであるとともに、データ活用でも威力を発揮します。新たな時代を迎えたデータの世界で成果を上げるにはデータの統合と活用が不可欠です。

データ活用 – 過去

過去のビジネスの世界では、データとデータテクノロジーは今よりもっとシンプルでした。ITプロジェクトの一般的なワークフローではデータと要件のセットが細かく定義されており、データへのアクセスを実現するリレーショナルデータベースを使って要件の実装が行われていました。各アプリケーションの大部分はテクノロジーとデータのサイロ、そしてそれらをつなぐ細かく定義されたアクセスポイントまたはクエリで構成されていました。

止まることのない要求

今日の世界はまったく姿が変わっています。政府の規制によって企業規模の報告が必要になっています。リスク分析には非リレーショナルデータの活用が欠かせません。販売とマーケティングでは、注文履歴からソーシャルメディア上の活動に至るまで、顧客をあらゆる角度から分析することが求められます。ローンの承認と追跡には、より広範囲のデータにアクセスする必要があります。

現在、そして未来の世界では、単純なリレーショナルソリューションでは不十分です。ワールドクラスのソリューションを構築するには、セマンティック、ドキュメント、検索、位置情報、アラートなど、新たなテクノロジーで既存のデータ管理テクノロジーを補強する必要があります。

セマンティックは、企業が属している業界と社内の情報をデータ管理システムに組み込んで、検索とクエリをより強力なものへと変貌させます。また、関連するドキュメント同士を関連付けることで、特定のトピックに関連するすべてのデータを簡単に見つけられるようになります。この2つの特長によって、質問や問題に適したデータを正確に特定することができます。

ドキュメントシステムを使うことで、リレーショナルデータベースよりも効率的に複雑なデータを扱うことができます。ドキュメントベースの構造化クエリによって、構造が異なる複数のドキュメントに対しても、単一のエンティティタイプ内ですべてのクエリを実行できます。

検索により、データのスキーマ（データが一般的なテキストの場合もある）を理解していなくても目当てのものを見つけることができるようになります。効率性と拡張性に非常に優れているため、大量のユーザーが一斉にアクセスして同時にクエリを実行することができます。

位置情報は、クエリに位置とアラートを含めて、必要なものをユーザーが指示しなくてもデータ管理プラットフォームからユーザーにデータをプッシュできるようにします。これらの機能を組み込むことで、これまではできなかったような強力なアプリケーションを作成することができます。

複雑さを増す新たな世界

新たな機能の登場とともに、選択肢も増えています。新しいユースケースができる時は、それを実装するためのアプローチが多数用意されます。

そのことを問題だと思わない人もいます。「データには多くの種類があるのだから、データベースの種類も多くなければならない」というのが共通の認識です。つまり、それぞれのデータタイプがサイロであり、それらに対応するテクノロジーサイロを個別に用意しなければならないということです。不確定要素が増える可能性がある一方で、それぞれのサイロをコンパートメント化して全体的な複雑性を管理可能なものにするのです。

このアプローチにはいくつかの問題があります。1つ目の問題は、データサイロとテクノロジーサイロをばらばらに構築することで、真に統合されたマルチモデルアプローチのメリットを得るのが難しくなるということです。

もしツールが1つしかなかったら、すべてをそのツールで処理しようと考えるものです。データサイロとテクノロジーサイロを構築した場合、各サイロのオーナーと開発者は自分のサイロの視点からしか物事を見なくなるでしょう。このような環境で開発されたアプリケーションは、真に統合されたマルチモデル（多品種という意味のマルチではなく）アプローチのメリットをフル活用できなくなります。

2つ目の問題は、どの種類のデータを使うかがアプリケーション開発者任せになりがちな点です。単一のドキュメントに階層型データを取り込むのか、あるいは別々のドキュメントをリンクするのにセマンティックトリプルを使うのか。SPARQLを使ってテーブルをトリプルとクエリに変換するのか。ドキュメントをSQLテーブルに変換して、それらをユーザーがクエリできるようにするのか。

この選択が、アーキテクトや開発者任せになってしまいます。これは当然のことではありません。

最後の問題は、たった1つのアプリケーションを作るために、ばらばらにテクノロジーサイロを構築して統合するのはかなりの手間がかかるという点です。テクノロジーサイロを1つのデータベースとして保存して、各テクノロジーを全体の一部とみなすデータ管理アプローチの方が手間はかかりません（このケースに当てはまる実例については、私の同僚であるDamon Feldmanの投稿「Avoiding the Franken-beast: Polyglot Persistence Done Right（複雑化の回避：複数のデータベースを適切に活用するには）」をご覧ください）。

次のステップ

MarkLogicは、1つではなく、様々なツールを提供します。MarkLogicの実装には、これまで紹介してきた新しいデータ管理テクノロジーが統合された最適な形で使用されます。

MarkLogicは、新しいデータ管理テクノロジーを統合するスキルによって、ユーザーに様々なメリットをもたらします。

その筆頭が、MarkLogicデータハブソフトウェアです。ベストプラクティス、コード生成、高度な機能（データの重複排除など）が、中核となるMarkLogicマルチモデルデータベースのフロントエンドに統合されます。データハブにより、基盤となるテクノロジーの最適な統合方法を、事前に様々な面から検討することができます。ユーザーがセットアップの図を作成すると、データハブにより、エンティティにリンクするトリプルを自動生成するハーモナイズコードが生成されます。さらに、リネージ情報を持つドキュメントの生成、基盤となる複数のデータセットに基づくカノニカルビューの作成など、さまざまな処理が実行されます。基盤となっているテクノロジーをユーザーが理解する必要がないケースさえあります。

データハブを使うことで、データ管理の新しい世界にも迅速に対応することができます。

このようなメリットはありますが、MarkLogicデータハブソフトウェアは、起こりうるあらゆる状況を完全に処理するというわけではありません。そのような場合に、正式なパートナーとしてMarkLogicがお手伝いします。MarkLogicは複雑な統合プロジェクトに特化しています。MarkLogicのプリセールスチーム、サポート、コンサルティング、経営陣は、ビジネスニーズ、データ、テクノロジー間の相互作用の理解に日々取り組んでいます。また、お互いの知識、経歴、経験の共有も積極的に行っています。

MarkLogicから得られるのは、テクノロジーに関する学術的な理解ではありません。MarkLogicには、あらゆる業界の様々なユースケースのお客様との多くの協業を経て蓄積した経験があります。

詳細はこちら

本シリーズの他の記事はこちらです。
- パート 1 – 技術環境におけるMarkLogic
- パート 2 – データモデリング – リレーショナルからMarkLogicへ
- パート 3 – リレーショナルからMarkLogicへの移行
[無料のトレーニング] MarkLogicユニバーシティ
MarkLogicのコンサルティングサービス

デイヴィッド・カーレット

デイヴィッド・カーレットは、大手投資銀行、ミューチュアルファンド、オンライン仲買業で、技術職および営業職として15年以上働いてきました。

クライアントによる、ハイパフォーマンスの最先端のデータベースシステムの設計や構築を支援しました。また、パフォーマンス、最適なスキーマ設計、セキュリティ、フェイルオーバー、メッセージング、マスターデータ管理などの問題について助言を提供しました。

著者が作成したブログ

MarkLogic

Semaphore

OpenEdge

DataDirect

Sitefinity

Telerik

Kendo UI

Corticon

DataDirect

MOVEit

Chef

Flowmon

Kemp LoadMaster

WhatsUp Gold