2017年のBioIT Worldで、私たちの顧客であるフォーチュン50企業が、MarkLogicデータベースプラットフォーム上に構築した「リアルワールドエビデンス用アプリケーション」について発表しました。
リアルワールドエビデンス用メタデータカタログ
ライフサイエンス企業がリアルワールドエビデンスを扱う際、最初のステップは、すべてのデータソースに関して「その場所」、「アクセス可能な人」、「これによって解決できる課題」を確認することです。製薬企業や医療機器メーカーは、リアルワールドエビデンスの研究用に外部データを大量に購入しています。データサイエンティストがこれらのデータで仮説検証を行う場合、その前にすべてのデータをまとめ、主要コンセプトを検索し、情報間の関係性を調べておく必要があります。この顧客企業は、新しいリアルワールドエビデンスをこれまでよりも短時間で提供し、研究員が情報をすぐに発見できるメタデータカタログを構築する必要がありました。
このためMarkLogicはコンサルティングパートナーと一緒に、この会社用のメタデータカタログを構築しました。このメタデータカタログは、製薬会社の研究者がリアルワールドエビデンスから貴重なアセットを素早く探せるようにするものです。対象データは、病理報告、医療記録、臨床データなどです。
この会社では、MarkLogicデータベースプラットフォーム導入前は、SharePointのメタデータカタログを手作業でキュレーションしていました。ここには概要レベルのメタデータ(データセットやドキュメントのアブストラクトなど)を格納していました。このソリューションでは、IT部門が新規データセットやドキュメントにメタデータを付与してからでないと、特定の医薬品や健康状態に関する包括的情報の取得ができないという制約がありました。 また社内のメタデータに限りがあることから、大量のリアルワールドエビデンスデータ(数十年分の研究結果や数百万人の患者情報)から情報を探すのに、あまりにも長い時間がかかっていました。
今回導入されたメタデータカタログでは、あらゆるデータソースのアイデンティティを把握でき、データソースの格納場所やアクセス可能な人がわかります。また、このコンテンツの活用場面がわかるほか、すべての情報が検索可能です。 この新しいメタデータカタログでは、メタデータで効率的にフィルタリングし、自分の研究分野に最も関連性が高い可能性がある患者や研究のデータセットだけに絞り込むことができます。
大きな利点があるデータベースプラットフォーム
この企業がMarkLogicデータベースを選択したのは、さまざまな形式のデータを読み込んで格納し、これをハーモナイズすることでデータ間の関係性を把握できるからです。このプラットフォームに備わった柔軟な機能、強力なセマンティック検索、JavaやREST APIにより、MarkLogicには数多くの長所(アジャイル性、拡張性、安全なデータベースプラットフォーム)があり、他社の製品よりも優れていることを、この企業は認識しました。
現在、このメタデータカタログにより重要な知見が素早く得られるため、ヘルスケアおよびライフサイエンスの両方の市場における製品開発が加速されました。これによりグローバル展開するこの製薬企業の競争力が高まりました。
独特かつ厳しいリアルワールドエビデンスのデータ要件に対応できるアジャイルなデータベースプラットフォームにより、ライフサイエンス企業は時間/コストメリットを実現できます。サイロに分断されたデータの統合に最も適したデータベースプラットフォームであるMarkLogicは、次世代のデータ技術であり、これによってデータサイエンティストは以下のことができます。
- あらゆる種類のデータの読み込みと統合。構造化および非構造化データを一般的な言語でハーモナイズ。
- 確実なデータガバナンス。出自/トレーサビリティ/タイムライン/完全性/正確性に関して高品質および透明性を実現。
- データ/メタデータに対するセマンティック検索により、情報間の隠れた関係性を発見。
- 特定のデータビューを素早く構築および検索。さまざまな問いに基づくデータのフィルタリングと分析。さらに貴重な情報を発見。例えば、35歳以上で糖尿病、慢性閉塞性肺疾患、血栓症がある患者を探している場合、MarkLogicでは数秒でこの情報を表示できます。
さらに詳しく
リアルワールドエビデンスに関するMarkLogic活用の詳細については、以下をご覧ください。
- 「MarkLogicによるリアルワールドエビデンス提供の加速」
リアルワールドデータはどんどん溜まっているのに、今使っている専用ソリューションでは素早い問題解決やインサイト獲得などのニーズに対応できなくなっていませんか。やりたいことができない技術からそろそろ卒業しましょう。 - 「ライフサイエンスにおけるメタデータの重要性」
すべてのデータおよびメタデータに対して、複雑なクエリを実行したくはありませんか。最初にデータをバラバラにせずに素早く結果が得られたらいかがでしょうか。MarkLogicの強力な検索およびセマンティック機能により、メタデータからさらに価値を得る方法を紹介します。 - 「ライフサイエンスにおけるエンタープライズNoSQLによる分析の促進」
有害事象のデータが大量の情報の中に埋もれていて、見つけるのに何度もフィルタリングし何時間もかかってしまうことはよくあります。MarkLogicを使えば、興味のあるデータセットに素早く絞り込むことができます。また、機械学習の信号検知用のデータをこれまでよりも短期間で得ることができます。