SHIONOGI DATA SCIENCE FES 2024

SHIONOGI DATA SCIENCE FES 2024

データサイエンスとデータエンジニアリングの融合による新たな価値創造

2024年2月29日に開催したSHIONOGI DATA SCIENCE FES 2024をレポートいたします (※本イベントの詳細はこちらをご確認ください。)

当日は約1,130名の方にご参加いただき、多くの方にご興味を持っていただけたことを嬉しく思うとともに、本イベントが協創の場となれば幸いです。

目次

Session 1: データサイエンスの最先端

近年、生成AIをはじめとした新しい技術の台頭に伴い、データサイエンスに注目が集まっています。Session1では、データサイエンスの領域における国内外のトレンドに加えて、塩野義製薬株式会社における取り組みが紹介されました。

【基調講演1】米国のデジタルヘルス・医療AIの最先端

清峰 正志氏 (Kicker Ventures / Founder & Managing Partner)

清峰氏: 私は、アメリカのベンチャーキャピタルで、未来のヘルスケアをテーマに投資活動を行っています。昨今のヘルスケア領域における変革のスピードは、これまでと一線を画します。2022年11月に発表されたChatGPTを皮切りに、生成AIが躍進し、ヘルスケア領域でもAIを活用する企業が増えています。アメリカ食品医薬品局 (FDA) の許認可を獲得したAIデバイスは692件で、そのうち約76%は放射線科での活用を想定した画像関連ソフトウェアです。これらの動きの背景には、AIによるアウトプットの精度向上があります。実際に、アメリカの医療業界に携わる人の1割がすでにAIを業務に活用しています。製薬会社、病院・医療従事者、保険会社、医療機器企業、サービス・オペレーション、公的医療機関においても生成AIが導入され始めています。スタートアップには、機械学習を活用して、多岐にわたる疾患に対する新規タンパク質治療薬の開発を行ったり、ディープラーニングを活用してがん診断の精度を高めたりする企業があります。一方で、AIには信頼性やバイアス、プライバシーの問題があることを忘れてはいけません。生成AIの活用は、業界が目指す1つの答えですが、これらの問題を置き去りにせずに答えに辿り着く必要があります。ヘルスケア領域におけるAIの活用がますます活発になると、①患者の健康状態の改善、②医療費の削減、③患者の満足度の向上、④医療従事者の満足度の向上を達成できる と考えています。

【基調講演2】ヘルスケアデジタルの最前線

西上 慎司氏 (デロイトトーマツコンサルティング合同会社 執行役員 ライフサイエンス&ヘルスケアインダストリー リーダー)

西上氏: 私は、25年にわたるコンサル実績を有し、ヘルスケアの領域を中心に業務に携わってきました。現在、日本では高齢化が進み、ますます社会保障費が増えていくことが予想されています。そのような時代において、ヘルスケア業界ではデータやAIを活用した大きな変革が求められています。しかし、世界中でデータ統合整備が活発化している中、日本はデータの統合、利活用の環境整備において後れを取っています。一方、社会が指数関数的に変化し、変革の素地は整いつつあります。社会全体でデータの統合が進むと、データがリアルタイムに運用されるようになり、生活者はデータに基づいたヘルスケアサービスを活用して、自身の幸福を管理できるようになるでしょう。ヘルスケア領域におけるデータ活用の事例として、私たちの法人では、遺伝性血管性浮腫 (HAE) の早期診断を目指して活動しています。また、社会医療法人敬和会では、ACP (Adovance Care Planning) に取り組んでいます。ACPとは、将来の医療およびケアについて、患者本人を主体に、そのまわりの家族や医療チームが繰り返し話し合いをして、本人の意思決定を支援する取り組みのことです。このように、ヘルスケア領域におけるデータ活用は、さまざまな可能性に満ちています。変革を起こすためには、アイデアを積極的に話し、周囲を巻き込んで形にしていくことが重要です。

CNS 領域のトータルケアに向けたストレス予測アルゴリズム開発の取り組み

岩本 洋紀 (塩野義製薬株式会社 データサイエンス部)

岩本: SHIONOGIデータサイエンス部では、うつ病のトータルケアを目指しており、これまでに、ストレス予測アルゴリズムの開発を実施しました。最近では、製薬企業は、健康、未病、診断、治療、予後を含むトータルケアを提供する時代になりました。トータルケアの実施には、デジタルデバイスとアルゴリズムがカギです。データサイエンス部では、うつ病の症状を観測するためにさまざまなデジタルデバイスを活用しています。今回の講演では、2023年4月より特許出願中のストレス予測アルゴリズムについて説明しました。近年、うつ病の発症数が増加しています。また、うつ病は、再発率が高く、傷病期間も長期化しやすいことから社会損失が甚大となります。そのため、ストレス予測を行い、そのデータ分析を通じて、うつ病になる兆候を見つけ、事前に予防することが重要です。しかし、ライフスタイルは人によって異なり、万人に適用可能なモデルを構築することは容易ではありません。そのため、データサイエンス部では、勤怠データを活用して、勤務形態を前提にした高精度なストレス予測を実施しました。私たちが開発した予測アルゴリズムでは、はじめに、勤務形態が似ている人を抽出し、学習データに組み込みます。その後、類似集団と予測対象者の既存データを用いて予測モデルを訓練していきます。このアルゴリズムを利用することで大幅に精度を向上させることができました。今後は、対象集団を広げつつ実証実験を行い、アルゴリズムの検証・改善を継続していきたいと考えています。

売上シミュレーションによる営業戦略の策定支援

副島 涼 (塩野義製薬株式会社 データサイエンス部)

副島: 私は現在、塩野義製薬で、営業DX、経営高度化プロジェクトなどに取り組んでいます。マクロな視点から、日本は世界競争力ランキングでデータ活用が低位であり、データドリブンな意思決定が弱い国であることが指摘されています。しかし、米国の研究ではデータドリブンな意思決定は、ビジネスに効果的だと示されています。特に、社会の変化が激しい昨今では、これまでのように経験と勘だけではなく、データも活用した意識決定が不可欠となっています。ビジネスにおけるデータドリブンの意思決定の種類は、主に4種類に分けられ、その中でも今回は、what-if型のものを説明しました。本講演では、what-if型の分析で利用されるリスク分析の領域における、モンテカルロシミュレーションを紹介しています。事例①は、薬剤が届く患者数の予測です。この事例では、「売上予測」の領域で、時系列予測モデルによって情報提供の将来的な成果を見積もれるようになりました。事例②は、売上の予測です。この事例では、「売上シミュレーション」の領域で、シミュレーションを活用して、事前に売上の期待値と不確実性を見積もれるようになりました。事例③は、顧客に最適な活動を配分する例です。この事例では、「効果換算表」を活用して、顧客ごとに適した活動が分かるようになりました。今後は、リソース配分を効率化する「最適化モデル」に注力したいと考えています。

感染症流行状況の把握と予測の取り組み

宮澤 昇吾 (塩野義製薬株式会社 データサイエンス部)

宮澤: 私は、2017年に塩野義製薬に入社し、臨床試験データの解析、感染症領域のエビデンス構築に従事しています。また、データサイエンス部では感染症領域の課題解決の為、レセプトデータ、臨床試験データ、オープンデータを活用しており、具体的な事例の1つとして、感染症の流行の把握と予測の取り組みを進めています。本講演では、私たちが作成した感染症ダッシュボード・アラートシステムについて説明しました。感染症は、患者数や流行開始時期が毎年異なります。そのため、流行の把握と、流行の兆しの早期検知が重要です。早期検知をすることで、薬の生産や流通の調整、また、感染症タスクの戦略検討などを事前に行えるためです。しかし、感染症の種類が多く、網羅的な情報収集に多くの作業量が発生したり、情報がWeb上で点在しているために、人が手動で情報を集めないといけなかったりするという課題があります。これらの課題を、データサイエンスとデータエンジニアリングの融合により解決したいと考えています。感染症ダッシュボード・アラートシステムは、流行情報を自動収集し、可視化+流行の兆しがある時にアラームを出す仕組みです。このアラートシステムは実際にCOVID-19第9波の兆しを早期に検知できました。また、アラートシステムの情報を1つの判断材料として、薬の情報提供活動のリソース配分を行った事例もあります。

Session 2: 組織・人材論

データサイエンスとデータエンジニアリングを活用して変革を起こすためには、それらに精通した組織の構築と人材の育成が重要です。Session2では、新しい時代に求められる組織・人材論について紹介されました。

【特別講演】SHIONOGIにおけるデータサイエンスへの期待

手代木 功 (塩野義製薬株式会社 代表取締役会長兼社長 CEO)

手代木: SHIONOGIは、中期経営計画「SHIONOGI Transformation Strategy 2030」(以下「STS2030」) のもとでVision実現に邁進しています。2023年6月に発表した「STS 2030 Revision」では、計画を具体的な成長戦略としてアップデートしました。Vision実現のためには、デジタル技術・データによるビジネス変革が重要です。具体的には、①医薬品やヘルスケアサービスに新たな価値を生む変革、②経営資源をより効率的に活用する変革、③変化に対して的確かつ機敏に適応する経営変革の3つです。

はじめに、①医薬品やヘルスケアサービスに新たな価値を生む変革においては、次のような取り組みを進めています。

次に、②経営資源をより効率的に活用する変革においては、次のような取り組みを進めています。

実際に、当社の取り組みにより標準解析作業時間を3割削減できた事例もあります。最後に、③変化に対して的確かつ機敏に適応する経営変革においては、透明性とトレーサビリティを担保した意思決定システムを導入しました。これにより、システムを通して意思決定のプロセスを検証できるようになり、稟議を廃止することができました。このように当社は3つの観点からビジネス変革を進めております。また、変革を実現するためには、組織、人材、データ基盤を強化し、これまで以上にデータを活用できる環境を整えなければなりません。SHIONOGIは、今後もデータ利活用をコアエンジンとして、ヘルスケア領域の課題にこたえる製品・サービス・価値を創造していきたいと考えています。

仮説検証サイクルを実現するデータサイエンティストとデータエンジニアの挑戦

北西 由武 (塩野義製薬株式会社 データサイエンス部 部長)

北西: データサイエンスとデータエンジニアリングは、現在のビジネスにおいて非常に重要です。データサイエンス部では、観察、仮説、実験、考察、意思決定のサイクルをビジネスデータサイエンスの基本プロセスとして、重要視しています。データドリブン型ビジネスを行うためには、データサイエンス人材の育成、データリテラシーの鍛錬・強化を通じて、データドリブンな企業文化の醸成が必要です。一方、実際のビジネスにおけるデータ活用には課題があります。そもそもデータが揃っていない場合も少なくありません。また、高質かつ高速な意思決定を実現するためには、スピード面と情報クオリティ面に問題点があります。どのように意思決定が行われるかを明確にしたうえで、必要なデータを特定することが大切です。次に、データ活用組織の設計と機能について説明します。データサイエンス部はIT組織との連携、並びにデータエンジニアリングとデータサイエンスの融合を目的とした組織構成をしています。データベース&解析システムの設計コンセプトとして、塩野義製薬では、データを使ってどのように意思決定をしたのかというプロセスを記録しておくために、Central Data Management構想というものを掲げています。最後に、データ活用人材の育成コンセプトについて、データサイエンス部には多様な専門性を持つメンバーが所属しています。また、全従業員およびマネージャー向けのDX教育を実施しており、社内全体でリテラシーの向上に努めています。

【基調講演3】マイクロソフトが実践するデータドリブンな組織変革と女性のキャリア支援

水上 千佳氏 (日本マイクロソフト株式会社 業務執行役員 インダストリアル&製造事業本部 西日本製造営業統括本部 統括本部長)

水上氏: 私は、日本マイクロソフト株式会社で、業務執行役員として働いています。本日は、①マイクロソフトの変革とデータドリブン経営、②データに基づく人事戦略、③女性のキャリア支援について話します。まず、①について、もともとマイクロソフトは、1家庭に1台コンピュータを普及させることを目的に設立されました。今では、製品、ビジネスモデル、社内業務、企業文化の変革を通じて、さらに事業を拡大させています。その中で、マイクロソフトは、データに基づいた意思決定を実施してきました。特に、企業文化では、ダイバーシティとインクルージョンを重視しています。そのため、女性の従業員を増やす取り組みを行っており、施策の結果、社員の女性比率は2023年31.2%まで上昇しました。次に②について、マイクロソフトでは、従業員やカルチャーについてエビデンスベースの意思決定を行う組織にすることを目標にしています。そのため、マイクロソフトの人事部門は、データ分析を活用して、ビジネスリーダーに対するコンサルティングを行っています。また、従業員の状況やカルチャーをデータで分析し、必要な施策を立案しています。最後に、③について、私自身のキャリアを振り返ると、出産や介護と仕事の両立、転職、マネジメント経験など、さまざまな経験を積みました。これまでの経験から女性のキャリアについて私の意見を述べると、「自分のキャリアは自分が考える」「数年ごとにキャリアを見つめ直す」「ロールモデルはないので、とにかくチャレンジする」「感謝の気持ちを忘れない」などが大事です。今後もさまざまな活動を通じて、多様性と主体性から創造性を育むような取り組みを進めていきたいと考えています。

Session 3: データエンジニアリングの躍進

データサイエンスを活用して、企業経営にインパクトを与え、ヘルスケア業界に変革を起こすためには、データエンジニアリングをいかに適切に行うかが重要です。Session3では、データエンジニアリングに関する各社の具体的な取り組みが紹介されました。

【基調講演4】データx AI が創る未来

東條 英俊氏 (Snowflake 合同会社 社長執行役員)

東條氏: 本日は、Snowflakeの取り組みやサービスについて話します。Snowflakeは「世界のデータをモビライズ」というミッションのもと、垣根を超えてデータを集結させて、データのビジネス価値の最大化を目指しています。データの利活用で多くのお客様が直面しているのは、①データのサイロ化、②データ共有の難しさ、③社内データのみで深い洞察を得られないという点です。Snowflakeは、このようなデータの利活用の課題をクラウドネイティブなプラットフォームで解決しようと考えています。Snowflakeが提供するデータプラットフォームには、マルチクラウドを活用したサイロ化解消、パフォーマンス・コスト・運用負荷軽減というメリットがあります。また、Snowflakeでは、ダイレクト共有、プライベートリスト、Snowflakeマーケットプレイスという3つのデータ共有方法を提供しています。この手法により、セキュアなデータ共有や遅延がないデータのライブコピーなどを実現しています。さらに、Snowflakeでは、生成AI&LLM向けSnowflakeプラットフォームを提供しています。このプラットフォームには、簡単かつすぐ使えるフルマネージドなLLMを利用できる、LLMを利用するアプリケーションを簡単なコードで高速に開発できる、オープンソースまたは、商用の外部LLMを使い、自社で独自にチューニングするようなカスタムLLMの開発を実現できる、といった特徴があります。このように、AI戦略を成功させるためには、データ戦略を適切に構築する必要があります。

【基調講演5】意思決定を創造する人中心型イノベーション

手島 主税氏 (SAS Institute Japan 株式会社 代表取締役社長)

手島氏: SASは、AIディシジョニングプラットフォームのリーダーであり、人間中心の意思決定支援を行っています。人間中心の意思決定支援とは、実験計画や統計解析とインターネットのような大規模なデータを利用した機械学習、AIを利用して、人間自身の意思決定の手助けをすること です。SASでは、AI適用アプローチを、①創造的意思決定、②意思決定の強化・拡張・補完、③意思決定の置換・自動化の3段階に分類しており、どの段階にどのAI、どのモデルを適用するのかを考えています。SASでは、地球上で最も信頼されているアナリティクス・パートナーとして「イノベーションを前進させる」「ビジネスレジリエンスを強化する」「より良い地球の未来を可能にする」「好奇心を起点として市場をリードする」の4つを目指しています。また、SASでは、市民と連携することで、地球規模の課題を解決する取り組みも行っています。現在は、AIのリスクや気候変動、日本の人口減少問題など、さまざまな問題があります。SASでは、このような変化の激しい時代において、エンジニアリングやディシジョニングを提供していきたいと考えています。塩野義製薬との取り組みでは、SASのAIプログラムを活用して、臨床試験開発業務の30%効率化を実現しました。今後も、2024年は、①Viya Workbench、②生成AI、③Industry Solutionsの製品開発をしながらも、イベントやイノベーションセンター構想などに投資していく予定です。

SHIONOGI のデータ利活用基盤の現状と今後の展望

渡邉 慶 (塩野義製薬株式会社 データサイエンス部 ユニット長)

渡邉: 現在、DX推進本部では、全社横断的なセントラルデータマネジメント (CDM) と題したデータ利活用基盤の整備を行っています。その中でも、本日は特に、データウェアハウスの部分を中心に説明します。SHIONOGIでは、データハブとデータウェアハウスを軸に、社内外のデータを集約し、データ分析に活用できる環境を構築しています。データハブの運用はIT部門が、データウェアハウスの運用はデータサイエンス部が担当しています。データウェアハウスには、研究開発から販売に至るバリューチェーンのデータや、企業活動に関するデータ、さらには社外の商用データやオープンデータも格納されています。データウェアハウスの運用では、分散型のデータ管理体制を構築し、各部門がデータ管理者となってデータを提供し、利用者がデータを検索して利用申請するプロセスを実現しています。データの分析を行う際、解析ツールやストレージに問題があり、うまく分析できない場合があります。また、外部データ管理には、①スピードが遅い、②柔軟性がない、③コラボレーションしづらい、というような課題があります。そのため、データサイエンス部では、クラウドベースの新しい統合解析環境を構築し、データ処理の高速化、柔軟性の確保、外部とのコラボレーションの促進を図っています。また、今後は構造化データだけでなく、半構造化や非構造化データも一元的に管理できるようにすることを目標にしています。

データサイエンス人材教育とデータサイエンス部保有スキルの見える化

山下 彩花 (塩野義製薬株式会社 データサイエンス部)

山下: 塩野義製薬では、データサイエンスのコア人材を増やすため、2020年から選抜型と公募型の研修プログラムを開始しました。また、マネージャー層や全従業員を対象としたデータサイエンスの階層別研修プログラムを実施しており、データサイエンス部員が、講師やメンターを務めています。研修では受講者のビジネスの課題を持ち寄り、データに基づいて解決する伴走型の形式をとっています。データサイエンス部員は、受講者の課題を丁寧に聞き、専門知識やモデリング手法を説明しながら、自身も受講者のドメイン知識から学び成長しています。データサイエンス部は、データサイエンス、コンピューターサイエンス、データエンジニアリングの3つのグループから構成されています。データサイエンス部員は薬学、情報数理、生物、化学など、多様なバックグラウンドを持っています。また、部員が保有するスキルはさまざまな分野にわたり、それらを組み合わせて業務を行っています。しかし、誰がどのようなスキルを持っているかが見えにくいという課題がありました。そこで、データサイエンス部員のタレント情報を収集・可視化し、お互いのスキルを知ることができるWebアプリ「Tmap」を内製で開発しました。Tmapでは、専門スキル、一般スキル、業務経験などを登録でき、スキルの繋がりや成長過程を可視化できます。また、自身が挑戦したいスキルや未経験のスキルも登録可能で、実際に経験を積むとデータとして蓄積されます。今後は、Tmapに蓄積されたデータから、伸ばすべきスキルのリコメンドやメンター探しなどの機能を実装する予定です。タレント情報を活用することで個人と組織が自律的に成長し、成果を創出し続けることに貢献したいと考えています。

オンデマンド計算環境の開発-クラウド計算資源の効率的な利用と、高度解析の加速

髙市 伸宏 (塩野義製薬株式会社 データサイエンス部)

髙市: データサイエンス部の主なミッションは、ビジネス戦略・戦術の立案と実行です。そのためには、特に解析環境の効率性が、基づく仮説検証サイクルの高速化が重要です。しかし、従来のオンプレミス環境では、障害による検討の停止、計算資源の枯渇、ユーザー同士の干渉、自由度の不足のような課題がありました。これらの課題を解決するため、AWSクラウドを活用して個人専用の独立した計算環境を構築しました。ユーザーは必要な計算資源をセルフサービスで調達できるようになり、それまでに無かったスケール性、独立性、柔軟性を確立しました。一方で、環境の分離によって全体の稼働状況の把握の面で課題が新たに発生しましたが、仕組みに基づく堅牢なタグ付けによる利用状況の可視化によって解決しました。その結果、20%のコスト効率性の向上と、飛躍的な検討スピードの向上を実現しました。また、必要なサイズの環境を瞬時に調達でき、最新技術の速やかな検証も可能になりました。そして、個人専用環境のおかげで、リソース競合や他者への影響がなくなり、思い切った試行錯誤ができるようになりました。利用者からも好評を得ており、仮説検証サイクルの高速化に寄与しています。このようにクラウドの利点を最大限に引き出すためには、しばしば解析システムを、仕組みのレベルから大きく変えることが必要です。しかしそれだけでなく、そこで業務を行うデータエンジニア、データサイエンティストが、相互に変化し、互いを理解し、深く協力する力もまた求められます。

データ活用を促進するデータカタログ

S.E. (塩野義製薬株式会社 データサイエンス部 サブグループ長)

S.E.: 本講演では、塩野義製薬のデータカタログの特徴について説明しました。1つ目の特徴は、データガバナンスの重視です。データオーナーと機密性の高いデータ項目の確認やアクセスレベルの設定を行い、レベルに応じた利用申請承認フローをデータカタログに実装しています。また、利用申請だけでなく利用結果も報告させ、データ活用の透明化を図っています。2つ目の特徴は、タイムリーなデータ活用です。必要なデータを必要なタイミングで利用できるよう、使いながらデータ品質の担保と活用範囲を広げます。決してデータ品質を軽視するわけではなく、データカタログ上でデータ品質の状態と品質担保の進捗もメタデータとして公開し、利用者は目的を達成できるデータであるかを見極めます。3つ目の特徴は、データ利用者自身がデータ管理者になる分散型のデータマネジメントがベースとなっている点です。利用者が管理者を担うことで、加工が効率的であるなどのメリットがあります。また、データセットの存在を公開・共有することで、データのサイロ化を防ぎ、データメッシュを作ります。4つ目の特徴は、データ活用のモチベーションを上げるトークン制度です。利用者は結果報告や質問などの活動でトークンを獲得し、データベースリクエストや投票に利用できます。管理者はデータが利用された場合やメタデータの更新などでトークンを獲得し、更なる管理の充実にトークンを利用できます。トークンの付与数は活動の量的・質的評価に基づく独自のアルゴリズムで算出します。このように、塩野義製薬のデータカタログはメタデータの管理に留まらず、データマネジメント全般を広く補助します。