4月16日-19日に開催されたSAS Innovate in Las Vegasにて、SAS Hackathon Boot Campが行われました。
日本からは塩野義製薬様が参加され、見事3位入賞いたしました。🎉
本記事では塩野義製薬様のチャレンジの様子や、いち早くSAS Viya Workbenchを利用した感想をお伝えします。
また、7月17-18日に開催予定のSAS Innovate in Tokyoでは、2日目にHackathon Boot Campが行われます。
ぜひこの記事を参考にし、皆様のチャレンジをお待ちしています。
SAS Hackathon、SAS Viya Workbenchに関する各種リンクは以下をご覧下さい:
- SAS Hackathon Boot Camp in Tokyo (SAS Innovate Day2):Here ※参加登録時、ハッカソン参加希望をチェックください。
- SAS Hackathon:Here
- SAS Viya Workbench:Here
チーム SHIONOGI ?
今回SAS Hackathon Boot Campへ参加したのは、データサイエンス部の4名です。
参加された4名は、医薬品の有効性・安全性を確かめる臨床開発をはじめ、医薬品の研究~販売のすべてのバリューチェーンにおいて、データサイエンスの側面から業務プロセスの改革へ取り組まれています。
塩野義製薬様エントリーの背景
日頃から仮説(臨床試験/ビジネス)に対しデータサイエンスを使い向き合っていますが、3時間という限られた時間の中で普段扱わない業界・テーマへ向き合うことは、我々の実力試しが出来るいい機会と考えていました。
日々様々な業務テーマ/データと向き合い、高度なデータ活用へ取り組まれている皆さんにとって、Hackathon Boot Campはそれらの総合力と向き合う機会だったと言えます。
取り組んだテーマ
SAS Hackathon Boot Campでは、与えられたビジネス課題を3時間でハックします。
今回のテーマはローン承認モデルの作成プロセスで、歴史的な差別のない公正なモデルを構築するというものでした。具体的には以下2つを解きました。
- バイアスが発生する可能性がある箇所を特定すること
- このバイアスを減らして、歴史的な差別のない、真のリスク要因に基づいて与信が承認されるようにすること
提供された実装方法は、SAS Visual Analyticsを用いたノーコード実装・SAS Model Managerを用いたローコード実装・そして新製品であるSAS Viya Workbenchを用いたコード実装の3セクションが用意されていました。
塩野義製薬様は、これまでの業務経験をもとに、SAS Viya Workbenchを用いたコード実装を選定されました。
3時間の取組み秘話・コツ
業務で実施している解析の流れを踏襲することを意識しました。流れとしては「課題の理解」→「データの理解」→「データの準備」→「モデリング」→「結果の確認」。まずは1人1人がデータと課題に向き合いました。
データの理解のコツ
業務では取り扱ったことのないデータであったため、特に「データの理解」には時間を割きました。各変数の要約統計量を算出、分布の確認から始まり、バイアスが発生しそうな様子を種々の方法で確認しました。
時間配分のコツ
「データの理解」をした後に、モデリングに取り組みました。本来ならばモデリングに時間をかけたいところでしたが、「データの理解」、「モデリング」、「解釈」の時間配分は5:2:3で取り組み、精度の高いモデルを構築するよりもデータの確認と解釈に時間を取りました。3時間という制約がありましたので、”データの理解”の際に当たりをつけていた過学習になりそうな要因を特定しました。
「結果の確認」工程での議論
データサイエンスの結果(アウトプット)として、何を重要視して結果を出すのかを議論しました。
全員で話したことは、精度と倫理のバランスと将来の倫理観です。ディスカッションの結果、重きを置いたデータ特性について理由を添えてレポートを作成しました。この倫理面への配慮も普段の業務で強く意識している点です。
SAS Viya Workbench の感想
SASプログラミング言語の他に、R・Pythonも使える点は、データサイエンティストの多様なニーズを満たしてくれるように感じました。我々データサイエンティストはSASに加えてRやPythonといった言語もしばしば利用します。これらをすべて同じ環境で使用できるというのはデータサイエンティストの多様性を受け入れ、共同作業を可能にする柔軟な製品ですね。
今回塩野義製薬様が利用したSAS Workbenchは、2024年中にリリースが予定されている新製品です。
SAS Viya Workbench は、開発チームとデータサイエンスチームに、Visual Studio Code や Jupyter Notebook インターフェイスを含む独自のコード (SAS または Python) をセルフサービスのデータおよびコンピューティング環境に取り込む機能を提供し、チームの生産性を最適化します。ユーザーは、管理者のプロビジョニングを必要とせずに、自分でワークベンチを立ち上げて実行できます。 SAS Viya Workbench は、ユーザーがスケールアップまたはスケールダウンすることもでき、開発者のニーズの変化に迅速に対応できます。
見事3位入賞!🎉
普段行っている流れで解析を行い、結論を導いた結果3位入賞は、ポジティブなアウトプットでした!
データサイエンス部4名で、しかも管理職3名(うち1名は部長)での参加でした。このメンバーで時間を確保し、議論しながらコーディングすることは、普段でしたら簡単ではありません。SAS Hackathon Boot Campという機会だったからこそ集え、チームでチャレンジが出来ました。普段の業務ではあまり扱うことのないデータとテーマに向き合って、各々が実際にコーディングを行い、喧々諤々と議論する時間というのは、我々のそれこそ実力試しには非常に良い機会でした。