管理番号:40045020220006
府省:厚生労働省
提供状況
2022-07-13 | 匿名データの提供を受けた者の氏名又は名称 |
小尾 高史 蒋 培 |
---|---|---|
匿名データの提供を受けた者(個人に限る。)の職業、所属その他の当該者に関する事項 |
東京工業大学 准教授 東京工業大学・大学院生(博士過程) |
|
提供した匿名データに係る統計調査の名称 |
国民生活基礎調査 |
|
匿名データの利用目的 | 国民生活基礎調査の匿名データを用いて、学術研究「日常の活動量に関連する情報と糖尿病の発症に関連する情報分析」を実施 | |
備考 |
統計若しくは統計的研究の成果又はその概要等
匿名データの提供を受けた者の氏名又は名称 |
小尾 高史 蒋 培 |
---|---|
提供した匿名データに係る統計調査の名称 |
国民生活基礎調査 |
統計又は統計的研究の成果等のタイトル等 | 学術研究「日常の活動量に関連する情報と糖尿病の発症に関連する情報分析」 |
作成した統計若しくは行った統計的研究の成果又はその概要 | 日常の活動量に関連する情報と糖尿病の発症に関連する情報との相関を分析した結果、医療保険の種類や住居の部屋数等、これまで知られていない強い相関を持つファクターを特定した。また、機械学習モデルが導き出した予測値に対して、それぞれの特徴量の寄与の度合いを求める手法(SHAP)を様々な機械学習アルゴリズムに適用し、糖尿病患者の機械学習予測を行った結果、アルゴリズムによって寄与の度合いが大きく異なるため、特徴因子を明確に説明可能とするための新たな手法を提案し、その情報を先験情報として深層学習モデルを学習する手法を提案した。 |
上記統計の作成又は統計的研究を行うに当たって利用した調査票情報に係る統計調査の名称、年次、当該調査票情報の地域の範囲その他の当該調査票情報を特定するために必要な事項 | 国民生活基礎調査 平成25,28年 |
上記統計の作成の方法又は統計的研究の方法を確認するために特に必要と認める事項 | |
学術雑誌等の名称及び掲載年月日 |
International Journal of Information Technology, 2023年4月29日及び2024年1月2日 2023-04-29 |
成果等
Jiang, P., Suzuki, H. & Obi, T. XAI-based cross-ensemble feature ranking methodology for machine learning models. Int. j. inf. tecnol. 15, 1759–1768 (2023).
https://doi.org/10.1007/s41870-023-01635-7
Jiang, P., Obi, T. & Nakajima, Y. Integrating prior knowledge to build transformer models. Int. j. inf. tecnol. 16, 1279–1292 (2024). )
https://doi.org/10.1007/s41870-023-01270-2
https://doi.org/10.1007/s41870-023-01635-7
https://doi.org/10.1007/s41870-023-01270-2