管理番号:10045020210083
府省:厚生労働省
提供状況
2021-11-26 | 調査票情報の提供を受けた者の氏名又は名称 |
篠原 恵美子 |
---|---|---|
調査票情報の提供を受けた者(個人に限る。)の職業、所属その他の当該者に関する事項 |
東京大学大学院 医学系研究科 医療AI開発学講座 特任助教 |
|
提供した調査票情報に係る統計調査の名称 |
人口動態調査 |
|
調査票情報の利用目的 | 国立社会保障・人口問題研究所の一般会計プロジェクト「超長寿社会における人口・経済・社会のモデリングと総合分析」(令和2~4年度)の一環として、人口動態調査を用いて、死亡個票の直接・間接死因に関する原データを検討し、どのような前処理をすれば変換可能な割合が増えるかについて検証・分析を行う。 | |
備考 |
統計若しくは統計的研究の成果又はその概要等
調査票情報の提供を受けた者の氏名又は名称 |
篠原 恵美子 |
---|---|
提供した調査票情報に係る統計調査の名称 |
人口動態調査 |
統計又は統計的研究の成果等のタイトル等 | 死亡票の死因コード化の精度向上に向けた調査 |
提出された統計若しくは統計的研究の成果又はその概要 |
日本の死亡統計である人口動態統計では、死亡診断書の記載内容をもとに決められる単一の死因を用いている。死因に関してより詳細な分析を行うためには原死因の元となった記載内容が利用可能であるが、自由記載であるためにコード化が必要である。死亡数は年間100万以上あり、コード化は自動で行うことが現実的である。本研究では死亡の原因欄の記載内容をICD-10コード化・日数化するために必要となる処理を調査し実装した。 ICD-10コード化では、コード化知識としてICD-10対応標準病名マスターを用いたが、最新のマスターだけでは現在使われなくなった病名がカバーされないため過去のマスターも併せて用いる必要があった。さまざま種類の表記ゆれが含まれ、異なる観点での正規化が必要であり、コード化実施と処理の修正を繰り返すことで精度の向上を図った。結果、全年について何らかの記載がある欄の 97%にコードが付与された。 |
上記統計の作成又は統計的研究を行うに当たって利用した調査票情報に係る統計調査の名称、年次、当該調査票情報の地域の範囲その他の当該調査票情報を特定するために必要な事項 | (調査名) 人口動態調査 (年次) 平成15年〜令和2年 (地域) 全国 |
上記統計の作成の方法又は統計的研究の方法を確認するために特に必要と認める事項 | 「死亡の原因」Ⅰ欄・Ⅱ欄の「原因」がICD-10コード化対象、「発病(発症)または受傷から死亡までの期間」が日数化対象のデータである。期間には年月日や年齢が記載される場合があったため、日数化処理においては死亡日と誕生日も併せて用いた。 |
学術雑誌等の名称及び掲載年月日 |
「人口の健康・疾病構造の変化にともなう複合死因の分析手法の開発とその妥当性の評価のための研究」研究報告書 https://ipss.repo.nii.ac.jp/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=626&item_no=1&page_id=13&block_id=21 |