管理番号:40020020200009

府省:総務省

提供状況

2020-07-16 匿名データの提供を受けた者の氏名又は名称 高橋 将宜
匿名データの提供を受けた者(個人に限る。)の職業、所属その他の当該者に関する事項 長崎大学情報データ科学部・准教授
提供した匿名データに係る統計調査の名称 全国家計構造調査(旧全国消費実態調査)
匿名データの利用目的 全国消費実態調査の匿名データを用いて「公的統計におけるデータ補正の新展開:欠測値処理方法等に関する検討」という企画テーマで研究を推進し、個体行動に関する実証分析を通じて、バイアスを考慮した推定手法や予測手法の適用可能性など、ミクロデータによる計量分析手法のさらなる展開を図る。
備考

統計若しくは統計的研究の成果又はその概要等

匿名データの提供を受けた者の氏名又は名称 高橋 将宜
提供した匿名データに係る統計調査の名称 全国家計構造調査(旧全国消費実態調査)
統計又は統計的研究の成果等のタイトル等 A new robust ratio estimator by modified Cook’s distance for missing data imputation
作成した統計若しくは行った統計的研究の成果又はその概要 マクロ集計値による分析が主流であった20世紀半ばとは異なり,21世紀初頭の今日では,ミクロレベルの個体行動に関する実証分析が重要となっている.そこで, 全国消費実態調査のデータを用いた個体行動に関する実証分析を通じて,バイアスを考慮した推定手法や予測手法の適用可能性など,ミクロデータによる計量分析手法の展開を図った.具体的には,世帯員の職業ごとに,家計上の年間収入と実支出,食料費及び消費支出に関して,全国消費実態調査の匿名データに人工的に(意図的に)欠測を発生させて,欠測値の処理方法等について検討した.その結果,2つの新たな方法論を提案した.1つ目は,傾向スコアマッチングを適用したことによる,比率代入法の多変量化である.2つ目は,クックの距離を応用したことによる,比率代入法の外れ値への頑健化である
上記統計の作成又は統計的研究を行うに当たって利用した調査票情報に係る統計調査の名称、年次、当該調査票情報の地域の範囲その他の当該調査票情報を特定するために必要な事項 全国消費実態調査  平成16年
上記統計の作成の方法又は統計的研究の方法を確認するために特に必要と認める事項 本研究では,新たに提案した手法の検証用データとして匿名データを使用した.具体的には,匿名データを仮想的な母集団として設定して,そこから複数回のサブサンプリングを実行することで,提案手法のバイアスや有効性を検証した.
学術雑誌等の名称及び掲載年月日 論文①統計学 第119号 時期 2020年9月 論文②Japanese Journal of Statistics and Data Science 5 (2) 時期 2022年12月

成果等

論文① 
論文②