スポンサーと賞の情報


伊藤忠テクノソリューションズ株式会社

伊藤忠テクノソリューションズ賞(学部生・高校生部門)
賞品:Fitbit x 人数分


株式会社ADKマーケティング・ソリューションズ

ADK賞(ポスター賞)
賞品:Amazon Echo Spot x 人数分


日本経済新聞社

Data Scientist Fes 2019賞(プレゼンテーション賞)
賞品:図書カード 2万円 x 人数分


株式会社日立製作所

日立製作所賞(比例部門)
賞品:ディズニーランドペアチケット x 人数分


株式会社ブレインパッド

ブレインパッド賞(選挙区部門)
賞品:Amazonギフトカード 10万円


株式会社みずほ銀行

みずほ銀行賞(ダイバーシティ賞)
賞品:Apple TV x 人数分


コンペティションの規則

概略

このコンペティションの目的は、みなさんが持っている政治や選挙に関する知識と統計やデータサイエンスのスキルを組み合わせ、2019年の参議院選挙の正確な予測を行い、競い合うことです。

予測には、過去の選挙結果、世論調査、人口動態、経済データ、ニュース報道、ソーシャル・メディアのテキストデータといった一般に利用可能などのようなデータソースも用いることができます。また、選挙予測について提起されている理論や方法を学び、そして独自性のある発想や仮説を革新的に用いることが奨励されています。

予測は投票日前に提出する必要があります。予測が実際の選挙結果にどれだけ近いかに加え、予測モデルの厳密さや独自性、審査員の前で行うプレゼンテーションに対する評価を合わせて受賞チームが決定されます。

提出ファイル

以下の3種類のファイルを投票日前日(7月20日日本時間23時59分)までに提出する必要があります。

  1. 予測が含まれた2つのCSVファイル(以下参照)
  2. モデル構築に使った分析コード
  3. データと分析方法を説明したスライド(PDF形式に限る、日本語あるいは英語、A4横サイズ最大8枚)

注:スライドのファイル形式について、PPTではポスター印刷の際に体裁の崩れ等が出る可能性があるため、PDFに限定いたしました。Powerpointを用いてスライドを作成した場合、PDFにexportした上提出してください。ビデオやアニメーションは用いることはできません。(2019/07/03 加筆)

日本の参議院議員は比例代表と選挙区の二つの選挙制度により選出されます。それぞれについて結果の予測を2つのCSVファイルで提出する必要があります。

比例代表:比例代表用のCSVファイルには、主催者側で指定した7つの政党(自由民主党、立憲民主党、国民民主党、公明党、日本維新の会、日本共産党、社会民主党)の予測得票率を保存します。提出ファイルは以下のような形式となります。

*注:7政党の得票率の合計は100である必要はありませんが、必ず100以下である必要があります。なお、提出された7政党の得票率の合計が100を下回った場合、以下の取り扱いをします。

  • 100から7政党の予測得票率の合計値を引き、「残余」とする
  • 「残余」を7政党以外の党が実際に獲得した得票数によって按分する。
  • その後、0以上の得票率のあったすべての政党についてドント方式を用いて議席数に変換し、実際の獲得議席との差を取る。
party, vote_share
A党, 30.00
B党, 29.99
   …

選挙区:選挙区用のCSVファイルには、選挙区名、候補者名、それぞれの候補者の予測結果(当選者1、落選者0)を保存します。選挙区の中には複数の候補者が当選する(定数が2以上の)ところがある点には留意してください。提出ファイルは以下のような形式となります。

 district, candidate_J, candidate_E, outcome
 Hokkaido, 石田一郎, Ishida Ichiro, 1
 Hokkaido, 山田太郎, Yamada Taro, 0
 Hokkaido, 佐々木藍子, Sasaki Aiko, 1
   …

ここで「candidate_J」と「candidate_E」は、それぞれ日本語(JapaneseのJ)とローマ字(EnglishのE)の候補者名を表します(主催者側から提供されます)。提出ファイルには、当選すると予測している候補の情報だけではなく、全ての候補者について結果予測を保存する必要があります。

重要:”outcome”の列で1の値を取る行の数が(実際に当選する候補者数の)74でなければエントリーが無効になります。

政党と候補者のリストは、選挙の公示後に主催者側から提供されます(政党は英語、候補者は日本語とローマ字の両方)。

データと分析方法を説明したファイルは8枚のスライドから構成されている必要があります。この8枚のスライドは発表会・授賞式の日に(a)ポスターとして掲示され、(b)(b)プレゼンテーションをするトップチームに選出された場合、チームによる8分間のプレゼンテーションの際に用います。(2019/05/13 加筆)

審査

提出された予測の精度は、実際の選挙結果、すなわち確定した議席とどれだけ近いかをもとに評価します。比例代表では、予測された得票率を議席に変換した上で、実際の議席数との差で評価します。得票率から議席数への変換は実際の選挙で使用されている方法に基づいて主催者が行います。詳細については以下を参照。

詳細: 比例代表では、予測された得票率を実際の選挙で使用されているドント方式(D’Hondt method)を用いて議席数に変換します。予測をもとに変換された議席数と実際の議席数の誤差の絶対値を各政党について求め、それらの総和を2で割った値を減点値とします(過大予測による誤差は常に過小予測による誤差を伴うため)。比例代表における得点は、最高得点である50(50議席が争われているため)からこの減点値を引いた値になります。 (2019/05/13 加筆)

選挙区では、当選を正しく予測できた人数をもとに評価します。

チームが獲得できる最高得点は124点です(比例代表の50点+選挙区の74点)。 (2019/05/13 加筆)

得点に加えて、予測モデルの斬新さ及び汎用性、プレゼンテーションの質を合わせて審査員が評価し、最終順位が決まります。(「汎用性」の箇所について2019年5月15日加筆)

ルール

選挙結果の予測にはあらゆる公開データ(誰にでもアクセスが可能なもの)が利用可能です。使用したデータについては、主催者の要請に応じてすべての情報を提出しなくてはなりません。分析に用いられたデータが第三者に共有不可能なものである場合、主催者の要請に応じてスクリプトや、その他の資料を提供しなければなりません。

Twitterのデータを予測に用いる場合、同社の利用規定に違反しないようにする必要があります。利用するチームは同社の利用規定を「データ」ページ経由で必ず確認してください(2019/5/23 加筆)

重要:公職選挙法に抵触するため、選挙が終わるまで選挙予測を公開することは認められません。

特定のチームのみとデータ、分析モデルを共有することは認められません。(2019/05/13 加筆)

このコンペティションに参加できるのは、早稲田大学各学部・研究科に在籍中の学部生・大学院生、早稲田高等学院、本庄高等学院の高校生となります。チームに助手やポスドク研究員を含む場合は別枠で審査されます。教員を含むチームは賞の対象とはなりません。チームの構成員数は2人以上4人以下である必要があります。

複数のチームのメンバーとなることは認められません。参加できるのは1人1チームのみです。(2019/05/13 加筆)

各賞の受賞対象となるには、ファイル提出に加えて、授賞式当日に分析手法と予測結果のプレゼンテーションをする必要があります。メンバー全員が出席する必要はありませんが、少なくとも1人は口頭、もしくはポスター発表によるプレゼンテーションをしなければなりません。

多様性

チームは幅広い多様性を持ったメンバーから構成されることが奨励されています。これはコンペティションの課題に取り組む際に多様な観点やアイデアが要求されていることによります。多様性の定義には、異なるジェンダー、国籍、年齢、学問領域、マイノリティグループに属する個人を構成員として含むことなどが含まれます。チームエントリーの際に構成員の多様性について説明する機会があり、対象チームの中で一番優秀な成績を収めたチームに特別賞が授与されます。 (2019/05/13 加筆)

  • 最優秀賞: 賞金10万円
  • 政治經濟學會賞:賞金5万円
  • 伊藤忠テクノソリューションズ賞
  • ADK賞
  • Data Scientist Fes 2019賞
  • 日立製作所賞
  • ブレインパッド賞
  • みずほ銀行賞

政治經濟學會賞は、政治経済学術院の学生で構成された最優秀チームに送られます。1つのチームが複数の賞を受賞することは可能ですが、最優秀賞と政治經濟學會賞の受賞チームは他の賞を受賞できません。

スケジュール

  • 2019年6月26日(水):チームエントリー期限
  • 2019年7月4日(木):選挙の公示
  • 2019年7月20日(土)23:59(日本時間):各種ファイル提出期限 (厳守)
  • 2019 年7月21日(日):衆議院議員選挙 投開票日
  • 2019 年7月27日(土):発表会、授賞式、懇親会

主催者

  • データ科学総合研究教育センター 小林学、須子統太(社会科学学術院)
  • 政治経済学術院 日野愛郎、多湖淳、上田路子
  • 現代政治経済研究所 Robert Fahey

問い合わせ:データ科学総合研究教育センター cds-pse-compe@list.waseda.jp