2016年頃に話題になったGitHub上で男性が行ったプルリクエストと女性が行ったプルリクエストを元にオープンソースコミュニティにジェンダーがどのように作用しているかという論文がありました。

実際の論文の内容が気になったので、PDFを今回読んでみたのでその感想をまとめます。

GitHubのデータに対してジェンダーバイアスの影響を分析

この調査はGitHubのパブリックなビッグデータを元に、Google+のプロフィールと照らし合わせて性別を推定した上でさまざまな分析をしています。分析に使われたジェンダーバイアスの影響に関する手法はジョーン・ウィリアム氏が提唱したパターンの中で下記の4つのモデルを分析しています。

  • 1) Prove It Again
    • 一つ目は、女性が常に自信を証明し続けないといけないという傾向にあります。
  • 2) The Tightrope
    • 二つ目は、女性は常に、「女性さしさ」と「男性らしさ」の境界線を、tightrope (綱渡り)している状況にあります。過度な女性らしさは、真摯に対応して貰えず、過度な男性らしさは、好かれません。
  • 3) The Maternal Wall
    • 三つ目は、「母親」である状況によって作られる「壁」です。母親になれば、実力やコミットメントに対する否定的な偏見があります。不思議な事に、この壁は、子供のいない女性や、出産願望がない女性にも影響を及ぼします。
  • 4) Tug Of War
    • 最後に、これらのすべての要素が交わり、反映された結果として、女性に苦しみや葛藤を齎す状況を、Tug of War(綱引き)と言います。

上記はLEAN IN Tokyoの記事から引用。

上記の手法の元になった書籍はまだ和訳はないようです。

GitHub上での活動の場合の仮説

論文では上記のモデルをGitHub上での活動に当てはめた上で下記のような仮説を立てています。またわかりやすくする為に調査の結果、仮説を支持する結果があったものに✅をつけておきます。

  • Prove It Again
    • 女性は男性よりも長い説明をプルリクエスト時にしている
    • 女性からのプルリクエストはより長い議論になり、変更を多く求められる
    • 女性はプロフィール上で自身の能力をより多くアピールしている
    • ✅ 女性のプルリクエストは男性よりも少ないプロジェクトや組織に集中する
  • The Tightrope
    • ✅ 女性は過度に礼儀正しさを表すことを避ける
    • ✅ 女性は男性よりも口汚い言葉を避ける
    • ✅ 女性は男性よりもあいまいな感情表現をする
    • ✅ 女性は男性よりも中立的な文字表現をする (絵文字の使用)
    • 女性は男性よりもステレオタイプ的な男性的な行動も女性的な行動も避ける
  • The Maternal Wall
    • 女性は男性よりも子育てしていることを表さない(プロフィール写真など)
  • Tug Of War
    • 女性は女性からのプルリクエストを男性比べて承認しない
    • 女性からのプルリクエストが女性にレビューされる場合に男性と比べて多くの議論と変更を求められる

Prove It Againに関する仮説はある程度いい方向に外れたようです。つまり女性からのプルリクエストの方が男性からのプルリクエストよりもスムーズに承認されていました。特に説明がないプルリクエストの承認率は女性からの場合、47.4%だったのに対して男性からの場合は29.9%とかなり違っています。 この事実が以前、日本語で出回った記事「女性のほうが男性より貢献率が高い」という見出しにつながったと思われます。一方で貢献先のプロジェクトや組織は男性よりも少ないという傾向は確認できたとのことで、論文の中では繋がりの深いプロジェクトやGitHub外でのコミュニケーションなどを取っていることで高い承認率に繋がっているのではと推測しています。

The Tightropeについては概ね仮説を支持する結果が出ており、GitHub上での表現の仕方や絵文字の使用などで女性は男性よりも慎重な行動をしているようです。 白熱した議論などでギークが非常に感情的な表現や強い表現をすることはよく見かけますが、ああいった行動は女性にとってはよりリスクが大きく避けられているようです。

The Maternal Wallについてはそもそもサンプル数が少ない(GithubとGoogle+で同じアカウントを使い、子供の写真をプロフィールにしている)こともあって有意な結果が得られなかったようですが、それでも男性の方が子供の写真をプロフィールにしていることは女性よりも多かったようです。

Tug Of Warについてはこれもサンプル数が少ない(女性のプルリクエストが女性にレビューされる)こともありつつも、女性が女性の足を引っ張るような結果ではなかったようです。(男性、女性、承認、却下で食い違う結果)

感想

実際に論文を読んでみると、やはり以前のニュース記事とは違った印象を持ちました。以前の日本語に翻訳された記事ではプルリクエストの通過率に関する部分を部分的に取り上げている形でしたが、読んでみた印象ではThe Tightropeの部分が非常に納得しました。

SNSでの活動なども含めてエンジニアの表現、語句の選び方が攻撃的すぎるように感じることがありますが、こういった行動はある意味で「男性の特権」なのではないかと感じました。

また今回の調査はオープンなデータのあるGitHubのパブリックなリポジトリを対象にしていますが、同じような分析を業務内の活動に対して行った場合はかなり違った結果になるのではと疑問を持ちました。そもそも今回のデータもGoogle+との紐付けに性別判定や育児中かどうかなどの推測を頼っているので、これがより明らかな業務内の活動などでは提示されている仮説にあてはまるようなケースはもっとあるのではと思います。

調査に手法についても機械的な感情分析などは言語の問題が大きく、英語以外の言語では違ったアプローチが必要でしょう。

絵文字を文章の文脈推定に使う手法は日本語を対象にした場合はより面白い結果になりそうな気がします。直接のエンジニアリングから離れますが、同じような手法でSlackのやりとりなどを分析した場合にはジェンダーバイアスの影響が見つかる可能性は高いように思います。

上記の論文は公開から時間も経ち、後続の研究から引用されていることも多いようなので次はそれを見てみようかと思います。