[インシデントまとめ] 2019年1月のデータリーク「Collection #1」をまとめてみた

2019年1月17日、オーストラリアのセキュリティ研究者 Troy Hunt氏は大規模なデータリーク「Collection #1」が公開されていると連絡を受け、このデータの解析結果を報告しました。ここでは関連する情報を簡単にまとめます。

Troy Hunt氏の記事

要点

記事の要点をまとめると次の通り。

  • データリークセットの呼称は「Collection #1」と呼ばれるもの。
  • 2019年1月7日の週に複数人からこのデータリークについて連絡受けた。
  • データは人気のあるハッキングフォーラムに掲載され、クラウドサービス(MEGA)で公開されていた。(その後削除された)
  • このデータには数年前にTroy Hunt氏自身が利用していたメールアドレス、パスワードが含まれていた。
  • 解析したデータはHaveIBeenPwnedPwned Passwordsに追加が済んでおり、自分の情報が対象となっているかは確認可能な状態となっている。
  • 固有メールアドレスで確認された件数(約7億7300万件)としてはこれまでTroy氏が確認したもので最大の件数。
  • サイトの侵害時期はファイルによりけりで2008年頃とみられるものもある。

2019年1月7日にフォーラムへ投稿されたMega上での公開を確認したと報告

f:id:Kango:20190118061751p:image:w640

関連する数字

今回の件に関連する数字をまとめると次の通り。

(1)データリークに含まれるファイル数12,000個以上
(2)データのサイズ87.18 GB
(3)(1)に含まれる全てのデータ件数2,692,818,238件
(4)(3)の内、一意なメールアドレス、パスワード組み合わせ件数1,160,253,228件
(5)(3)の内、HIBPに追加された固有のメールアドレスの件数772,904,991件
(6)(3)の内、一意なパスワードの件数21,222,975件

Collection #1に含まれるJPドメインの件数

  • Troy Hunt氏はフォーラムに掲載されていたファイルリストをPastebin上で公開した。
  • ファイル名が次の命名規則でつけられている模様。
侵害が疑われるドメイン {取得したとみられるデータの件数} [パスワードハッシュ化の有無].txt

この「侵害が疑われるドメイン」の文字列箇所について、.jpドメインが含まれる数を確認してみたところ次の結果となった。

.jpドメインの文字列が含まれる件数38個
2018年2月に確認されたものと重複しない件数20個

(参考)2018年2月に確認されたデータリークをまとめた記事

更新履歴

  • 2019年1月18日 AM 新規作成