データマイニングは間違いなく、証拠を得るのに役立つ最も客観的なプロセスです。例えば以下の二つのうち、 どちらの情報があなたの取材を軌道に乗せる可能性が高いでしょうか。
①看護師の盗難に関するある病院の患者からの告発
②過去5年間の盗難の告発が発端となり、懲戒審問および解雇が行われたことに関する保健省のデータベース
もちろんすべての情報と同様に、統計でさえ操作され誤解させるために使われている可能性があることに注意する必要があります。しかし、データベースの効率的な「マイニング(データ解析の技法を大量のデータに適用することで知識を取り出す技術)」により、過去10年間に非常に重要な記事が公開されています。
国際的なデータは、さらに関連性の高い結果を提供できます。
例えば開発援助の寄付者は、特定の年にどのようにお金を使ったかについての報告書を発行します。あなたの国で活動している寄付者のデータを収集して分析することにより、「公務員の訓練にX国への寄付者の援助金がほぼ全額使われた」という見出しの記事を伝えることができます。
データマイニングは必ずしも財政・金融について使う必要はありません。 ソーシャルネットワークの分析から、テロリストネットワーク、政党支持者、および特定のコミュニティで最も影響力のある人々に関する記事が書かれています。
これらのネットワークは、特定の職業、地理的コミュニティ、または政党の著名人などのメンバーである可能性があります。 あなたは彼らがどれだけ稼いでいるか、彼らが誰と働き、会っているかについてのデータを組み合わせて、彼らの社会への影響について伝えるソーシャルネットワークの絵を描くことができます。
あなたはすべてをゼロから始める必要はありません。 多くのジャーナリストや組織が、さらなる探索のベースとして利用できるように既存のデータを公開しています。 これらのデータベースには、記事、探索結果、研究成果、および情報提供者も含まれています。 米国とヨーロッパでは、探査報道ジャーナリストが一般向けのデータベースを作成するセンターを設立しています。 アジアの例をあげると、シンガポール政府もある程度のデータを公開しています
たとえば、米国のNICAR(The National Institute for Computer-Assisted Reporting)は、グアンタナモ湾の被収容者に関するデータを収集し、このデータベースを下記のサイトで一般に公開しています。http://www.ire.org/nicar