Twittersphereのボット

訂正(2018年4月):元のレポートでは、「リベラル」と「保守派」という言葉が1つの文で逆になっています。 「疑わしいボットは、主にによって共有されている政治サイトへのリンクの約41%を共有しています。リベラル政治サイトへのリンクの44%は、主に保守派-統計的に有意ではない違い '。別の文では、「リベラル」の代わりに「保守派」という言葉が誤って使用されていました。対照的に、自動化されたアカウントは、政治サイトへのリンクの41%を、主にリベラル、およびそれらの44%は主に保守派で構成されています。 これらの修正は、研究の自動化されたアカウントが、全体的なリンク共有行動においてリベラルまたは保守的な「政治的バイアス」の証拠を示さなかったという結論を変えるものではありません。

「実質的に」という単語も次の文から削除されました。「Twitter自体に関連付けられたリンクは、疑わしいボットアカウントによって約50%の時間共有されています。これは、分析された他の主要なコンテンツカテゴリよりも大幅に少ないシェアです」。 50%の数字は実質的に6つのカテゴリーのうち5つよりも小さい。この修正は、レポートの分析を実質的に変更しません。

いわゆるソーシャルメディア「ボット」(人間が直接関与することなくコンテンツを投稿したり他のユーザーとやり取りしたりできる自動アカウント)の役割は、近年多くの精査と注目を集めています。これらのアカウントは、さまざまなトピックに関する質問にリアルタイムで回答したり、ニュース記事やイベントに関する自動更新を提供したりすることで、ソーシャルメディアエコシステムで貴重な役割を果たすことができます。同時に、ソーシャルメディアでの政治的言説の認識を変えたり、誤った情報を広めたり、オンラインの評価およびレビューシステムを操作したりするためにも使用できます。ソーシャルメディアがニュースと情報の環境全体でますます目立つ位置に到達するにつれて、ボットはアメリカ人の変化するニュースの習慣、オンラインでの会話の趣旨、オンラインでの「偽のニュース」の普及をめぐる幅広い議論に巻き込まれました。

ボットの役割と性質に関するこれらの進行中の議論の文脈で、ピュー研究所は、Twitterで共有されているリンクの数(そのほとんどはプラットフォーム自体の外部のサイトを参照しています)がボットによって促進されていることをよりよく理解するために着手しました人間ではなく。これを行うために、センターは最も人気のあるWebサイトの2,315のリストを使用しました12017年夏の約6週間に、これらのサイトへのリンクを含む約120万件のツイート(英語ユーザーから送信)を調査しました。この結果は、自動アカウントがさまざまな著名人へのリンクを広める上で果たす広範な役割を示しています。 Twitterのウェブサイト。

この調査では、Twitterボットをどのように定義していますか?

大まかに言えば、Twitterボットは、コンテンツを投稿したり、他のユーザーと自動化された方法で直接人間の入力なしで対話したりできるアカウントです。

ボットは多くの目的で使用されます。この調査では、特定の種類のボットの動作に焦点を当てています。つまり、Web上のコンテンツへのリンクをツイートまたはリツイートするボットです。言い換えれば、これらは特定のWebサイトやその他のオンラインコンテンツを投稿または宣伝するボットです。



多くのボットは自分自身をボットとして識別しないため、この調査ではボットメーターと呼ばれるツールを使用して、自動または部分的に自動化されたアカウントによって投稿されたWeb上の人気サイトへのTwitterリンクの割合を推定します。ある調査によると、ボトメーターは約86%正確であり、Pew ResesarchCenterはボトメーターシステムの独自の検証テストを実施しました。誤分類の可能性を認めるために、このレポート全体で「ボットの疑い」という用語を使用します。ボトメーターの機能の詳細については、方法論を参照してください。

この調査の重要な調査結果の中には:

  • ツイートされたすべてのリンクのうち2 3人気のあるWebサイトでは、66%が、人間のユーザーではなく、自動化された「ボット」に共通する特性を持つアカウントによって共有されています。
  • 人気のあるニュースや現在のイベントのWebサイトの中で、ツイートされたリンクの66%は、疑わしいボットによって作成されています。これは、全体の平均と同じです。ボットが作成したツイートリンクの割合は、特定の種類のニュースサイトの間でさらに高くなっています。たとえば、ウェブ全体からの記事をまとめた人気のある集約サイトへのツイートされたリンクの推定89%は、ボットによって投稿されています。
  • 比較的少数の非常にアクティブなボットが、著名なニュースやメディアサイトへのリンクのかなりの部分を占めています。この分析では、この調査が実施された期間中、最もアクティブな500の疑わしいボットアカウントが、人気のあるニュースや現在のイベントサイトへのツイートされたリンクの22%を占めていることがわかりました。比較すると、500人の最もアクティブな人間のユーザーは、これらのアウトレットへのツイートされたリンクのはるかに少ないシェア(推定6%)に責任があります。
  • この調査では、自動化されたアカウントが現在、全体的なリンク共有動作にリベラルまたは保守的な「政治的バイアス」を持っているという証拠は見つかりません。これは、政治志向の資料を含むニュースサイトのサブセットの分析から明らかになります。疑わしいボットは、主にリベラル派が共有する政治サイトへのリンクの約41%と、主に保守派が共有する政治サイトへのリンクの44%を共有しています。この違いは、統計的に有意ではありません。対照的に、疑わしいボットは、ニュースや現在のイベントサイトからのリンクの57%から66%を共有しており、主にイデオロギー的に混合された、または中道的な人間の聴衆によって共有されています。

動作中のTwitterボットの例

ボットはさまざまな目的に使用できます。 Twitterでさまざまなタスクを実行するボットの例を次に示します。

  • Netflix Bot(@netflix_bot)は、新しいコンテンツがオンラインストリーミングサービスに追加されると、自動的にツイートします。
  • Grammar Police(@_ grammar_)は、文法的に正しくないツイートを識別し、正しい使用法の提案を提供するボットです。
  • Museum Bot(@museumbot)は、メトロポリタン美術館からランダムな画像を投稿します
  • CNN速報ニュースボット(@attention_cnn)は、CNNが速報ニュースを持っていると主張するたびにアラートを送信する非公式アカウントです。
  • New York Times 4th Down Bot(@ NYT4thDownBot)は、ライブNFL分析を提供するボットです。
  • ワシントンポスト(@PowerPost)によるPowerPostは、ワシントンの意思決定者に関するニュースを提供するボットです。

これらの調査結果は、2017年7月27日から9月11日までの期間に、人気のあるWebサイトへのリンクを含む英語ユーザーからの約120万件のツイートのランダムサンプルの分析に基づいています。4この分析で使用された人気のあるサイトのリストを作成するために、センターは調査期間の最初の18日間で最も共有された約3,000のWebサイトを特定し、さまざまな特性に基づいてコード化しました。5死んだ、重複した、またはコンテンツを分類するのに十分な情報がないサイトに向けられたリンクを削除した後、研究者は2,315のWebサイトのリストに到達しました。

まず、これらのサイトは、主な重点分野に基づいて6つの異なるトピックグループに分類されました。トピックのグループ化には、アダルトコンテンツ、スポーツ、有名人、商用製品またはサービス、組織またはグループ、ニュースおよび現在のイベントが含まれます。これらの主要なカテゴリと比較するために、研究者はTwitter自体のコンテンツにリダイレクトされたリンクを別のカテゴリに分類しました。

次に、ニュースと現在のイベントに幅広く焦点を当てていると分類されたサイト(合計で925サイトがこの基準を満たしました)は、その後、次の3つの追加基準に基づいてコード化されました。

  • サイトのコンテンツの大部分が、他のサイトまたは出版物によって作成された集約または再発行された資料で構成されているかどうか。
  • サイトに政治セクションが含まれているかどうか、および/またはそのトップヘッドラインに目立つように政治記事が掲載されているかどうか。そして
  • サイトに連絡先ページがあるかどうか(サイトが読者にコメントやフィードバックを送信する機能を提供するかどうかのプロキシとして機能できる特性)。

第三に、センターは、政治記事または政治セクションを特集し、主に米国の視聴者にサービスを提供するニュースおよび時事問題サイトの追加のサブセットを特定しました。これらの政治志向のニュースおよび時事問題サイトのそれぞれは、主にリベラルな聴衆、保守的な聴衆、または混合読者を持つものとして分類されました。6

次のステップは、それらのサイトへのツイートされた各リンクを調べて、リンクが自動アカウントから投稿されたかどうかを判断することでした。ボットを特定するために、センターは南カリフォルニア大学とインディアナ大学の研究者によって開発された「ボットメーター」と呼ばれるツールを使用しました。 Botometerは、アカウントの年齢、投稿の頻度、フォロワーネットワークの特性など、さまざまな基準に基づいて、特定のアカウントが自動化されているかどうかを推定します。 Pew Research Centerのボットメーターシステムのテストに基づいて自動化される可能性が比較的高いと推定されたアカウントは、この分析の目的でボットとして分類されました。7

まとめると、上記のデータ収集、サイトコーディング、およびボット検出分析は、次の重要なリサーチクエスチョンに対する回答を提供します。人気のあるウェブサイトへのツイートされたリンクの何パーセントが、人間のユーザーではなく自動化されたアカウントによって投稿されていますか?

この調査は、ソーシャルメディア上の情報環境と、ユーザーがこれらのデジタル空間に関与する方法を調査する一連のピューリサーチセンターレポートの一部です。以前の研究では、移民ニュース​​に関するツイートの性質とソース、二極化した議会でソーシャルメディアを介してニュースを共有する方法、ソーシャルメディア上の科学情報が共有および信頼される程度、ソーシャルメディアの役割が文書化されています。オンラインハラスメントのより広い文脈、人種関係のような主要な社会問題がこれらのプラットフォームでどのように展開するか、そしてさまざまなグループがTwitter上でどのように自分自身を配置するかのパターン。

ボットアカウントは、プロファイル内でそのように明確に識別されるとは限らず、ボット分類システムには必然的にエラーのリスクが伴うことに注意することが重要です。ボトメーターシステムは、一連の学術出版物で文書化および検証されており、センターの研究者は、その結果について多数の独立した検証手段を実施しました。8ただし、一部の人間のアカウントは自動化されたものとして誤って分類される可能性があり、一部の自動化されたアカウントは本物として誤って分類される可能性があります。したがって、疑わしいボットアカウントによるトラフィックのシェアのこれらの見積もりには、ある程度の不確実性があります。

さらに、このレポートで説明されている分析は、特定の期間に収集されたツイートのサブセットに基づいています。これは、すべてのWebサイトまたはすべてのメディアプロパティの分析ではなく、Twitterに投稿されたコンテンツへのリンクの数によって測定される人気のあるWebサイトおよびメディアアウトレットの分析です。この分析は、これらのリンクが「良い」ボットまたは「悪い」ボットによって共有されているかどうか、またはそれらのボットが米国内外から制御されているかどうかを評価しようとはしていません。また、問題のツイートのリーチを評価しようともしていません。ボットが生成したコンテンツを見たり、クリックしたり、その他の方法で関与した人間のユーザーの数を特定するため。

ボット分類の取り組みの詳細については、このレポートの方法論をご覧ください。

自動化されたアカウントアクティビティは、Twitterエコシステム全体で顕著です

自動化されたアカウントは、Twitterエコシステム全体のコンテンツへのリンクをツイートする際に重要な役割を果たします。センターの分析によると、最も人気のあるWebサイトへのツイートされたすべてのリンクの推定66%は、人間のユーザーではなく、自動化されたアカウントによって投稿されている可能性があります。

特定の種類のサイト(特にアダルトコンテンツやスポーツに焦点を当てているサイト)は、自動化されたアカウントからTwitterリンクの特に大きなシェアを受け取ります。自動化されたアカウントは、調査期間中にアダルトコンテンツに焦点を当てた人気のあるWebサイトへのすべてのツイートリンクの推定90%を占めていました。スポーツコンテンツに焦点を当てた人気のあるWebサイトの場合、そのシェアは76%と推定されました。

自動化されたアカウントは、他のタイプの人気のあるサイトのリンク共有のわずかに少ない割合を占めています(いずれの場合も依然として過半数ですが)。最も注目すべきは、センターの分析によると、Twitterで最も人気のあるニュースや最新のイベントサイトへのツイートされたリンクの66%がボットアカウントによって共有されている可能性が高いということです。この数字は、最も人気のあるサイト全体の平均と同じです。自動化された疑いのあるアカウントは、商用製品またはサービスに焦点を当てた人気のあるサイトに投稿されたリンクの割合が高く(73%)、有名人のニュースや文化に焦点を当てたサイトの割合は低くなっています(62%)。自動アカウントによるリンク共有の割合は、Twitter.comに関連付けられたリンク(つまり、Twitterで停止し、外部サイトにリダイレクトされないリンク)の場合、この調査の6つのトピックカテゴリと比較して最も低くなっています。 Twitter自体に関連付けられたリンクは、疑わしいボットアカウントによって約50%の時間共有されます。これは、分析されたコンテンツの他の主要なカテゴリよりも少ない共有です。

焦点:人気のあるニュースや時事問題のウェブサイトは、ボットによるツイートでリンクされています

自動化されたアカウントは、Twitterのさまざまなオンラインメディアへのリンクのかなりの部分を投稿します。上記のように、センターの分析では、人気のあるニュースや時事問題のWebサイトへのツイートされたリンクの66%がボットによって投稿されていると推定されています。分析では、比較的少数の自動化されたアカウントが、Twitterで人気のあるメディアへのリンクのかなりの部分を占めていることもわかりました。この調査が実施された期間中、500の最もアクティブな疑わしいボットアカウントだけが、これらのニュースおよび現在のイベントサイトへのすべてのリンクの22%を占めていました。対照的に、500の最もアクティブなヒューマンアカウントは、そのようなサイトへのすべてのリンクのわずか6%を占めていました。

センターの分析によると、特定の種類のニュースや時事問題のサイトは、自動化されたアカウントによってツイートされる可能性が特に高いようです。これらの中で最も有名なものの中には、集約サイト、または主にWeb上の他の場所からのコンテンツをコンパイルするサイトがあります。調査期間中のこれらの集約サイトへのリンクの推定89%は、ボットアカウントによって投稿されました。

自動化されたアカウントはまた、編集者や他のスタッフに連絡するための公開の連絡先ページや電子メールアドレスがないサイトへのリンクの割合が平均よりいくらか高くなっています。このタイプの連絡先情報は、訂正または追加のレポートの基礎として役立つ可能性のある読者のフィードバックを送信するために使用できます。この調査で調査された人気のあるニュースおよび現在のイベントサイトの大部分(90%)には、Twitter以外の一般公開の連絡先ページがありました。このタイプの連絡先ページがない少数のサイトは、連絡先ページがあるサイトよりも高い割合でボットの疑いで共有されていました。このようなサイトへのリンクの約75%は、調査期間中にボットの疑いのあるアカウントによって共有されていましたが、連絡先ページのあるサイトでは60%でした。

一方、特定の種類のニュースや時事問題のサイトは、自動化されたアカウントからTwitterリンクのシェアが平均よりも低くなっています。最も注目すべきことに、この分析は、政治的コンテンツを特徴とする人気のニュースおよび時事問題サイトが、センターが分析したニュースおよび時事問題コンテンツのタイプの中でボットアカウントからのリンクトラフィックのレベルが最も低く、他の要因を一定に保っていることを示しています。調査期間中の政治または政治コンテンツを目立つように取り上げた人気のあるメディアソースへのすべてのリンクのうち、57%はボットアカウントから発信されたと推定されています。

Twitterボットは、中道のTwitterオーディエンスからより多くのコンテンツを投稿します

リベラル派と保守派のどちらが共有するメディアソースがより自動化されたアカウントトラフィックを見ているのかという問題は、昨年、議論の的となっています。一部の人々は、疑わしいボットアカウントが、イデオロギーの範囲の左側または右側のいずれかで、超党派の政治ニュースを共有するのに多作であると懸念を表明しています。

ただし、センターの分析によると、自動化されたTwitterアカウントは、イデオロギー的に混合した、または中道的な人間の聴衆がいるサイトからのリンクの割合が実際に高くなっています。少なくとも、政治ニュースや問題を志向する人気のニュースや時事問題のサイトの領域内です。ひいては、これらの自動化されたアカウントは、イデオロギー的に保守的またはリベラルな人間の聴衆とサイトからのリンクを共有する可能性が低くなります。さらに、ボットトラフィックの割合の左右の違いは重要ではありません。

この分析は、人気のあるニュースや時事問題のサブグループに基づいており、見出しに政治的な記事が掲載されているか、政治セクションがあり、主に米国の視聴者にサービスを提供しています。 2,315の人気サイトの完全なサンプルのうち合計358のWebサイトがこれらの基準を満たしました。研究者は、調査期間中にTwitter上のそれらのサイトへのリンクを共有している疑わしい非自動アカウントを分離し、コレスポンデンス分析と呼ばれる統計手法を使用して、各サイトのTwitterオーディエンスのイデオロギーを推定しました。

コレスポンデンス分析では、最初に、個々のサイトが一部のユーザーによって共有され、他のユーザーによって共有されていないことを測定します。次に、それらをグループ化し、差異の程度を定量化します。この分析に基づくと、スコアが0より大きい場合は、サイトのオーディエンスがより一貫して保守的であることを示し、スコアが0未満の場合は、サイトのオーディエンスがより一貫してリベラルであることを示します。これは、行動によって明らかにされたイデオロギーの好みを推定する学術研究に基づく手法です。研究者はこの方法を使用して、リベラル、保守的、または中程度のオーディエンスが主に共有しているサイトと、ボットが各種類のサイトを共有している回数を確認できます。コレスポンデンス分析は、ウェブサイトのコンテンツを分析せずに、人間のユーザーの共有パターンのみを分析することなく、オーディエンスのイデオロギーの推定値を生成することに注意することが重要です。詳細については、方法論のセクションを参照してください。

センターの分析によると、疑わしい自律アカウントは、よりリベラルな、またはより保守的なオーディエンスによって頻繁に共有されるサイトではなく、イデオロギースペクトルの中心近くでスコアを付ける人間のユーザーによって主に共有されるサイトへのリンクの割合が高いことがわかりました。分析によると、自動化されたアカウントは、イデオロギー的に混合された、または中道的な人間の聴衆によって共有されている政治サイトへのリンクの約57%から66%を共有しています。対照的に、自動化されたアカウントは、政治サイトへのリンクの約41%を、主にリベラル派で構成されるオーディエンスと共有し、44%は主に保守派で構成されると推定されています。リベラルなオーディエンスを持つサイト間での共有率は、保守的なオーディエンスを持つサイトと大きな違いはありません。ただし、中道政治の聴衆とのサイトの共有率の違いは、スペクトルの両端のサイトと比較して、実質的に許容誤差を超えています。

疑わしいボットアカウントは、イデオロギーの中道政治家または混合聴衆と人気のある政治サイトへのより多くのリンクを共有します

この分析の結果を解釈する際には、特定の注意事項に注意することが重要です。まず、この調査では、Twitterで受け取ったシェアの数によって測定された主要なメディアのみを調査します。第二に、人間が共有するコンテンツとボットが共有するコンテンツの真実性(またはその欠如)を検証しません。最後に、それは全体的な共有率に焦点を合わせており、その後の共有や人間のユーザーの関与を考慮していません。

Facebook   twitter