AIで書くと創造性は下がる?米大2200本の検証

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube
  • 米ジョージタウン大学が、人間とChatGPTが書いたエッセイ計2200本を比較する実験を行いました
  • AIは「ひとりの作文」をうまく助けますが、みんなで使うと文章が「似たり寄ったり」になることが分かりました
  • 人間の文章は、AIの文章より2〜8倍も多様なアイデアを生み出していました
  • プロンプト(AIへの指示文)を工夫しても、この「均一化」は止まりませんでした
  • 日本の大学でも生成AIの利用が広がる今、知っておきたい重要な研究結果です

「AIに手伝ってもらった文章は、本当に創造的なのでしょうか?」

多くの学生がレポートや作文でChatGPTを使う時代になりました。でも、AIを使うと文章はもっと面白くなるのでしょうか。それとも、どこかで聞いたような内容ばかりになってしまうのでしょうか。

この疑問に、米国の大学が2200本ものエッセイを使って真正面から答えを出しました。その結果は、私たちの直感を少しだけ裏切るものでした。

米ジョージタウン大学が行った実験とは

この研究を行ったのは、米国の名門ジョージタウン大学の研究チームです。

中心になったのは、キブム・ムーンさんやアダム・グリーンさんたちです。論文は2025年に学術誌「Computers in Human Behavior: Artificial Humans」に発表されました。

研究チームは、人間が書いたエッセイとChatGPT(GPT-4)が書いたエッセイを合計2200本集めました。そして、3つの実験に分けて比べました。

ここで使われたのが「多様性成長率」という考え方です。

むずかしそうに聞こえますが、意味はシンプルです。「エッセイを1本追加するたびに、新しいアイデアがどれだけ増えるか」を測る物差しです。

文章を数字に変換し、お互いがどれくらい「離れているか(似ていないか)」をコンピューターで計算しました。離れているほど、多様で個性的というわけです。

結果——AIは「個人」を伸ばし「全体」を均一にする

実験の結果は、とても興味深いものでした。

まず分かったのは、人間が書いた文章のほうが、新しいアイデアをたくさん生み出していたという事実です。

具体的には、人間のエッセイはAIのエッセイにくらべて、グループ全体で2倍から8倍も多様なアイデアを生んでいました。

つまり、人間が1本書き足すと話題がぐっと広がるのに、AIが1本書き足してもあまり広がらない、ということです。

ここで大切なポイントがあります。それは「個人」と「全体」の違いです。

AIは、ひとりの人が書く文章のレベルを引き上げてくれます。作文が苦手な人でも、それなりに整った文章が書けます。

ところが、みんながAIを使うと、全体の文章が似たような内容に集まってしまうのです。

これを研究では「均一化(ホモジナイゼーション)」と呼んでいます。一人ひとりは賢くなるのに、社会全体のアイデアの幅はせまくなる、という不思議な現象です。

なぜAIで書くと「みんな同じ」になるのか

では、どうしてこんなことが起きるのでしょうか。

理由はAIのしくみにあります。ChatGPTのような大規模言語モデル(人間のように文章を作れるAI)は、過去にある大量の文章を学んで答えを作ります。

そのため、どうしても「よくある言い回し」や「平均的な答え」に寄っていきます。

たとえるなら、クラス全員が同じ参考書だけで作文を書くようなものです。一人ひとりの文章はきれいでも、提出された作文を並べると、書き出しも結論もどこか似てしまいます。

研究チームはこの効果を、実際のデータでも確認しました。

2019年から2025年までの本物の大学出願エッセイ1400本(各年200本)を分析したのです。

すると、ChatGPTが広まった2022年より後のエッセイは、それ以前より明らかに多様性が下がっていました。研究室の実験だけでなく、現実の世界でも均一化が起き始めているのです。

プロンプトを工夫しても均一化は防げない

「それなら、AIへの指示を工夫すればいいのでは?」と思った人もいるかもしれません。

研究チームも、まさにそこを試しました。

AIの設定を変えたり、「もっと個性的に書いて」とプロンプト(指示文)を工夫したりして、出力を多様にしようとしたのです。

その結果、一本一本のAIエッセイは、人間の文章より多様になることもありました。個人レベルでは工夫が効いたのです。

ところが、ここが今回の研究の一番おどろくべき点です。

工夫してAIの文章を多様にしても、グループ全体で見ると、やはりAIのほうが均一化を強めるという結果になったのです。

つまり、指示を工夫しても根本的な解決にはなりませんでした。AIに頼る人が増えるほど、全体のアイデアは少しずつ「平均」に吸い寄せられていくのです。

他の研究や従来の見方との比較

これまで、生成AIと創造性については意見が分かれてきました。

「AIを使うと個人の創造性が上がる」という研究も実際にあります。ビジネスを学ぶ学生を対象にした実験では、AIが発想を助けたという報告もあります。

一方で、「AIは創造的思考を弱めるのでは」と心配する研究もありました。

今回のジョージタウン大学の研究が新しいのは、この2つの見方を「個人」と「全体」という軸でつないだ点です。

下のように整理すると分かりやすいでしょう。

  • 個人レベル:AIは作文を助ける。苦手な人ほど効果が大きい
  • 全体レベル:みんなが使うとアイデアが似てきて、多様性が下がる
  • 従来の議論:「上がる」か「下がる」かの二択で語られがちだった
  • 今回の発見:上がる面も下がる面も両方ある、と示した

「便利だけど、社会全体では失うものもある」。この二面性を数字で示したことに価値があります。

日本の学生・大学への影響

この話は、海の向こうの出来事ではありません。日本でも深く関係します。

日本の大学では今、生成AIの利用が急速に広がっています。レポートや論文の下書きにChatGPTを使う学生は珍しくありません。

文部科学省も2023年にガイドラインを出し、2024年12月には改訂版(Ver.2.0)を公開しました。多くの大学が独自のルールを作っています。

そこで共通して言われているのが、「AIは答えを作る道具ではなく、学習を助ける道具」という考え方です。

ある大学生の例を考えてみましょう。締め切り前夜、レポートのテーマが思いつかず、ChatGPTに「テーマ案を10個出して」と頼みます。これは発想のヒントとしてとても有効です。

でも、そのまま提出用の文章まで丸ごとAIに書かせたらどうなるでしょうか。同じAIを使うクラスメイト全員の文章が、どこか似てしまうかもしれません。

就職活動のエントリーシートも同じです。みんながAIに頼れば、「個性をアピールする書類」が逆に没個性になるという皮肉が起きかねません。

だからこそ、AIは「最初のたたき台」や「壁打ち相手」として使い、最後の自分らしさは自分で加える。そんな使い方が、これからの日本の学生に求められそうです。

よくある質問(FAQ)

Q1. AIを使うと創造性は下がるのですか?

一概には言えません。個人で見ると、AIは作文を助けて質を上げます。ただし、多くの人が同じように使うと、全体としてアイデアが似てきて多様性が下がる、というのが今回の結果です。

Q2. 何本のエッセイで実験したのですか?

人間とAIの文章を合計2200本比べました。さらに、2019〜2025年の本物の大学出願エッセイ1400本も分析しています。

Q3. AIの設定を工夫すれば均一化は防げますか?

残念ながら、根本的には防げませんでした。指示を工夫して一本ごとの文章を多様にしても、全体で見るとAIのほうが均一化を強めたと報告されています。

Q4. 学生はAIを使わないほうがいいのですか?

そうではありません。アイデア出しや理解の補助としては有効です。大切なのは、AIに丸投げせず、自分の考えや個性を最後に加えることです。

Q5. この研究はどこが行ったものですか?

米国のジョージタウン大学の研究チームです。論文は2025年に学術誌に発表されました。

まとめ

今回のポイントを振り返ります。

  • ジョージタウン大学が、人間とAIのエッセイ2200本を比較した
  • 人間の文章はAIより2〜8倍多様なアイデアを生んでいた
  • AIは「個人」を助けるが、「全体」を均一にする
  • プロンプトを工夫しても、均一化は止まらなかった
  • 2022年以降の本物のエッセイでも、多様性の低下が確認された

AIは強力な味方です。でも、使い方しだいで「みんな同じ」を生む道具にもなります。次にAIで文章を書くときは、最後のひと工夫だけは自分の言葉で加えてみてください。それが、あなたらしさを守る一番の方法です。

参考文献

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です