GPT-5ハルシネーション、本当に減ったのか?

“2025年8月、ついにGPT-5が公開されました。.
AIコミュニティはもちろん、世界中が騒然としました。”
この日、ちょうど新しい GPT-5を試す機会がありました。.
“今回は果たしてどれほど変わっているのだろう?”という期待感で早速テストを開始しました。.
GPT5の性能を知りたいですか?
第一印象 - 感性は減ったけど、精度は?

GPT-5を初めて使った感想は少し意外でした。.
会話が以前より冷たく、堅苦しい感じがしました。.
まるで、知識は豊富だけど、感情が少ない先生と話しているような気分です。
しかし、パフォーマンスの数値には明らかな変化がありました。.
OpenAIは今回のGPT-5が ハルシネーション(Hallucination),
つまり、事実でない内容を本当であるかのように言うという誤りを 45%以上削減したと述べています。.
特に Thinkingモードでは、最大 65%の減少したそうです。.
そして実際に体験してみた結果、,
ハルシネーションが完全に見えませんでした。.
すべて論理と数値計算による予測可能性を含んでいました。.
でも、ある意味、創造性が減ったという評価もありますよね。.
世の中は目に見えない力で動いていることもあるからです。.
公式ベンチマーク結果 - 数字で見る
公開されているベンチマークを見ると,
- LongFact-Concepts: 0.7%
- LongFact-Objects: 0.8%
前モデル(o3)でそれぞれ4.5%、5.1%だったことを考えると、大幅な改善です。.
確かにGPT-5は「リアリズム」の面では、より慎重になった印象です。.
ある方はインタビューで、90%も減ったと感じている方もいました。.
私から見ても、体感上はほとんどないと見ていいと思います。.
ただし、様々な可能性がある分野では間違っている可能性もありますが、,
これはハルシネーションというよりは、人工知能の性能不足と見るべきでしょうね。.
しかし、まだ完璧ではない。

面白いのは、やはり間違える瞬間があると言いましたが。.
ガーディアンの報道によると、GPT-5が
“「ブルーベリーにBが3つ」とか、,
存在しない州を作り出すなど。
基礎的なエラーを犯した事例も報告されています。.
つまり、, ハルシネーションは減ったが、完全になくなったわけではないということです。.
とはいえ、記事というのはやや事実の根拠が不足していることもありますし、,
直接ChatGPT5を体験してみるのが確実な方法だと思います。.
結論 - 賢くなったのは確かだが、常に検証は必須

GPT-5は確実に精度が上がっており、Thinkingモードではその変化が顕著です。.
しかし、それでも間違っている可能性があることを忘れてはいけません。.
結局、常にAIの答えは「参考資料」として使って、,
重要な判断や事実確認は、自分で検証する習慣が必要です。.
何よりも、事実を判断する力を養うこと、,
人工知能時代に有利な資質ではないでしょうか?
今日はChatGPT5ハルシネーションについてご紹介しました。.
今回もご参加いただきありがとうございました。.
“皆さんはGPT-5を使ってみて、どんな変化を感じましたか?
コメントでご意見をお聞かせください!”

今日はハルシネーションについて調べてみました🙂。
今後もAI関連の情報をたくさん取り上げていきたいと思います!