ナガセが、2026年2月25・26日に実施された東京大学の二次試験問題を用いて最新の生成AIの解答能力を検証したところ、3種類すべてのAIが得点率8割以上を記録し、最難関とされる理科三類の合格水準を上回る結果となった。最高得点は9割に迫る水準だった。
検証では、Claude Opus 4.6、Gemini 3.1 Pro、GPT‑5.2の3モデルを使用。文系・理系ともに得点率は8割を超え、例年6割前後とされる合格ラインを大きく上回った。総合得点ではClaude、Gemini、GPTの順となった。
教科別では差もみられたが、文系数学では3モデルすべてが満点を記録するなど、記述式問題への対応力の高さが目立った。AIは単に解答を導くだけでなく、途中の思考過程を含む記述答案も正確に構成できる水準に達しているという。
一方で課題も明らかになった。図形問題では図から情報を読み取る過程で苦戦し、「平面上に図示せよ」といった設問では計算式まで到達しながら図示ができないケースが確認された。また日本史では史料をもとに時代背景を踏まえて用語を書き換える問題に弱く、史料の要約にとどまる傾向が見られた。
回答時間は人間を大きく上回る速さで、日本史や世界史は1~2分程度、最も時間を要する数学でも20分未満で解答した。
今回の検証は、AIの事前学習の影響を排除するため、試験当日に問題を入力して実施。東進の教務部門が作成した模範解答と採点基準を用い、部分点を含めて得点化した。
同社は、こうした検証結果をAI教育コンテンツの開発に活用する方針だ。東進ではAIを用いた志望校対策演習などを展開しており、累計200億件以上の学習データと約45万問の問題データベースをもとにAI教材の高度化を進めている。さらに、英作文や小論文の添削を支援する生成AIシステムを学校向けにも提供しており、教育現場での活用を拡大している。




