コンテンツにスキップ

Kimi K2 Thinkingの衝撃:GPT-5超えを実現した中国製OSS AIの全貌

中国Moonshot AI社が2025年11月6日に発表したオープンソースモデルが、AI業界に衝撃を与えています。GPT-5やClaude Sonnet 4.5といった最先端の商用モデルを複数のベンチマークで上回る性能を、わずか460万ドルの訓練コストで実現しました。

この記事で学べること

技術仕様とコストパフォーマンス 主要ベンチマークでの性能比較 AI戦略への示唆と試用方法

モデル概要

Alibabaから支援を受けるスタートアップが開発した完全オープンソースモデルです。総パラメーター数は1兆ですが、MoE(Mixture-of-Experts)アーキテクチャにより実行時は約320億のみをアクティブ化します。訓練コストは460万ドルで、GPT-4(推定5,000万〜1億ドル)の10分の1以下という圧倒的なコストパフォーマンスを実現しています。

ベンチマーク性能

複数の主要ベンチマークでGPT-5とClaude Sonnet 4.5を上回る性能を達成しています。

ベンチマークK2 ThinkingGPT-5Claude 4.5
HLE44.9%41.7%32.0%
BrowseComp60.2%54.9%24.1%
SWE-bench Verified71.3%--
GPQA Diamond85.7%84.5%-

注目ポイント

BrowseCompでClaude 4.5の24.1%に対し60.2%という圧倒的なスコアを記録。

技術的特徴

最大の特徴は、人間の介入なしで200〜300回の連続ツール実行が可能な点です。τ²-Bench Telecomでは93%という最高スコアを記録しました。INT4量子化と256Kトークンのコンテキストウィンドウにより、推論速度の向上とGPUメモリ削減を実現しています。

AI戦略への示唆

ゼロから国産LLMを開発するより、以下のアプローチが効果的な可能性があります。

  1. OSS活用: オープンソースモデルをベースに日本語対応を強化
  2. インフラ投資: GPU環境を整備し、ファインチューニングとホスティングに注力
  3. 安全性評価: バックドアや脆弱性の徹底検証

検閲の懸念

天安門事件などの政治的トピックに対する検閲が確認されており、エンタープライズ利用時は要注意です。

試用方法

以下の方法で試用できます。

データプライバシー

無料版では入力データが学習に使用される可能性があります。機密情報の入力は避けてください。

まとめ

オープンソースAIの可能性を示す画期的なモデルです。GPT-5を上回る性能を460万ドルで実現した事実は、AI開発における「誰が作るか」よりも「どう最適化するか」の重要性を示しています。日本においても、OSS活用とローカライズに焦点を当てたアプローチが有効である可能性を示唆しています。