2026年6月22日 月曜日
AI時短ラボ
モデル· 約4

PFNが「PLaMo 3.0 Prime」公開──日本語性能でGPT-5.4 Miniに並び、コスト半額以下

Preferred Networksが2026年6月22日に公開したPLaMo 3.0 Primeは、推論モデルの日本語総合性能でGPT-5.4 Miniと同等の69.6を記録しつつ、評価コストは約半額。256Kコンテキスト対応、NICT・経産省GENIAC支援。Freeプランあり。

東京拠点のAI企業Preferred Networks(PFN)が2026年6月22日、自社開発の大規模言語モデル「PLaMo 3.0 Prime」を公開した。日本語に特化したフルスクラッチのLLMで、推論モデルの日本語総合性能はGPT-5.4 Miniと同等の69.6を記録しつつ、評価コストは約半額。

  1. 推論モデルの日本語性能69.6はGPT-5.4 Mini(69.6)と同等、コストは約半額(PFN公式ベンチマーク)
  2. コンテキスト長を64Kから256Kに拡張。Claude Haiku 4.5(200K)を上回る
  3. Freeプランあり。NICT・経産省GENIAC第3期の支援で開発

2つのバリエーション

PLaMo 3.0 Primeには推論モデルと非推論モデルの2種類がある。

推論モデルは高性能だが応答時間が長め。日本語総合性能69.6で、GPT-5.4 Mini(69.6)と並ぶ。評価コストは約1,016円で、GPT-5.4 Mini(約2,170円)の半額以下。

非推論モデルは高速応答向け。日本語性能64.7、評価コスト約323円。gpt-oss-120b(64.1 / 約133円)やClaude Haiku 4.5(59.8 / 約4,951円)と比較して、性能とコストのバランスが良い。

PLaMo 3.0 Prime 日本語性能とコストの比較 PFN公式ブログより。横軸が評価コスト(円)、縦軸が日本語性能。左上ほど高性能・低コスト。

前バージョンからの改善

PLaMo 2.2 Prime(日本語性能54.2)から推論モデルで+15.4ポイントの改善。PFN公式によると、強化学習をより長期間にわたって実施し、従来の約2倍のステップ数で学習したことが主な要因。

コンテキスト長は64Kから256KにYaRNと継続事前学習で拡張された。

日本語で強い分野・弱い分野

PFN公式の15項目ベンチマークによると、以下の傾向がある。

強い分野: 指示追従、対話、ツール使用、医療(医師国家試験)、コード生成、安全性

改善が必要な分野: Web探索、長コンテキスト処理、数学的推論、STEM、日本法令

安全性

NICT(国立研究開発法人情報通信研究機構)から提供を受けた安全性データを活用。HELM Safety評価(暴力・詐欺・差別・性的表現・ハラスメント・欺瞞の6カテゴリー)で競合モデルと同等以上の安全性能を記録している(PFN公式発表)。

料金

PLaMo ChatでFreeプランとStandardプランが利用可能。API経由での利用も可能。詳細な料金体系は公式ページ(plamo.preferredai.jp)を参照。

PFNとは

2014年設立の東京拠点AI企業。深層学習フレームワーク「Chainer」の開発元として知られる。ロボティクス・創薬・材料探索など産業AI応用に強みを持ち、PLaMoシリーズは日本語LLMとして50を超える自治体での採用実績がある。

同日のSakana AI「Fugu」との対比

同じ6月22日にSakana AIが「Fugu」を発表している。Fuguは複数の既存AIモデルを束ねるマルチエージェント方式でベンチマーク上位を狙うアプローチ。一方PLaMoはフルスクラッチで日本語特化モデルを自社開発する正攻法。東京拠点の2社が同日に異なる戦略で成果を出した形になる。

この記事について

本記事は2026年6月22日時点の情報に基づく。PFN公式ブログを一次ソースとして使用した。ベンチマーク結果はPFN自身の評価による。パラメータ数は公式に明記されていない。

シェア: ポスト はてブ

📎 出典・一次ソース

このニュースの解説動画も作っています

解説動画はYouTube、速報はX(旧Twitter)で毎日更新中。

コメント

まだコメントはありません。最初のコメントを書いてみませんか?

AIについて聞きたいことはありますか?

質問箱で無料で受け付けています。回答は公開され、他の方の参考にもなります。

質問箱を見る →

関連記事