Frontierモデルの
経済的ジレンマ
Anthropic、OpenAI、Geminiなどの最新モデルは性能が魅力的ですが、「使えば使うほど」請求額が膨らむ従量課金制は、事業のスケールに対して頭打ちを生みがちです。
- 高性能だが高額なAPIコストが課題
- 従量課金制で請求額が予測しにくい
- 業務の自動化ほどコストがかさむ
APOLLO11-FUSION
性能×経済性の両立を実現した、日本語ビジネス特化型のオープンウェイトモデルです。
Frontierモデル相当の性能
最先端モデルに比肩する推論能力を維持しながら、圧倒的な低コストを実現。
圧倒的な低コスト
一般的なFrontierモデルの1/3〜1/10のコスト。Input $2/1Mトークン、Output $6/1Mトークン。
日本語ビジネス知識の組み込み
敬語表現、稟議フロー、決算月処理など、日本のビジネス文脈を理解。
国内希少の技術者が開発
株式会社APOLLO11のCTOを務めるEwdison Thenは、世界水準の技術力を誇るエンジニアです。
- 2002年にクレジットカード端末システムを開発し、金融・セキュリティ領域のエンタープライズ開発を経験
- 2004年にはFedora Linux創生期の公式サポートフォーラム「FedoraForum.org」を立ち上げ
- AIプラットフォーム「NuraGrid」を当初一人で設計・開発
- LinuxとエンタープライズのセキュリティからAIまで、3つのスキルセットを高いレベルで実行できる国内希少の技術者
具体的なコスト削減効果
月間10M Inputトークン、5M Outputトークンを利用する場合の比較
圧倒的なコストパフォーマンス
Mixture-of-Experts(MoE)アーキテクチャにより、1兆パラメータの知識を持ちながら、リクエストごとの実アクティベーションは約320億パラメータ(3%のみ)に抑制。ハードウェアレベルでの徹底した効率化により、性能を落とさずコストを極限まで削減しました。
| 項目 | 一般的Frontierモデル | APOLLO11-FUSION |
|---|---|---|
| Input(1Mトークン) | $10〜$15 | $2 |
| Output(1Mトークン) | $30〜$50 | $6 |
| 月額費用(例) | ¥16,800〜30,000 | ¥8,000 |
| 削減率 | – | 70%削減 |
モデルに組み込まれた日本語ビジネス知識
毎回のプロンプトで教え込む必要がないため、コンテキストトークンの繰り返し送信による無駄を完全に排除できます。
最先端アーキテクチャ
260,000トークンのコンテキスト長を活かし、関数呼び出し(Tool Calling)とステップの連続実行に優れた設計となっています。
Mixture-of-Experts(MoE)
1兆パラメータの知識を持ちながら、リクエストごとの実アクティベーションは約320億パラメータ(3%のみ)に抑制。
- 必要な専門家(Expert)のみを起動する効率的な構造
- ハードウェアレベルでの徹底した最適化
- 性能を落とさずコストを極限まで削減
今期は10社様限定での提供
30分間の技術説明会をご提案





