GPT-4級の性能でAPI料金が安い　中国産AIモデル「Deep-Seek V2」

　中国のAI企業「DeepSeek（深度求索）」は5月6日、最新の「Mixture-of-Experts（MoE）」アーキテクチャを採用し、効率的な学習と推論を実現する大規模言語モデル「DeepSeek-V2」を発表した。

パラメーター数を減らすことによって高速な推論を実現

　「DeepSeek-V2」は、8.1兆個のトークンで構成される高品質なコーパスで事前学習した後、教師あり微調整（SFT）と強化学習（RL）で訓練されている。

　およそ236億個ものパラメーターを持つが、「Mixture-of-Experts（MoE）」と呼ばれるアーキテクチャーを採用することで、実際の推論にはおよそ21億（全体の9％）のパラメーターしか使用せず、大規模なモデルを維持しつつ、推論時の計算量を大幅に削減。大規模モデルの表現力を保ちながら、効率的な推論を可能にしているという。

　さらに、推論時のキャッシュを削減する「Multi-head Latent Attention（MLA）」や「DeepSeekMoE」アーキテクチャーにより、低コストで強力なモデルを学習可能にしたという。

「GPT-4」とほぼ匹敵する性能

　DeepSeek-V2は、中国語の総合的な言語能力を評価するベンチマーク「AlignBench」において、「GPT-4」を上回り、「GPT-4-Turbo」に迫る3位となっている。

　また、英語の総合的な言語能力を評価するベンチマーク「MT-Bench」ではGPT-4とほぼ同等、グーグルの「Gemini 1.5 Pro」、Anthropicの「Claude 3 Sonnet」、メタの「LLaMA 3 70B」を上回るスコアを達成している。

　さらに、「MATH（数学）」、「HumanEval（コーディング）」、「BBH（推論）」タスクでも好成績を残している。

API使用料が激安

　APIの利用料金は100万トークンあたり、入力が0.14米ドル（およそ22円）、出力が0.28米ドル（43円）と、他のLLMと比べて極めて安価な設定になっている。これは、MoEアーキテクチャによる効率的な推論により、計算コストが抑えられていることが理由と思われる。

デモサイトも公開

　こちらから実際にデモを触ってみることができる。ログインはグーグルアカウントでOKだ。

　日本語も問題なく通る。スピードも早く軽快だ。

　自国びいきなところがあるのは否めないが、思ったよりもナチュラルな回答と感じた。

　サイドメニューから切り替えることによってコーディングに特化した「DeepSeek Coder」を試すこともできる。Python モジュールの読み込みも問題なくこなしている。

　いずれにせよこのスピードと精度でこのAPI使用料は脅威だ。商用利用を含む幅広い用途で使用できるライセンスを採用しているため、研究目的だけでなく、実際のビジネスやアプリケーション開発にも活用できると思われる。LLMの民主化に大きく貢献するポテンシャルを秘めているのではないだろうか。

関連ニュース

コメント

ネット・科学もっと見る

インコ界最強のダンスキングの踊りを完…

『ニコニコ超会議2024』思わず足を止め…

1回送ってみて？男性を一瞬で沼らせる…

ジョージ・ミラー監督、今後も「マッド…

TVアニメ2期が来年放送『スライム倒し…

OpenAI、退社したライケ氏のAGI警鐘に…

都内「自転車が命がけ！」危険スポッ…

愚かでした…年金17万円・78歳男性「安…

新鮮なバナナを60日放置→やせたかなし…

往年の「急行アルプス」新宿駅で健在!? その記憶を留める「トイレ」とは

ステンレスタワシで絵の具をポンポンすると…… 美しい「森の風景」が描けるテクニックがすごい

「さよならを言う時が来た」リバプール退任のクロップ監督、ラストマッチを前にファンへ別れのレター「永遠に心に残る思い出を作った」

急いで撮影者から逃げるリス、くわえているのは……？ アニメのワンシーンのような光景に「笑った！」「すごいね」【海外】

【速報】パリ五輪フェンシング代表に江村ら18人

賃貸だからと｢仮住まいの意識｣は絶対ダメ…一級建築士が教える｢極上の暮らしを作る家具選び｣の最終結論

井上咲楽がオズワルド畠中と破局、「優しい2年半を一緒に送ってくださった」と感謝も

【速報】洗濯機で女児回した傷害疑い、男逮捕

【速報】農林中金1兆円規模増資検討、外債運用悪化

だから｢すべて話そうとする人｣は大体失敗する…仕事のデキる人がやっている｢説得力のある話し方｣

往年の「急行アルプス」新宿駅で健在!? その記憶を留める「トイレ」とは

ステンレスタワシで絵の具をポンポンすると…… 美しい「森の風景」が描けるテクニックがすごい

「さよならを言う時が来た」リバプール退任のクロップ監督、ラストマッチを前にファンへ別れのレター「永遠に心に残る思い出を作った」

急いで撮影者から逃げるリス、くわえているのは……？ アニメのワンシーンのような光景に「笑った！」「すごいね」【海外】

【速報】パリ五輪フェンシング代表に江村ら18人

賃貸だからと｢仮住まいの意識｣は絶対ダメ…一級建築士が教える｢極上の暮らしを作る家具選び｣の最終結論

井上咲楽がオズワルド畠中と破局、「優しい2年半を一緒に送ってくださった」と感謝も

【速報】洗濯機で女児回した傷害疑い、男逮捕

【速報】農林中金1兆円規模増資検討、外債運用悪化

だから｢すべて話そうとする人｣は大体失敗する…仕事のデキる人がやっている｢説得力のある話し方｣

若い女性がラスボスのゲーム、存在しない説 まさかの例外「藤崎詩織」がいた……

NHK「スマホやパソコンを持っているだけでは負担の対象にならない」 改正放送法成立受けコメント、詳細は検討中

【速報】「うまずして何が女性か」と上川陽子外相

マックとモスで分かれた明暗。ポイントは「400円の壁」と「原価率」――大反響・総合トップ10

【速報】上川外相の出産発言は不適切と立民幹部

【速報】女性パワーで知事誕生させる意味と上川外相

『HUNTER×HUNTER』の冨樫義博がXで怒り 立て続く“誤配”で「三度目です」「次はもう知らん」

Amazonレビューは大荒れ、SNSでは卑怯者扱い…“アニメの感想ツイート”が炎上した「大学教授のその後」

「当店の従業員はマスクを外して業務を行います」吉野家の貼り紙が物議 全店の方針なのか聞いた

"子持ち様"論争過熱、人手不足で「しわ寄せ誰に？」傷つく労働者たちの切実な声…企業や社会こそ意識改革を

【LIVE】5/26(日)21:00〜 河野太郎デジタル大臣が、あなたの質問にお答えします

【文化庁×ニコニコ美術館】視聴者からの博物館にまつわる質問募集！文化庁担当者が答えます

【LIVE】5/16(木)17:00〜 加藤勝信 元官房長官が皆様からの質問に生放送でお答えします。

ネット・科学
もっと見る

ステンレスタワシで絵の具をポンポンすると……　美しい「森の風景」が描けるテクニックがすごい

急いで撮影者から逃げるリス、くわえているのは……？　アニメのワンシーンのような光景に「笑った！」「すごいね」【海外】

ステンレスタワシで絵の具をポンポンすると……　美しい「森の風景」が描けるテクニックがすごい

急いで撮影者から逃げるリス、くわえているのは……？　アニメのワンシーンのような光景に「笑った！」「すごいね」【海外】

若い女性がラスボスのゲーム、存在しない説　まさかの例外「藤崎詩織」がいた……

NHK「スマホやパソコンを持っているだけでは負担の対象にならない」　改正放送法成立受けコメント、詳細は検討中

『HUNTER×HUNTER』の冨樫義博がXで怒り　立て続く“誤配”で「三度目です」「次はもう知らん」

「当店の従業員はマスクを外して業務を行います」吉野家の貼り紙が物議　全店の方針なのか聞いた

【LIVE】5/26(日)21:00〜河野太郎デジタル大臣が、あなたの質問にお答えします

【LIVE】5/16(木)17:00〜加藤勝信元官房長官が皆様からの質問に生放送でお答えします。