AI・ディープラーニング技術開発のリッジアイ、目的特化型の日本語LLM開発においてLlama2に次ぐ精度の検証結果を達

AI・ディープラーニング技術のコンサルティングと開発を行う株式会社Ridge-i（本社: 東京都千代田区、代表取締役社長: 柳原尚史、以下「リッジアイ」）は、さくらインターネット株式会社の国産GPU開発環境で、目的特化型の日本語LLM（大規模言語モデル）開発を行い、主要な日本語ベンチマーク(JCommonsenseQA)でLlama2に次ぐ精度の検証結果を達成しました。

リッジアイは、情報セキュリティ面で安心して使用できる国産のLLMの開発をめざして、2023年7月～2024年1月の期間で開発検証を行いました。研究開発にあたり、必要となる画像処理半導体（GPU）は、国内事業者としてクラウドインフラに強みを持つさくらインターネット株式会社のGPU環境を採用しました。また、研究開発チームには、自然言語処理分野におけるデータ構築に関しては国内トップの豊富な知見を持つ株式会社バオバブおよびカーネギーメロン大学准教授のGraham Neubig氏が参画しました。

検証の結果、軽量モデル（モデルサイズ：1.3B、2.7B）で、主要日本語ベンチマークの一つであるJCommonsenseQAにおいて、国内の主要LLMの精度を20ポイントほど上回り、Llama2に次ぐ精度であることを確認しました。（2024年１月時点。検証結果は別紙参照）

今回の検証を通じて、日本語の学習データの質と配分に独自の工夫を行うことによる精度向上のノウハウと、さくらインターネット株式会社のGPU環境下でのLLM開発ノウハウを得ることができました。今後リッジアイでは、これらのノウハウを活かし、目的特化型LLMの開発サービスおよびファインチューニングのサービスの提供開始に向けて準備を進めていきます。

株式会社バオバブ　代表取締役社長　相良美織氏のコメント

あらためてタスクに応じたデータの重要性を確認できた今回の検証結果を踏まえ、ますます高まりを見せるファインチューニングのニーズに、バオバブも国内最多の実績と万全の体制でお応えします。

さくらインターネット株式会社　代表取締役社長　田中邦裕氏のコメント

リッジアイ社の目的特化型の日本語LLMが、さくらインターネットのGPU開発環境にて開発されたことを非常にうれしく思います。さくらインターネットは今後も、さらに高まるAI需要に応えられるよう、コンピューティングリソースを安定供給確保し、DXプラットフォーマーとしてデジタル社会の継続的な発展へ寄与してまいります。

参考情報

2023年7月19日付プレスリリース：「安心して使える」国産の生成AI・大規模言語モデル(LLM) の開発を開始（https://ridge-i.com/news/3953/）

以上

株式会社Ridge-i（リッジアイ）について
リッジアイは、AI・ディープラーニング技術を活用したソリューションにより、経営・社会課題の解決に挑むテックイノベーションファームです。特に、画像解析ディープラーニング、センサーによる異常検知AI、最適化AIなど様々なデータに対応するAIを組み合わせた「マルチモーダルAI」に強みを持ちます。戦略策定から要件定義フェーズに始まり、現場のコンサルテーションから開発・運用保守まで、投資対効果を実感するまで一気通貫で伴走し、多くの実績をあげています。また社会課題にも積極的に取り組んでおり、SDGs課題と環境変化を衛星画像から発見する「GRASP EARTH」などで第4回、第5回、第６回宇宙開発利用大賞を３連続受賞しました。今後とも技術とビジネスの高みを追求し、社会・顧客が持続的に効果を実感できる最高峰のソリューションを提供します。

会社名：株式会社 Ridge-i

設立： 2016 年 7 月

所在地：東京都千代田区大手町 1-6-1 大手町ビル 438

代表：代表取締役社長柳原尚史

資本金： 10,000,000円

事業内容：

１. AI・ディープラーニング技術のコンサルティングおよび開発

２. 共同事業、ライセンス、保守モデル、自社開発等によるプロダクトの提供

３. 人工衛星データAI分析サービスの提供

URL： https://ridge-i.com

＜別紙＞今回の検証概要結果について

作成モデルの概要

言語モデルには、因果的言語モデル（causal language model: CLM）を採用しました。CLMは、過去の単語が全て与えられたときに次に来る単語を予測するモデルで、主に文の生成に使用され、代表的なモデルとしてはGPTが挙げられます。プロンプトをはじめとした近年の言語モデル関係の技術はCLMの上に構築されています。言語モデルの内部構造にはTransformerを採用しました。Transformerはself-attentionとfeedforward networkという2種類の基本構造の積み重ねによるモデルであり、近年のCLMの事実上の標準の構造となっています。Transformer方式のCLMには、NVIDIAが提案するMegatron系のモデル構造を採用しました。モデルの学習には、Megatron系モデルを学習するツールとしてEluther AIが公開しているGPT-NeoXを使用しました。

学習データの収集と選抜

学習に用いたのは、基幹となる大規模クローリングデータ（mC4）に加えて、Wikipediaやニュースサイト、国会議事録などのデータをAPI経由で取得しました。本実験では、学習する言語モデルのターゲットタスクをニュース（時事情報）の読解とし、常識や事実関係にやや特化した性能を持つモデルを作成することとしました。学習データは、自然言語200Bトークン、コード200Bトークン程度であり、自然言語データのみを用いた場合でも10Bパラメータ級のモデルの学習に共用可能な量となっています。こうして集めたデータについては、独自の前処理を行い、また様々な配分でデータを統合させています。

トークナイザの学習

トークナイザにはSentencePieceを使用し、語彙サイズ5万のモデルを学習させました。トークナイザの学習データには、言語モデルの学習データから3億文字相当の文をランダムサンプリングしたものを作成しました。

言語モデルの学習

作成する言語モデルのモデルサイズは、1.3B、2.7B、7B、13Bとしました。このうちCoTなどの現代的なLLMの応用が可能となるのは、おおよそ13Bからであり、それより小さなモデルに関してはembeddingの取得や簡単な判定問題などへの応用が可能です。

本実験では、最終的に供用された計算機の量の関係から、1.3Bモデルと、2.7Bモデルの学習が可能でした。学習には、NVIDIA A100 40GBが4枚搭載されたマシンをモデルごとに1台ずつ占有の上、それぞれ独立した学習器を動作させました。

検証結果

言語モデルの日本語推論の評価に標準的に用いられるJGLUEに含まれる４つのベンチマーク（JCommonsenseQA 、JNLI、MARC-ja、JSQuAD）で検証した結果、JCommonsenseQA において、両モデルともに精度60ポイント以上を安定して達成しました。

▼JCommonsenseQAの入出力例

* は正解の選択肢、スコアはシステムの出力 (0に近いほど高いスコア)

これはリーダーボード（注1）で公開されている国内の主要モデル（Cyber2.7B、rinna1.3など）と比較して20~30ポイント高い水準であり（注２、注３）、Llama２-13B（精度74.89ポイント）に次ぐ精度であることを確認できました。
データ量・パラメータサイズを比較すると、高い精度を達成した理由として、データの配分における独自の工夫が奏功したと考えられます。

検証結果については、さらにチューニングを行い、また研究発表などで共有することも検討しています。

注１　リーダーボード（https://github.com/Stability-AI/lm-evaluation-harness/tree/jp-stable?tab=readme-ov-file）

注２　CyberAgent-open-calm-3B (https://huggingface.co/cyberagent/open-calm-3b)

パラメータ数2.7B、JCommonsenseQA 精度　27.79%

注3　rinna-japanese-gpt-1b https://huggingface.co/rinna/japanese-gpt-1b
パラメータ数1.3B JCommonsenseQA 精度　34.76%

配信元企業：株式会社Ridge-i

企業プレスリリース詳細へ

PR TIMESトップへ

関連ニュース

コメント

ネット・科学もっと見る

『あおぎり高校』チャンネル登録者100…

「うわっかわいい」「これは欲しい」 …

こりゃ最強だわ…。男が気づいたら惚れ…

雪の中で舞い踊るモップの正体は…… …

薄汚れたれんがが…… 家を高圧洗浄で…

心理学者が「ランチは〈ハンバーグ定食…

これは職業病？元ガールズケイリン女王…

鶴瓶、青木崇高は「ええ妻（優香）を持…

「子のない夫婦」を襲う衝撃…手取り月…

歯科医が床タイルに埋まった人間の顎骨を発見！一体誰の骨だったのか？

「うわっかわいい」「これは欲しい」 カルディで売ってるクッキー缶が衝動買いしてしまうかわいさ

こりゃ最強だわ…。男が気づいたら惚れる【性格美人】の秘密

ロッテ「チョコパイ〈キャラメルミルフィーユ〉」発売、ほろにがキャラメルクリーム&香ばしいミルフィーユの味わい、ハピネスモチーフシリーズ第3弾「王冠」イメージのチョコパイ

愛猫血まみれで「震え止まらず」 近所の"ネコ狩り"で囚われの身に…飼い主は奪還できる？

高速道路で“レンタカーを煽り続ける”黒のアルファード。恐怖のドライブに遭遇した男性の告白

橋の名前が書かれた「橋名板」15枚盗まれる 千葉

雪の中で舞い踊るモップの正体は…… “犬は喜び庭かけ回り”状態のファンシー乱舞に「モップってこんなに速く動くんだ」【海外】

松屋、「肉の日企画」で「牛焼肉ダブル定食」など200円引き、4月29日1日限定、松弁ネット、松屋モバイルオーダーからの注文限定

歯科医が床タイルに埋まった人間の顎骨を発見！一体誰の骨だったのか？

「うわっかわいい」「これは欲しい」 カルディで売ってるクッキー缶が衝動買いしてしまうかわいさ

こりゃ最強だわ…。男が気づいたら惚れる【性格美人】の秘密

ロッテ「チョコパイ〈キャラメルミルフィーユ〉」発売、ほろにがキャラメルクリーム&香ばしいミルフィーユの味わい、ハピネスモチーフシリーズ第3弾「王冠」イメージのチョコパイ

愛猫血まみれで「震え止まらず」 近所の"ネコ狩り"で囚われの身に…飼い主は奪還できる？

高速道路で“レンタカーを煽り続ける”黒のアルファード。恐怖のドライブに遭遇した男性の告白

橋の名前が書かれた「橋名板」15枚盗まれる 千葉

雪の中で舞い踊るモップの正体は…… “犬は喜び庭かけ回り”状態のファンシー乱舞に「モップってこんなに速く動くんだ」【海外】

松屋、「肉の日企画」で「牛焼肉ダブル定食」など200円引き、4月29日1日限定、松弁ネット、松屋モバイルオーダーからの注文限定

頂き女子りりちゃん「懲役9年」判決にネット騒然、「性犯罪より重い」の声も 量刑はどう決まる？ 元検察官の弁護士に聞く

火炎放射器搭載の犬型ロボット「サーモネーター」がついに一般販売

「応募が来ない」「来ても定着しない」「ハズレが多い」......悲鳴続々！「バイト不足」のしんどい話

「結婚するやつはバカだと本気で思っています」あえて結婚しない人たちの本音とは

身長174センチの女性アイドルに「ここは女性専用車両です!!!」 電車内で突如怒られ「声か、、、」と嘆き 「理不尽すぎる」と反響の声

エレベーターが20階から落下、1人死亡＝当局「品質には問題なし」―中国

「子どもの票は僕のもの、って」吉村知事の「0歳児に選挙権」提案にSNSドン引き 蓮舫も苦言

【速報】徳島で車が田んぼに転落、少年3人死亡

子どもを育てた経験のない大人が激増している…｢子持ち様はずるい｣の批判が過熱する根本原因

【速報】物価上昇上回る所得「必ず実現する」と首相

4/27(土)21:00～選挙戦最終日に東京15区の立候補者が集う「ネット演説」生放送 主催：ニコニコ

【LIVE】5/5（日）9:00～【アメリカ海軍の航空ショー】岩国基地フレンドシップデー2024

5/3(金)午前0時〜声優・古谷徹と三石琴乃の朗読で聞く「日本国憲法」を24時間配信【憲法記念日特集2024年】

ネット・科学
もっと見る

「うわっかわいい」「これは欲しい」　…

雪の中で舞い踊るモップの正体は……　…

薄汚れたれんがが……　家を高圧洗浄で…

「うわっかわいい」「これは欲しい」　カルディで売ってるクッキー缶が衝動買いしてしまうかわいさ

愛猫血まみれで「震え止まらず」近所の"ネコ狩り"で囚われの身に…飼い主は奪還できる？

橋の名前が書かれた「橋名板」15枚盗まれる千葉

雪の中で舞い踊るモップの正体は……　“犬は喜び庭かけ回り”状態のファンシー乱舞に「モップってこんなに速く動くんだ」【海外】

「うわっかわいい」「これは欲しい」　カルディで売ってるクッキー缶が衝動買いしてしまうかわいさ

愛猫血まみれで「震え止まらず」近所の"ネコ狩り"で囚われの身に…飼い主は奪還できる？

橋の名前が書かれた「橋名板」15枚盗まれる千葉

雪の中で舞い踊るモップの正体は……　“犬は喜び庭かけ回り”状態のファンシー乱舞に「モップってこんなに速く動くんだ」【海外】

頂き女子りりちゃん「懲役9年」判決にネット騒然、「性犯罪より重い」の声も　量刑はどう決まる？　元検察官の弁護士に聞く

身長174センチの女性アイドルに「ここは女性専用車両です!!!」　電車内で突如怒られ「声か、、、」と嘆き　「理不尽すぎる」と反響の声

「子どもの票は僕のもの、って」吉村知事の「0歳児に選挙権」提案にSNSドン引き蓮舫も苦言

4/27(土)21:00～選挙戦最終日に東京15区の立候補者が集う「ネット演説」生放送　主催：ニコニコ