CNFinBenchが大規模言語モデルの総合スコアを発表:中国平安金融大モデルが第1位に輝く

(出典:台海网)

転載元:台海网

近日、中国平安の金融大規模モデル「PingAnGPT-Qwen3-32B」が、業界権威の大規模モデル評価体系「CNFinBench」の大規模言語モデル公開リストで総合順位1位を獲得しました。今回の評価には、DeepSeek-R1(671B)、Qwen3-235B-A22B、Kimi-K2(1000B)などのオープンソース大規模モデルや、GPT-4o、Claude-Sonnet 4、Doubao-1.5-proなどの先進的なクローズドソース商用モデルも含まれ、業界最高水準を代表しています。この評価のトップ獲得は、平安が金融大規模モデル分野において技術力を業界最先端に到達させたことを示しています。

CNFinBenchは、上海人工知能国家実験室のチームと金融分野の権威機関が共同で作成した中国語金融大モデルの総合評価基準であり、国内で最も権威性と業界認知度の高い金融大モデル能力評価プラットフォームです。本次の評価において、PingAnGPT-Qwen3-32Bは、金融事実推理と計算、金融専門知識の質問応答、金融コンプライアンスとリスク管理などの重要指標で卓越したパフォーマンスを示し、正確な金融数値計算能力、厳密な論理推論能力、金融全分野の知識体系の深い理解を展開し、特に金融投資分析やリスク測定などのシーンで重要な応用価値と安全性を確保しています。

評価者は、「今回のCNFinBenchでのトップ獲得は、平安の金融大モデルにおける技術力の高さを示している」と述べています。注目すべきは、中国平安が評価に使用したモデルは32Bパラメータ規模のみであり、DeepSeek-R1(671B)の約5%、Kimi-K2(1000B)の約3.2%に満たない規模ながらも、総合性能での優越を実現し、モデルの効率と性能のバランスにおいて重要な技術的突破を果たしたことです。「軽量高効率」の特性を活かし、このモデルは自動車保険の事故報告、人事・社員サービスの自動応答、カスタマーサポートのリアルタイム品質管理、インテリジェント会話、グループの財務・経費審査など97の業務シーンをサポートし、今後のプライベートクラウド展開やシーン化応用の土台となっています。

CNFinBenchの評価体系は、金融専門知識の質問応答、金融業務の理解と分析、金融事実推理と計算、金融コンプライアンスとリスク管理、金融内在性と応用安全の五つの主要な側面をカバーし、モデルの金融分野における専門性、業務理解度、計算精度、コンプライアンス意識、安全性を総合的に検証します。

2025年前三半期、平安のデータベースには30兆バイトのデータが蓄積され、約2.5億人の個人顧客をカバーしています。膨大なデータを基に大規模モデルを訓練し、3.2兆以上の高品質テキストコーパス、31万時間のラベル付き音声データ、75億以上の画像データを収集しています。大量のデータを土台に、テクノロジー企業のサービス技術と応用を推進し、金融業務の体験向上、リスク管理、コスト削減、販売促進を実現しています。2026年2月には、国家知的財産権出版社が『金融科技産業2025年特許分析白書』と『医療健康産業2025年特許分析白書』を発表し、中国平安は再び2025年の金融科技と医療健康分野の特許数でトップを獲得し、複数のコア技術と重要な応用シーンでリードしています。

中国平安は、先進的なAI能力の構築とモデルの最適化・改良を推進し、シーン化応用の実現を深めることで、技術優位をサービス価値に変換し、高品質なデジタル金融の提供を通じて、人々の豊かな生活への願いに応え、「安心、省時間、節約」を実現するサービスを展開し、金融強国の建設に貢献しています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン