テンセント・フンユアン・ビッグモデル・アップグレード:「文勝図」を追加し、コード能力を大幅に向上

テンセント・フンユアン・ビッグモデル・アップグレード:「文勝図」を追加し、コード能力を大幅に向上

テンセントは10月26日、テンセント渾源モデルが新たなアップグレードを経て、「文勝図」機能を正式に公開し、自動画像生成分野における同社の優れた能力を実証したと発表した。アップグレード後、Tencent Hunyuan Chinese の総合的な機能は GPT3.5 を超え、コーディング機能は 20% 大幅に向上し、業界をリードするレベルに達しました。

実用的な汎用ビッグモデルとして、Tencent Hunyuan Big Model は豊富で多様なアプリケーション シナリオを備えています。現在、テンセントミーティング、テンセントドキュメント、エンタープライズWeChat、テンセント広告、WeChat検索など、180を超えるテンセント社内業務がテンセントフンユアンに接続されています。最近、QQブラウザはTencent Hunyuanをベースにした「PDF閲覧アシスタント」もリリースしました。これには、インテリジェント要約、インテリジェントQ&A、マルチラウンド質問などの機能があります。

現在、小売、教育、金融、医療、メディア、交通、政府関係など、さまざまな業界の顧客がTencent Cloudを通じてTencent Hunyuan Big Model APIを利用しています。応用分野には、インテリジェントな質疑応答、コンテンツ作成、データ分析、コードアシスタントなど、さまざまなシナリオが含まれます。今年9月に最初の登録が承認されて以来、テンセント・フンユアン・モデルは徐々にCエンドユーザーに開放され、体験できるようになっています。ユーザーはミニプログラムやウェブページを通じてテンセント・フンユアンとコミュニケーションを取ることができます。

今回、テンセントが独自に開発した垂直分野向けの7Bおよび13Bモデルもデビューしました。これらは同じ効果を達成するために必要なトークンが少なく、トレーニング効率も高くなっています。このモデルの実際の中国語と英語の結果は、一般的に国内外のオープンソース モデルよりも優れています。より高いコスト効率と効率でアプリケーションの実装をサポートし、さまざまな垂直シナリオとビジネス ニーズを満たし、テンセントが大規模なモデルを完全に採用するのに役立ちます。

テンセントは、モデルアルゴリズムから機械学習フレームワーク、AIインフラストラクチャに至るまで、フルリンクの自社開発技術を習得しており、大規模モデルの迅速な反復に好ましい条件を提供していると理解されています。テンセントの渾源モデルは、初公開以来、加速的なアップグレードの軌道に乗り始めた。独自開発のアルゴリズムのサポートにより、モデルの安定性と信頼性が着実に向上しました。

テンセントの渾源文勝図が衝撃的な登場を果たし、広告シーンでの応用効果が明らかになった

ヴィンセントグラフは、AIGC 分野の中核技術の 1 つであり、一般的な大規模モデルの機能の試金石でもあります。モデル アルゴリズム、トレーニング プラットフォーム、コンピューティング設備に対する要件が厳しいです。

テンセントは、広告シナリオで AI を使用した画像の自動生成を研究した最初の企業であり、その過程で深い研究開発能力を蓄積してきました。報道によると、テンセント・フンユアンの文生図アプリケーションは、他の大型モデルと比較して、肖像リアリティとシーンリアリティにおいて明らかな優位性があり、同時に、中国の風景、アニメ、ゲームシーンの生成においても優れた性能を発揮する。

テンセント・フンユアンは、業界では難しいと認識されている顔写真生成においても満足のいく結果を達成した。たとえば、プロンプトワードが「綿のドレスを着て、目が大きく、古代中国、写真風、漢服を着たかわいいアジアの4歳の女の子を生成」の場合、Tencent Hunyuan モデルは以下を生成します。

テンセントの渾源モデルは「綿服」や「漢服」などのプロンプトワードに言及された内容をよく理解していることがわかります。同時に、スタイルの面では、建築や風景の背景を通じて「古代中国」のスタイル要求も表現しています。

別の例では、「都市のCBDオフィスビル、モダンなデザイン、高層ビル、ガラスカーテンウォール、クローズアップショット、写真スタイル、写真写真」というプロンプトワードを入力し、Tencent Hunyuan Modelは次の作品を制作しました。

もっと簡単にするために、「船は水墨画風に何千もの山々を通過しました」というプロンプトを入力すると、次の画像が表示されます。

大規模モデルのテキスト グラフィックスの難しさは、プロンプト ワードの意味理解、生成されたコンテンツの合理性、生成された画像の効果にあります。これら 3 つの技術的困難に対応するため、テンセントは特別な技術研究を実施し、生成された画像の可用性と品質を確保するための一連の独自のアルゴリズムを提案しました。

意味理解の面では、Tencent Hunyuan は中国語と英語のきめ細かいバイリンガル モデルを採用しています。このモデルは、中国語と英語を同時にモデル化してバイリンガル理解を実現し、最適化アルゴリズムを通じてモデルの詳細認識と生成効果を向上させ、多文化の違いによる誤解を効果的に回避します。

コンテンツの合理性という点では、AI が生成した人体の構造や手は変形しがちです。渾源文勝図は、アルゴリズム モデルの画像の 2 次元空間位置を認識する能力を強化し、人間の骨格や手の構造などの事前情報を生成プロセスに導入することで、生成される画像構造をより合理的なものにし、エラー率を低減します。

画像のテクスチャに関しては、Hunyuan Wenshengtu はマルチモデル融合の方法に基づいて生成されたテクスチャを改善します。モデルアルゴリズムの最適化後、髪の毛やしわなどの詳細を含む渾源文生図のポートレートモデルは30%改善され、草、木、波紋などの詳細を含むシーンモデルは25%改善されました。

プロンプト: 写真を生成してください: 桂林の漓江の風景、川に小さなボートがある

「実践から生まれ、実践へ」という大型モデルとして、テンセント・フンユアン・ウェンシェントゥの能力は、素材作成、製品合成、ゲームグラフィックスなど多くの業務に活用されています。また、広告業務における複数回の評価において、テンセント・フンユアン・ウェンシェントゥの事例優秀率と広告主採用率はそれぞれ86%と26%に達し、いずれも同様のモデルを上回りました。

Tencent は業界をリードするコーディング能力を備えており、すでに大規模なモデルを使用して社内でコードを「記述」しています。

過去 1 か月で、テンセントの Hunyuan モデルのすべての機能がアップグレードされただけでなく、コーディング機能と数学機能も大幅に向上しました。 32の主流言語のコードファイル、さまざまなコンピュータ書籍やブログを研究し、トレーニングした結果、テンセントのHunyuanコード処理レベルは20%以上向上し、コード処理効果はChatGPTより6.34%優れています。また、HumanEval公開テストセット指標の面でも、Starcoder、Codellamaなどの業界をリードするオープンソースコードモデルを上回りました。

「フロントエンド言語を使用してスネーク ゲームの実装を手伝ってください」などの簡単なコマンドを入力するだけで、Tencent Hunyuan は実行可能コードを自動的に生成し、スネーク ゲームをすばやく作成します。さらに、Tencent Hunyuan は Python、C++、Java、Javascript など複数の言語でのコマンド生成もサポートしています。たとえば、「Python を使用して赤いハート型の線を描画する」と入力すると、Tencent Hunyuan はコードライブラリの選択、コマンドのインストール、コードの描画など、具体的な操作手順をガイドします。

プロンプト: Pythonを使用して赤いハート型の線を描きます

Tencent は現在、Tencent Hunyuan モデルに接続された複数の開発プラットフォームを持っています。エンジニアは Tencent Hunyuan を使用して、コード生成、コード補完、コード脆弱性の検出と修復、テーブル データ処理、データベース クエリなどのタスクを実行できます。

たとえば、IDE プログラミング シナリオでは、Tencent Copilot は、混合要素の大規模モデルに接続することで、コメントに基づいて対応するコードを生成したり、コンテキストに基づいてコードをインテリジェントに補完したりできるため、プログラミング効率が大幅に向上します。 Hunyuan 大規模モデルは、ソフトウェア開発プロセス中にセキュリティを確保するために、コードの脆弱性を検出して修復するのにも役立ちます。

テンセントのHunyuanモデルの継続的なアップグレードは、テンセントが自社開発したワンストップ機械学習プラットフォームであるAngelのサポートと切り離せないものです。自社開発の AngelPTM トレーニング フレームワークは、業界をリードするメモリ使用率とトレーニング スループット効率を備え、効率的な分散トレーニング ソリューションを提供できます。トレーニング速度は業界の主流フレームワークよりも 1 倍高速です。自社開発の AngelHCF トレーニング フレームワークは、蒸留、微調整、圧縮からモデル加速まで完全な機能を備え、複数のモデルを並列でサポートし、モデルの展開を最小限に抑えてスループットを最大化し、推論速度は業界の主流フレームワーク FasterTransformer よりも 1.3 倍高速です。

テンセントは2021年以来、数千億、数兆のパラメータを持つNLPスパース大規模モデルを相次いでリリースし、CLUEリストの3大記録を破り、中国語理解能力の新たな飛躍的進歩を達成しました。 2023年9月のHunyuan Big Modelの発売は、テンセントのビッグモデルの理解と生成チャネルの統合を表しています。文勝図機能の登場により、テンセントの渾源モデルは画像処理機能を追加し、モダリティがさらに充実しました。

大規模モデルのマルチモーダルインタラクション機能は、汎用人工知能を実現する唯一の方法であると考えられており、大規模モデルの能力象限を継続的に拡大するための重要な方向性でもあります。報道によると、テンセントのHunyuan Big Modelは画像、動画、音声などさまざまなモダリティの処理能力を継続的に強化しており、その成果はまもなく外部に公開される予定だという。

<<:  快手は快易のビッグモデルの助けを借りてコメントエリアでのインテリジェントな返信を実現する「AI小快」をテスト中

>>:  何をするにしても使い始めるべき 7 つの超便利な AI ツール

ブログ    
ブログ    
ブログ    

推薦する

パラメータのわずか4%、GPT-3のパフォーマンスに匹敵:開発者がDeepMindのRETROを説明

BERT から GPT-2、そして GPT-3 へと、大規模モデルの規模は拡大し、そのパフォーマン...

顔認識は「スマート交通」に役立ち、3つの側面でその価値を実証する

近年、都市化の急速な発展と都市人口の継続的な増加により、都市交通の重要性がますます高まっています。わ...

...

AIの第一人者ジェフ・ディーン氏がGoogleのAI事業を統括

Googleの人工知能事業のトップレベルで人事異動があった。19年間Googleに在籍してきた人工知...

インドは天気予報の精度を向上させ、異常気象に対処するためにAIをテストしている

ロイター通信は現地時間12月24日、インドが天気予報の精度向上のため、気候モデルの構築にAIの使用を...

AI プロジェクトの 85% が失敗する理由は何ですか?

現在、人工知能(AI)は、人事、サプライチェーン、マルチレベルマーケティングなど、さまざまな分野で広...

今年の春節旅行は異例、テクノロジーが鍵

今年も春節の旅行シーズンがやってきましたが、今年は明らかに例年とは違います。今年は、感染症予防・抑制...

欧州はAI規制を推進

先週、欧州の議員らは画期的な人工知能規制であるEU AI法案を圧倒的多数で賛成票を投じた。この法案は...

核酸の結果を数えるのは難しいですか?復旦大学の博士課程の学生の活動が人気に

核酸レポートの手動検証は時間がかかり、面倒で、エラーが発生しやすくなります。どうすればよいでしょうか...

GitHub Wanxing の中国語機械学習リソース: ロードマップ、ビデオ、学習提案がすべてここにあります

[[263087]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

AIチップ帝国が戦争状態!アルトマン氏は米国政府と密かに会談し、孫正義氏は大きな賭けに向け1000億ドルを緊急調達

この時代において、AIは科学技術の将来の発展の重要な支点となり、AIチップは産業の発展を牽引する新た...

...

AIの旅を始めるのに役立つ3つの重要なステップ

すべての IT 問題には学習曲線と転換点があり、解決策が見つかる「なるほど!」という瞬間があります。...

...