【元記事をASCII.jpで読む】

 UiPathは、2024年4月11日、3月に開催された本社年次イベント「UiPath AI Summit」を振り返るユーザー向けセミナーを開催した。同イベントでは、AIを活用した自動化プラットフォーム「UiPath Business Automation Platform」における、生成AI関連のアップデートが多数発表されている。

 UiPath Business Automation Platformでは、UiPathが提供しすぐに利用できる生成AI機能に加えて、サードパーティの大規模言語モデル(LLM)やユーザー企業独自の特化型LLMも自動化に組み込むことができる。UiPathのプロダクトマーケティング部 部長である夏目健氏は、「業務によって必要なAIは異なる中で、最適なAIを選択して、自動化の中で活用できるオープンなプラットフォーム」と説明する。

 同プラットフォームでは、文書やコミュニケーションデータなどをコンテキストとして収集、これらを生成AIモデルに投げ、生成AIの判断や回答を、同社の強みであるRPAのテクノロジーでアクションにつなげる。あわせて、セキュリティの確保と運用管理の仕組みも用意している。これがUiPathにおける生成AI活用のベースであり、セミナーでは生成AI×自動化を加速させる今後の機能強化について紹介された。

RAG実装のためのグラウンディングやLLMコネクターの拡張

 まず紹介されたのが、生成AIにデータを取り組むコンテキスト領域のアップデートとなる「Context Grounding」だ。ハルシネーションを低減するRAGを実装するためのグラウンディング機能で、生成AIの判断や回答の根拠付けとして独自データや専門情報などを参照させる仕組みを提供する。

 高度なITスキルを必要とせずに実装でき、PDFやCSV、JSONなど多様な形式の情報ソースを生成AIに渡して、問い合わせや専門性の高い業務などの自動化を推進する。同機能は、グローバルでは2024年6月にプライベートプレビューを開始、今後日本語対応も予定している。

 生成AIの判断や回答を基にしたアクションの領域では、自然言語で自動化のワークフローを生成する「Autopilot(旧名Wingman)」がロール別に用意されており、それぞれプライベートプレビュー中である。今回、開発者向けの「Autopilot for Developers」、テスター向けの「Autopilot for Testers」のパブリックプレビューの開始が発表された。

 Autopilot for Developersは、「特定の人物からメールが届いたら、そこに添付されたファイルをSharePointに保存する」といった、自然言語による説明からワークフローやアプリケーションを自動生成する機能だ。Autopilot for Testersは、要件を基にテストの作成や改善の提案などをしてくれる、テスト自動化を効率化する機能。両機能ともに2024年6月にグローバルでのGA(一般提供開始)が予定されており、今後日本語にも対応予定だ。

 サードパーティの生成AIモデルを自動化で使用するための「GenAI Connector」においては、新たにIBMの「watsonx」向けコネクターやGoogleの「Gemini」への対応などが発表された。「GPT-4V」や「Gemini Vision」といった画像を扱うビジョン型LLMにも対応し、マルチモーダルな自動化を支援する。

 「GenAI Activities」という、チャットやテキスト生成、要約などのユースケース単位での生成AI開発を支援する環境も発表された。サードパーティの生成AIモデルもUiPathとの契約内で利用でき、プロンプトエンジニアリングも不要な、UiPathが事前構築した開発環境だ。現在パブリックプレビューで提供されている。

インテリジェントドキュメント処理(IDP)特化のLLMも発表

 UiPathが、“インテリジェントドキュメント処理(IDP)”として展開するドキュメント処理ツールの「Document Understanding」、およびコミュニケーションデータの分析・処理ツール「Communications Mining」においても、生成AI機能が順次組み込まれる。非構造化データを変換して自動化につなげるAIツールが、生成AIの力でより強化になるという方向性だ。

 まずは、それぞれのツール向けに、同社が独自にファインチューニングし、同社の環境にホストされるLLM「UiPath LLMs」が発表された。

 Document Understanding向けのLLMである「DocPath」は、企業ドキュメントに特化してトレーニングされ、データの抽出精度を向上させる。同ツールでは、ドキュメントデータをOCRが変換し、AIが項目の意味を理解した上で読み取る仕組みだが、この“項目読み込み”の精度が特化型LLMで向上する。

 Communications Mining向けのLLMである「CommPath」は、メールやチャットなどのコミュニケーションデータに特化してトレーニングすることで、抽出できるデータが増え、自動化できる範囲を拡張させる。ユーザーの独自データを基にさらにファインチューニングすることで、ドメインに特化したLLMを運用することもできる。

 DocPathは2024年8月にパブリックプレビュー、CommPathは2024年4月にGAを予定しており、今後日本語対応も進めていく。

 「Generative Annotation」は、両ツールにおける、モデル学習のためのデータラベリングを効率化するアノテーション機能だ。データを一括アップロードすると生成AIが分類を予測した上で、自動でラベリングしてくれる。「Active Learning」は、生成AIがアノテーションも含むAIモデルのパフォーマンスを評価する機能だ。Generative AnnotationとActive Learningは、両ツール向けに間もなくすべてがGAされ、日本語対応も完了済みである。

 Document Understandingおける「Generative Validation」では、AI-OCRで避けて通れない人手を介した検証フェーズを生成AIが代行する。信頼度の高い読み取り箇所をチェックする必要がなくなり、自動化の効率を向上させる。同機能は日本語対応済みで、2024年10月にGAを予定している。

UiPath、自動化×AIを加速させるドキュメント処理特化の独自LLMを発表