少ないデータによるAI・機械学習の進め方と精度向上、説明可能なAIの開発

レポートナンバー　0000040030

インターネット通信インフラeビジネス

エレクトロニクス・IT(その他)

少ないデータによるAI・機械学習の進め方と精度向上、説明可能なAIの開発

株式会社技術情報協会

発刊日 2024/10/31

言語日本語

体裁A4/388ページ

ライセンス/価格388ページ

0000040030

書籍版	88,000 円（税込）

お問い合わせ

無料サンプル

サンプルはお問い合わせください。

レポート概要

☆大量の教師データは不要！　生成AI、転移学習、マルチタスク学習によるデータ拡張！
☆AIはなぜその答えを出したのか！　判断根拠、信頼性とは！

■　本書のポイント

少量データによるAI・機械学習
　1．データの偏り、大量のデータ収集ができない．．．
　　　　　　　限られたデータからより多くの学習データを生成する方法！
　2．重要なパラメータのみをデータに応じて自動的に抽出！
　3．枝刈り技術を用いたスパースモデリングの高速化！
　4．既存のデータの価値を高めるデータクレンジングの仕方！

説明可能なAI（XAI）
　1．高い精度と説明性を両立する方法とは！
　2．AI・機械学習の予測根拠をどのように可視化するか！
　3．学習モデルのどこが悪いのかピンポイントで把握！
　4．生成AIの出力に対する根拠説明技術とは！

精度向上・学習時間短縮
　1．学習の計算効率向上、学習計算量の削減方法とは！
　2．精度が低い原因をどのように特定するか！
　3．アルゴリズムの選び方、チューニングの仕方！
　4．学習の計算効率の高め方！学習計算量の削減方法！

■　各章のポイント

第1章のポイント！
　★種類／モデルに基づく分析手法の選び方、評価の仕方！
　★モデルの性能を正確に測定する方法とは！

第2章のポイント！
　★本当に必要なデータ、足りないデータをどう見極めるか！
　★データ欠損が意思決定に与える影響とは！

第3章のポイント！
　★データを活用するための正しい実験記録の残し方！
　★研究データを適切に蓄積・管理する方法とは！

第4章のポイント！
　★学習を繰り返すだけでは予測精度の改善に繋がらない！
　★生成AIのハルシネーションを逆手に取ったデータ拡張方法！

第5章のポイント！
　★学習時間短縮による開発コスト削減、モデルの迅速な更新！
　★性能向上による高度な言語処理能力の実現方法！！

第6章のポイント！
　★事後説明器、予測分析と因果推論の併用、AIME．．．
　　　　　　　　　　AI・機械学習の公平性，説明可能性，透明性の担保！

第7章のポイント！
　★機械学習のためのデータを利用する場合の留意点！
　★信頼されるAIを実現するための方法とは！

レポート詳細

執筆者（敬称略）

※順不同

積水化学工業(株)	新明健一	日本工業大学	荒川俊也
DIC(株)	今田知之	公立諏訪東京理科大学	石井一夫
(株)日立製作所	高原渉	慶應義塾大学	栗原佑介
豊田合成(株)	東立	ランサーズ(株)	岸本誠輔
オムロン(株)	太田雄也	(株)アプライド・マーケティング	大越章司
ソニーグループ(株)	鈴木健二	元データビズラボ(株)	吉田俊太
日本電信電話(株)	井田安俊	徳島大学	松本和幸
富士通(株)	白幡晃一	徳島大学大学院	宇田陽斗
富士電機(株)	村上賢哉	(株)LINK.A	太田桂吾
(株)東芝	山口晃広	(株)キャトルアイ・サイエンス	上島豊
富士通(株)	村上勝彦	東京科学大学	安藤康伸
富士通(株)	阿部修也	愛知工科大学	豊吉巧也
富士通(株)	光石豊	フューチャー(株)	岸波洋介
富士通(株)	富士秀	フューチャーブリッジパートナーズ(株)	長橋賢吾
(株)日立コンサルティング	大木康幸	岐阜県産業技術総合センター	渡辺博己
(株)ソニーコンピュータサイエンス研究所	磯崎隆司	岐阜大学	加藤邦人
(株)Argopilot	相馬知也	名古屋工業大学	稲津佑
シュレーディンガー(株)	石崎貴志	慶應義塾大学	緒明佑哉
iASYS Technology Solutions(株)	桑田武	筑波大学	五十嵐康彦
(株)ブライトヴォックス	笠原亮介	青山学院大学	齊藤史哲
奈良先端科学技術大学院大学	船津公人	岐阜大学	髙木朗義
(国研)物質・材料研究機構	岩崎悠真	(株)東京建設コンサルタント	塚本満朗
日本工営(株)	箱石健太	大阪産業大学	堀上明
千葉工業大学	吉川友也	牛島総合法律事務所	影島広泰
(株)イマジナリー／(株)ヴィッツ	森川聡久	(国研)情報通信研究機構	西田知史
(同)EigenBeats／武蔵野大学	中西崇文	東京海上ディーアール(株)	加藤直人
(株)キカガク	秋山貴史	(公財)学習情報研究センター	澤井進

第1節　AI（人工知能）／機械学習の種類
はじめに
1.AIと機械学習の違い
2.教師あり学習と教師なし学習
3.教師あり学習
　3.1　回帰分析
　3.2　サポートベクタマシン
　3.3　ニューラルネットワーク
4.教師なし学習
　4.1　k-means法
　4.2　主成分分析
　4.3　自己組織化マップ
まとめ
付記

第2節　AI／機械学習の目的に応じた分析手法の選定
はじめに
1.データ分析で使用されるAI／機械学習の種類
　1.1　教師あり学習
　1.2　教師なし学習
　1.3　強化学習
2.AI／機械学習の種類に基づく分析手法の選択
　2.1　線形回帰モデル
　2.2　決定木モデル
　2.3　ベイジアンモデル
　2.4　ニューラルネットワークモデル
　2.5　4つの分析手法の主な違い
3.AI／機械学習の学習性能評価方法
　3.1　分類問題の評価手法
　3.2　回帰問題の評価手法
　3.3　交差検定法
4.AI／機械学習の学習性能評価に基づく分析手法の選択の例
5.深層学習モデルにおける説明可能性の問題
6.生成AIモデルに基づく分析手法の選択
　6.1　生成AIモデルの種類
　6.2　分析手法の選択基準
おわりに

第3節　海外のAI規制の動向から見るAIガバナンス
はじめに
1.AIガバナンスの意義
　1.1　日本におけるAIガバナンスの意義と位置づけ
　1.2　海外におけるAIガバナンスの意義と位置づけ
　　1.2.1　IAPPにおける定義
　　1.2.2　国連AI諮問機関におけるAIガバナンス
　1.3　小括
2.法規制によるAIガバナンス
　2.1　権利ごとの規制
　2.2　欧州
　　2.2.1　GDPR（General Data Protection Regulation）
　　2.2.2　AI規則（AIA：Artificial Intelligence Act）
　　2.2.3　機械規則（2023/1230/EU）
　　2.2.4　AI責任指令（AILD：AI Liability Directive）
　　2.2.5　データ規則（2020/1828/EU）
　　2.2.6　欧州評議会AI条約
　　2.2.7　小括
　2.3　英国
　2.4　米国
　　2.4.1　連邦レベル
　　2.4.2　州レベル
　2.5　カナダ
　2.6　中国
　2.7　シンガポール
　2.8　偽情報・誤情報
3.標準化によるAIガバナンス
　3.1　標準化によるガバナンス
　3.2　欧州
　3.3　米国
　3.4　中国
　3.5　シンガポール
おわりに

第4節　AI、機械学習のトレンド変革と必要とされるデジタル人材像の変化
1.はじめに
　1.1　誰もが使いやすいUser Interfaceの提供
　1.2　推論側でのAIの簡易な学習の提供
　1.3　タスクに応じた選択肢から、選択する側へ
2.求められるデジタル人材像
　2.1　これまでのデジタル人材育成
　2.2　生成AI時代がもたらしたデジタル人材への影響
　2.3?　人材育成から成果創出へ
3.まとめ

第5節　生成AI導入の前に考慮すべきポイントと社内導入と活用のコツ
はじめに
1.生成AI導入の背景と重要性
　1.1　生成AIで代替できる業務
　　1.1.1　広告などに活用するコンテンツ、コピーライティングの効率化
　　1.1.2　カスタマーサポートや顧客対応に活用
　　1.1.3　製品開発・設計
　1.2　生成AIの社内導入の背景
　　1.2.1　経営層のトップダウンで導入
　　1.2.2　生産性の向上
　　1.2.3　リスキリングによるITリテラシーの向上
2.生成AI導入前に考慮すべきポイント
　2.1　生成AI導入における課題と考慮すべきポイント
　　2.1.1　個人情報のリスク
　　2.1.2　著作権侵害・商標権・意匠権侵害
　　2.1.3　誤情報や差別的・反社会的な表現の拡散
　　2.1.4　活用の浸透
3.生成AIの社内導入
　3.1　目的の定義付け
　　3.1.1　目的の定義付けにおけるポイント
　3.2　導入検証
　　3.2.1　導入検証におけるポイント
　3.3　初期導入
　　3.3.1　初期導入におけるポイント
　3.4　導入・浸透
　　3.4.1　導入・浸透におけるポイント
4.生成AIの社内活用のコツ
　4.1　プロンプトはシンプルに質問文でかつ様々な種類のプロンプトを準備する
　4.2　対話型の形式をうまく利用する
　4.3　生成AIを活用した事例などは積極的に発信・勉強会を実施する

第6節　生成AI時代に求められる人材とDX
はじめに
1.生成AIの仕組みと特徴、そして限界
2.企業専用AIとプロンプト・エンジニアリング
3.先行きに不透明さが見えてきた生成AIだが、むしろ今のうちに取り組むべき
4.今必要なのは、DXについての取り組みを加速すること

◇第2章データ加工、クレンジング、特徴量の選定◇

第1節　データ活用に向けたデータ収集とデータクレンジング
はじめに
1.データ収集
　1.1　収集すべきデータの定義方法
　　1.1.1　データの種類
　　1.1.2　収集するデータの定義方法
　1.2　データ収集の方法
　　1.2.1　WEB API
　　1.2.2　スクレイピング
　　1.2.3　ダウンロード
　　1.2.4　ETLツール
2.データクレンジング
　2.1　データクレンジングとは
　　2.1.1　データクレンジングの概要
　　2.1.2　データクレンジングの目的
　　2.1.3　データクレンジングのメリット
　2.2　データクレンジングの代表的な手法
　2.3　代表的なデータクレンジングツール
　　2.3.1　Microsoft Excel
　　2.3.2　Pandas／Dataframe (Pythonライブラリ)
　　2.3.3　AWS Glue
　2.4　データクレンジングの進め方
　　2.4.1　データ分析前にするべきデータクレンジング
　　2.4.2　データ分析と並行して行うべきデータクレンジング
　2.5　データクレンジングはデータ品質改善の万能薬ではない

第2節　小規模テキストデータの前処理技術：データ拡張，リサンプリング，欠損値補完
はじめに
1.学習データの不足を補うEasy Data Augmentation
　1.1　英語テキストにおけるEasy Data Augmentation
　1.2　日本語テキストにおけるEasy Data Augmentation
2.その他のテキストデータ拡張手法
　2.1　逆翻訳を用いたテキストデータ拡張
　2.2　シャッフルによるデータ拡張
　2.3　要約を用いたテキストデータ拡張
　2.4　音声合成と音声認識を用いたデータ拡張
　2.5　生成モデルに基づくテキストデータ拡張
3.小規模テキストデータ拡張とリサンプリングの実装と評価
　3.1　日本語テキスト向けEDAライブラリ
　3.2　不均衡データに対するリサンプリングを用いた性能向上
　3.3　欠損値の補完に基づく手法
4.データ拡張手法の未来
　4.1　生成AIに基づく拡張データを用いる際の課題
　4.2　アルゴリズムが先かデータセットが先か
謝辞

第3節　AI、機械学習の精度を上げる特徴量エンジニアリングとテクニック
はじめに
1.AIモデルの作成に関する学習データの位置づけ
　1.1　学習データとは
　1.2 特徴とは何か
　1.3 特徴を引き出すことができるか？
2.AIモデル
3.データオーギュメンテーション
　3.1　データオーギュメンテーションの基本
　3.2　生成AIのデータオーギュメンテーションへの活用
4.特徴量エンジニアリング
　4.1　特徴量エンジニアリングの概要
　4.2　画像における特徴量エンジニアリング
　4.3　音における特徴量エンジニアリング
5.運用後の工夫
おわりに

第4節　AIの産業適用に向けたデータ収集、蓄積とデータ欠損値への対応
はじめに
1.AIとデータの重要性
2.不足しているデータ収集におけるポイント
　2.1　今あるデータで試してみる
　2.2　データ収集におけるポイント
　　2.2.1　目的を決める
　　2.2.2　処理方法(使い方)を決める
　　2.2.3　収集デバイスの選定
　　2.2.4　簡易的にやってみる
　　2.2.5　システム実装検討
3.データ蓄積の重要性
4.データ欠損への対応
　4.1　データ欠損の重要性
　4.2　欠損値の補完
　4.3　データ補完の検証
おわりに

第5節　機械学習モデル構築時の注意点とスキル向上
はじめに
1.機械学習モデル構築時の流れと注意点（材料開発のテーブルデータを例に）
　1.1　タスク設計
　　1.1.1　データ分析の目的を明確にする
　　1.1.2　データの準備を行う
　　1.1.3　探索的データ分析（EDA）を行う
　　1.1.4　タスク設計を行う
　1.2　構築した機械学習モデルの運用
2.データ形式毎の機械学習モデル構築に向けたTIPS
　2.1　画像データでの機械学習モデル構築
　2.2　テキストデータでの機械学習モデル構築
　2.3　ドメイン特化データでの機械学習モデル構築
3.継続的な学習とスキルの向上について
　3.1　データ分析コンペティションの利用
　3.2　SNSの利用
おわりに

◇第3章データ収集、蓄積、データベース構築◇

第1節　研究、実験データ収集・活用への課題と仕組みの作り方
はじめに
1.材料研究におけるデータ記録・活用の課題
　1.1　データがない
　1.2　データが活用できる形になっていない
　1.3　データがあっても活用できない
　1.4　活用できる人が少ない
2.データの記録
　2.1　どのようにデータを記録したら活用しやすいか
　2.2　化学構造式の付番管理（登録）システム
　2.3　材料研究の場合の付番管理
　2.4　アッセイデータ管理システム
　2.5　アイデア・着想の記録
3.データの活用
　3.1　特徴量の抽出
　3.2　化学構造式
　3.3　画像処理
　3.4　スペクトルデータ
まとめ

第2節　実験データを蓄積、活用できるデータベース構築の仕方
はじめに
1.データ駆動型アプローチへの期待
2.実験データの使用用途の変化とデータベース
3.実験データベースのイメージ
4.正しい蓄積の仕方
5.データの粒度
　5.1　検索視点でのデータの粒度
　5.2　活用視点でのデータの粒度
6.データの入出力
　6.1　データ入力
　　6.1.1　手入力
　　6.1.2　ファイル読み込み
　　6.1.3　自動登録（フォルダ監視）
　　6.1.4　自動登録（API）
　　6.1.5　フローチャート型入力
　6.2　データ出力
　　6.2.1　ファイルで出力
　　6.2.2　APIで出力
　　6.2.3　出力先の解析プログラムを実験データベースに統合する
7.適した基盤IT技術の違い
　7.1　プロセスの柔軟性
　7.2　データの検索や可視化
8.データベースの基盤技術に関する基本知識
　8.1　Excelと何が違うのか？
　8.2　データベースのグローバルトレンドとグラフ型データベース

第3節　電子実験ノートを活用した研究、実験データの効率的な蓄積と限界
はじめに
1.R&D部門におけるデータ共有、利活用の実情
2.報告書の共有で期待して良いこと、良くないこと
3.データ共有で研究の何が改善できるのか？
4.実験データ蓄積基盤としての電子実験ノートの選び方
5.電子実験ノートでデータ蓄積、共有が難しい実験

第4節　実験データ／失敗データの収集，管理と実験効率化への応用
1.素材・材料開発効率化のための実験データの収集・蓄積
　1.1　研究，実験データ収集・蓄積のあるべき姿とは
　1.2　研究，実験データ収集の課題
2.素材・材料開発効率化のための実験データの管理
　2.1　実験データ収集を進めるための人材育成
　　2.1.1　個々のエンジニアがデータの収集・蓄積で持つべき観点
　　2.1.2　実験の記録を正しく残せているかどうかの条件
　　2.1.3　実験の記録を正しく残す方法
　　2.1.4　失敗データを残す方法
　2.2　実験データ収集を進めるための仕組み化，データ管理システム
　　2.2.1　仕組み化に対する基本的な考え方
　　2.2.2　開発データ活用の仕組み化の事例
　　2.2.3　開発データ活用の仕組み化の実際

第5節　社内データベースの構築、管理と研究開発効率化への活用
はじめに
1.データベースの必要性
　1.1　勘・コツ・経験の職人集団
　1.2　データの探索
　1.3　マテリアルズインフォマティクス（MI）
2.データベース化への取組み
　2.1　典型的な実験データ
　2.2　散在するデータ
　2.3　実験データベースのすすめ
3.実験データベースの構築の実際
　3.1　実験データベースのシステムコンセプト例
　3.2　実験データベースのアーキテクチャ例
　3.3　実験データベースの構成例
おわりに

第6節　材料研究・開発の効率化に向けたデータベース構築の仕方
はじめに
1.データの蓄積とデータ駆動サイクル
　1.1　データベース構築に必要な生成と蓄積
　1.2　研究データの構造
　1.3　データ構造モデル
　　1.3.1　フラットファイルフォーマット（CSV, JSON, XML）
　　1.3.2　関係データベース
　1.4　データ駆動サイクル
2.データ収集時に考えなければいけないこと
　2.1　活用可能なデータ
　2.2　データ取得コスト
　2.3　説明変数の制御可能性
3.課題設定の重要性

◇第4章少ないデータで機械学習、AIを学習させ活用する方法◇

第1節　少ない実験データから出発して目標物性を達成するには
はじめに
1.合理的に次の実験候補を得る必要性
2.ベイズ最適化がもたらす次の実験候補
3.自動化化学の展開
おわりに

第2節　深層学習を活用した応力場予測に関するデータ拡張の仕方
はじめに
1.オープンデータセットでの例
　1.1　MNISTの学習例
　1.2　MNISTの学習例（相対度数を意図的に変化させた場合）
2.データが少ない場合のデータ拡張の手法と応力場の予測の場合
　2.1　相対度数均等化データ拡張法
　2.2　相対度数均等化データ拡張法による応力場の予測
おわりに

第3節　機密情報検知における生成AIを活用したデータ拡張の方法
はじめに
1.機密情報検知と固有表現抽出
　1.1　機密情報検知とは
　1.2　機密情報検知における固有表現抽出の応用
　1.3　固有表現抽出の課題
2.固有表現抽出におけるデータ拡張
　2.1　データ拡張とは
　2.2　固有表現抽出におけるデータ拡張
　2.3　既存のデータ拡張法の限界
3.生成AIを用いた事実性に捉われないデータ拡張
　3.1　対象とする機密情報検知の問題設定
　3.2　現時点での事実に捉われないデータ拡張
　3.3　生成AIのハルシネーションの活用
　3.4　当社が提案したデータ拡張手法
　　3.4.1　周辺文脈のデータ拡張
　　3.4.2　エンティティのデータ拡張
　3.5　データ拡張の効果
4.提案したデータ拡張手法の応用可能性
　4.1　他の機密情報への応用
　4.2　自然言語処理における他の課題への応用
おわりに

第4節　生成AIを用いた教師データの作成とAI学習への活用
はじめに
1.生成AIとGPT
2.自己教師あり学習
3.自己教師あり学習の課題と今後のAI学習への活用

第5節　検査工程の省人化、効率化に向けた欠陥画像分類へのAIの活用
はじめに
1.欠陥画像分類モデルの概要
2.転移学習／ファインチューニングの導入
　2.1　学習済みモデルの比較実験
　2.2　学習済みモデルを利用した欠陥画像分類モデルによる実験
3.マルチタスク学習の導入
　3.1　マルチタスク学習の適用
　3.2　タスクの選定
　3.3　マルチタスク学習を適用した欠陥画像分類モデルによる実験
4.データ拡張の導入
　4.1　幾何変形によるデータ拡張
　4.2　GANによるデータ拡張
　　4.2.1　DCLGANによる画像生成
　　4.2.2　画像生成実験
　4.3　データ拡張を利用した欠陥画像分類モデルによる実験
　　4.3.1　幾何変形によるデータ拡張実験
　　4.3.2　DCLGANによるデータ拡張実験
おわりに

第6節　画像認識技術と少量学習データへの対応
1.画像認識手法の概要
　1.1　背景
　1.2　機械学習を用いた画像認識技術
　1.3　一般的な物体認識の処理フロー
2.画像認識を用いた外観検査の開発方法
　2.1　機械学習による外観検査開発フロー
　2.2　入力画像データ
　　2.2.1　正確なラベル付け
　　2.2.2　大量データの収集
　　2.2.3　Data Augmentation
　2.3　特徴量の設計
　2.4　機械学習アルゴリズム
3.画像認識アルゴリズムの実例
　3.1　Z-scoreを用いた欠陥検査
　3.2　鋳造部品の画像検査アルゴリズム
　　3.2.1　検査対象
　　3.2.2　アルゴリズム
　　3.2.3　結果
　3.4　偏光カメラの画像を用いた路面凍結検知アルゴリズム
　　3.4.1　偏光情報の利用
　　3.4.2　機械学習を用いた路面状態認識における課題
　　3.4.3　教師なし異常検知の利用
　　3.4.4　教師なし異常検知への深層学習の応用
　　3.4.5　精度評価方法
　　3.4.6　精度評価結果

第7節　枝刈りによるスパースモデリングの高速化技術
はじめに
1.スパースモデリングによる特徴選択
　1.1　正則化項付き線形回帰
　1.2　スパース正則化と特徴選択
　1.3　Group lassoとブロック座標降下法
2.枝刈りによる高速化
　2.1　Fast group lasso
　2.2　数値実験
　2.3　参考
まとめ

第8節　少ないデータから判断できる汎用の外観検査AIの開発と活用のポイント
はじめに
1.AutoEncoder
2.Deep SVDD
3.事前学習済みモデルを利用した手法

第9節　実験計画法を用いた生産条件最適化への転移学習技術の適用による精度と効率の両立
はじめに
1.提案手法
　1.1　提案手法の概要
　1.2　実験計画法（Design of Experiments）
　1.3　転移学習（Transfer Learning）
　1.4　回帰分析（Regression Analysis）
2.机上実験
　2.1　実験概要
　2.2　実験結果
3.実機での効果検証
　3.1　検証概要
　3.2　検証用データの取得
　3.3　検証結果
　3.4　考察
おわりに

第10節　ベイズ最適化に基づく実験工程の効率化
はじめに
1.ブラックボックス関数最適化
　1.1　最適変数探索問題
　1.2　既知関数とブラックボックス関数
　1.3　ベイズ最適化
2.ベイズ線形モデルとガウス過程回帰モデル
　2.1　ベイズ線形モデル
　2.2　ガウス過程回帰モデル
3.ガウス過程回帰モデルを用いたベイズ最適化
　3.1　Probability of Improvement (PI)
　3.2　Expected Improvement (EI)
　3.3　Upper Confidence Bound (UCB)
　3.4　Thompson Sampling
　3.5　それぞれの獲得関数の挙動と性質
　3.6　発展的な獲得関数に関して
4.ガウス過程回帰モデルを用いた領域推定のためのベイズ的アプローチ
　4.1　ガウス過程を用いた領域推定
　　4.1.1　Straddle
　　4.1.2　Maximum Improvement in Level-set Estimation (MILE)

第11節　小規模データに適用可能なMIと材料開発への活用法
はじめに
1.小規模データと実験研究者のためのMI
2.小規模データに対する実験主導MI
3.実験主導MIによるナノシート材料の収率向上とサイズ制御
　3.1　2次元材料としてのナノシート
　3.2　小規模データセットの作成と予測モデルの構築
　3.3　予測モデルを用いた未知な系での実験数の削減
4.リチウムイオン二次電池有機負極活物質の探索
　4.1　有機電極活物質の分子設計の指針
　4.2　小規模データセットの作成と学習
　4.3　予測モデルの精度検証と物質探索
おわりに

第12節　シミュレーションと機械学習を活用したマテリアルズ・インフォマティクス
はじめに
1.高飽和磁化合金
2.シミュレーション型の自律材料探索
3.コンビナトリアル実験による検証
おわりに

◇第5章機械学習・AIの精度向上と学習時間短縮◇

第1節　AI、機械学習のモデル開発と精度向上のポイント
はじめに
1.モデル開発のポイント
　1.1　モデル開発のプロセス
　1.2　ビジネスでモデル開発する場合のポイント
2.精度向上のポイント
　2.1　機械学習の精度
　　2.1.1　数値を当てる場合（回帰問題）の精度
　　2.1.2　カテゴリを当てる場合（分類問題）の精度
　　2.1.3　ROC曲線とPR曲線
　2.2　精度向上の方法
　　2.2.1　データの量
　　2.2.2　データの質
　　2.2.3　アルゴリズムの選択
まとめ

第2節　AI・LLMの学習時間短縮と性能向上のポイント
はじめに
1.AI・LLMの学習時間短縮のポイント
　1.1　性能分析
　1.2　演算効率化
　1.3　並列化効率の向上
　1.4　I／O時間の短縮
　　1.4.1　データ読み込みを非同期化、並列化
　　1.4.2　ローカルディスクへのデータステージング、データキャッシング
　1.5　その他の高速化の手法
2.AI・LLMの性能向上のポイント
　2.1　ハイパーパラメータの調整
　　2.1.1　学習率の調整
　　2.1.2　オプティマイザの選択
　2.2　ニューラルネットワーク構造の最適化
　2.3　少量のデータでの学習
3.AI・LLMの学習時間短縮と性能向上の事例
　3.1　MLPerf HPC
　3.2　Fugaku-LLM

◇第6章説明可能なAI／ブラックボックス解析技術と業務への導入、活用◇

第1節　説明可能なAIと機械学習での公平性
はじめに
1.説明可能なAI
　1.1　概念
　1.2　判断根拠の可視化手法
　　1.2.1　Grad-CAM
　　1.2.2　LIME
　　1.2.3　SHAP
　　1.2.4 Smooth Grad
　1.3　羅生門効果
　1.4　Attention Branch Network
　1.5　SGD Influence
　1.6　大規模言語モデルにおける説明可能なAI
2.機械学習での公平性
　2.1　社会的な問題
　2.2　公平性配慮型機械学習
　2.3　説明可能なデータバイアス緩和
おわりに

第2節　事後説明器による説明の忠実性を改善する予測モデル訓練法
はじめに
1.問題設定及び提案法の概要
2.忠実性の評価尺度
3.微分可能な追加・削除メトリクス
4.説明の忠実性の正則化付き学習法
5.性能評価
6.事後説明器の説明を改善させるその他のアプローチ
おわりに

第3節　AIモデルの透明化技術と品質保証
はじめに
1.AI標準化で重視される観点
2.AIモデルの透明性とは
3.AIシステムの透明化技術
　3.1　説明可能なAIとは
　3.2　AIを説明可能にするさまざまな手法
　3.3　トレーサビリティによる透明化
　3.4　システムの特性の熟知
　　3.4.1　Step1:カタログを活用
　　3.4.2　Step2:詳細な特性を把握
4.AIシステム開発プロセスの透明化技術
　4.1　開発プロセスの定義と実施
　4.2　AIモデルの評価必須項目
　4.3 使用実績による証明
5.利用者との相互作用の透明化技術
おわりに

第4節　説明可能なAIの重要性と技術動向
はじめに
1.XAIの歴史
2.XAIの分類
　2.1　XAIの種類の分類
　2.2　XAIによる説明の表現方法
　　2.2.1　特徴の重要度
　　2.2.2　例示の導出
　　2.2.3　推定プロセスの可視化
　　2.2.4　カウンターファクチュアル（反実事実的）説明
　　2.2.5　ルールベースの導出
　　2.2.6　グラフなどの構造で提示
　　2.2.7　テキストと自然言語の説明
3.AIME (Approximate inverse model explanations)とその提示例から見るXAIによって変化すること
　3.1　AIMEとは
　3.2　AIMEから導出される説明の例
　3.3　ビジネスにおけるXAIの役割
4.XAIのこれからの技術動向
おわりに

第5節　因果推論技術CALCによるAIの判断理由の理解
はじめに
1.AI活用の現況とその説明性
2.XAIのためのいくつかの方法
　2.1　LIME
　2.2　SHAP
3.ソニーCSL独自の因果推論ツールCALC
　3.1　相関と因果の違い
　3.2　構造的な因果モデルの効用
　3.3　因果推論メソッドCALC
4.因果推論ツールCALCの事例
　4.1　ソニー損害保険株式会社での事例
　4.2　ジャパン・イーエム・ソリューションズ株式会社での事例
　4.3　その他の事例
5.CALCのXAIとしての活用
まとめ

第6節　説明性の高い時系列波形データ分析向けAIの開発と異常診断への活用
はじめに
1.AIの説明性
2.Shapelets学習法
3.正常データのみで学習するshapelets学習法
4.長さを学習可能なshapeletsに基づく時系列分類手法
おわりに

第7節　説明可能なAIとプラント制御へのデータ分析技術
はじめに
1.「診断・予測」における「説明できるAI」
　1.1　「説明できるAI」とその類型
2.活用事例
　2.1　診断
　　2.1.1　発電プラントの異常診断への適用例（MSPC）：推論結果の説明
　　2.1.2　エネルギープラントの異常要因の適用例（因果推論と決定木）：モデルの説明
　2.2　予測
　　2.2.1　太陽電池製造プラントの最適製造条件探索（部分的最小二乗法）：データ・モデルの説明
　　2.2.2　製造プラントの温度予測（構造化ディープラーニング（富士電機独自））：モデルの説明

第8節　ゲノム医療にむけた説明可能AI (XAI) の開発
はじめに
1.がんの遺伝子変異に対する原因（病原性）推定と「説明可能AI（XAI）」
　1.1　がんゲノム医療の病原性推定の概要
　1.2　手法
　1.3　本研究成果の今後の展開：染色体レベルの大きな変異に対応した病原性推定XAIの開発
2.さまざまな医療向けAI
　2.1　医療文献のキュレーション作業を効率化するシステム
　2.2　自然言語処理技術を活用した文献検索サービス
　2.3　薬剤の反応を予測するシステム
　2.4　がん疾患などで重要な化学反応の詳細を予測するナレッジグラフ
　2.5　自動臨床コード付与技術の開発
　2.6　臨床テキストから家族情報を抽出する家系図生成技術
　2.7　デジタル化された医療文書のための自然言語処理技術群
　2.8　生成AIや大規模言語処理を利用したXAIシステムの開発にむけて
おわりに

第9節　日立コンサルティングでのXAI適用事例?営業部門AI適用におけるベテラン知識の抽出
はじめに- AI実務案件の浸透とXAI技術の登場
1.XAI手法
2.日立コンサルティングでのベテラン・組織知の集約事例
　2.1　営業活動の成功要因の説明モデル
　2.2　実務部門へのAIモデル導入にあたっての課題
　2.3　解決策：実務者を交えた仮説検証討議会議体
　　2.3.1　初期仮説の確認：常識通りかの確認
　　2.3.2　実務者の常識・直感と異なる結果の確認
　　2.3.3　検証討議結果の記録／新しい仮説の記録と次回アクションの設定
　2.4　アウトプット例
おわりに - 手法の一般化，生成AI等新技術の適用

第10節　複数ダムにおける畳み込みニューラルネットワークを用いた流入量予測モデルのXAI適用
はじめに
1.検証対象ダムとデータ
　1.1　対象ダム
　1.2　対象データ
2.モデル構築
　2.1　入出力データ
　2.2　モデル
3.XAIの適用
　3.1　Grad-CAM
　3.2　SHAP
4.流入量予測モデルの計算結果と考察
　4.1　計算結果
　　4.1.1　土師ダム
　　4.1.2　野村ダム
　4.2　考察
　　4.2.1　土師ダム
　　4.2.2　野村ダム
5.XAIによる予測の根拠の可視化
　5.1　土師ダム
　5.2　野村ダム
6.XAIによる可視化の考察
　6.1　土師ダム
　6.2　野村ダム
さいごに

第11節　説明可能な人工知能を用いた顧客データからの満足要因の検出に関する研究
本稿の概要
はじめに
1.説明可能な人工知能の概要
　1.1　説明可能な人工知能の概要
　1.2　LIME
　1.3　SHAP
2.LIMEによる顧客満足度の解析と可視化
　2.1　導入
　2.2　解析対象の概要
　2.3　LIMEによる出力結果の可視化
　2.4. データ解析
　　2.4.1　解析の設定
　　2.4.2　解析結果
　　2.4.3　まとめと考察
　2.5　おわりに
3.SHAPを用いたオンライン購買顧客のリードスコアリングとその解釈7)
　3.1　導入
　3.2　解析データについて
　　3.2.1　解析対象の概要と方針
　　3.2.2　クラスとして扱う質問項目
　　3.2.3　特徴量として扱う質問項目
　3.3　解析方法について
　　3.3.1　提案法の基本方針
　　3.3.2 提案法
　3.4　解析実験
　　3.4.1　解析の設定
　　3.4.2　解析結果
　　3.4.3　まとめと考察
　3.5　おわりに
まとめ
謝辞

第12節　説明可能なAI(XAI)を用いた豪雨時の住民避難行動分析
はじめに
1.データセット
2.機械学習を用いた住民避難選択行動モデル
3.住民避難行動要因の分析手法“Partial Dependence（PD）分析”
4.XAIを用いた住民避難行動要因の分析結果および統計的検定との比較
おわり

◇ 第7章公平性と品質保証、信頼性評価◇

第1節　AIが創造性を評価するために
はじめに
1.創造性を測定するために
2.創造性をどのように定義するか　?「創造性の思考三位一体理論」の構築?
3.創造性測定尺度の開発
4.創造性の機械採点の可能性
5.AIは創造性を評価できるのか

第2節　AIの利用における法的留意点と学習データに潜むリスク
はじめに
1.プロンプトに入力する際の法的留意点
　1.1　個人情報を入力する際の留意点
　1.1.1　利用目的の特定と通知等
　1.1.2　個人データの「提供」
　1.1.3　仮名加工情報の活用
　1.2　著作物をプロンプトに入力する際の留意点
2.ファインチューニングなど機械学習のためのデータを利用する場合の留意点
　2.1　個人情報を学習用データとして利用する際の留意点
　2.2　著作物を学習用データとして利用する際の留意点
3.生成AIの生成物を利用する際の留意点
　3.1　生成物が他人の著作権を侵害するリスク
　3.2　生成物が著作物として保護されるか

第3節　第3節　脳情報に基づいたAIの信頼性評価技術
はじめに
1.脳シミュレーション技術
　1.1　脳シミュレーターを構成する3つのモデル
　　1.1.1　応答予測モデル
　　1.1.2　自己回帰モデル
　　1.1.3　解読モデル
　1.2　脳シミュレーション技術の特長
　　1.2.1　人間の認知推定における有効性
　　1.2.2　脳の情報処理への近接
　　1.2.3　個人差の反映
2.AIの信頼性とは何か？

第4節　生成AIを利活用する組織におけるリスクマネジメントについて
はじめに
1.近年のAIを取り巻く状況について
2.生成AIを利用する組織において留意すべきリスク
　2.1　生成AIのアウトプット利用の際に著作権を侵害するリスク
　2.2　生成AIのハルシネーション（幻覚）に起因する誤情報により誤った意思決定をしてしまうリスク
　2.3　生成AIの情報入力により、外部に機密情報・個人情報等が漏洩するリスク
3.生成AI利活用に関するリスクマネジメントについて
　3.1　生成AIのアウトプットに関する著作権侵害に係る対策
　3.2　ハルシネーションに係るリスクマネジメント
　3.3　生成AIに係る情報漏洩に対するリスクマネジメント
まとめ

第5節　「教師あり学習」を用いたAI倫理
はじめに
1.AI倫理の背景
2.AI倫理の定義
3.教師あり学習
4.教師あり学習を用いたAI倫理処理
5.AI倫理処理システムの試作
6.教師あり学習モデルを使った検証

お買い物ガイド

よくある質問