令和5年度 第3回 生成AIの機械システム設計開発への活用フォーラム 講演サマリー
講師:柿沼 太一 STORIA法律事務所 弁護士
©2023 Taichi Kakinuma | Storialaw.jp All rights reserved.
(本コンテンツの著作権は、柿沼 太一様に帰属いたします。)
コンテンツ
[1] 生成AIと第三者データ利用に関する論点一覧
1-1. 対象データの種類
1-2. 対象データの利用場面
1-3. 学習→指示→生成に至る一連のプロセス
1-4. パターン1:第三者の著作物を学習にのみ利用するパターン
1-5. パターン2:第三者の著作物を生成AIの入力にのみ利用するパターン
1-6. パターン3:第三者の著作物を生成AIに入力し、同一・類似のAI生成物を生成した上で利用するパターン
1-7. パターン4:第三者の著作物を学習に利用した結果、同一・類似のAI生成物が生成され、同生成生物を利用するパターン
1-8. RAG(拡張検索):検索に利用した既存著作物が生成物に含まれないパターン
1-9. RAG(拡張検索):検索に利用した既存著作物が生成物に含まれるパターン
[2] 生成AIと著作権侵害
2-1. AI開発・学習と著作権侵害(パターン1)
2-2. AI生成物の生成・利用と著作権侵害(パターン2)
2-3. AI生成物の生成・利用と著作権侵害(パターン3)
2-4. AI生成物の生成・利用と著作権侵害(パターン4)
講師プロフィール
1. 生成AIと第三者データ利用に関する論点一覧
対象データの種類 × 対象データの利用場面
1-1. 対象データの種類
[1] 他人が知的財産権を保有しているデータ
– 具体例:著作物
– 制限の内容:原則として著作権者の承諾がなければ当該著作物を複製・公衆送信等できない
[2] 契約上、利用について制限がかかっているデータ
– 具体例:NDAを締結して受領した秘密情報
– 制限の内容:NDAにおける秘密情報の目的外利用の禁止や第三者提供の禁止
[3] 取得や利用について法規制がかかっているデータ
– 具体例:個人情報・個人データ
– 制限の内容:個人情報(個人データ)の取得・利用・提供に関する個人情報保護法上の規制
1-2. 対象データの利用場面
[1] 生成AIの学習
[2] 生成AIへの入力
[3] 生成AIを利用した生成物の生成と利用
に分けて考えるとよい。
1-3. 学習→指示→生成に至る一連のプロセス
1-4. パターン1: 第三者の著作物を学習にのみ利用するパターン
1-5. パターン2: 第三者の著作物を生成AIの入力にのみ利用するパターン
1-6. パターン3: 第三者の著作物を生成AIに入力し、同一・類似のAI生成物を生成した上で利用するパターン
1-7. パターン4: 第三者の著作物を学習に利用した結果、同一・類似のAI生成物が生成され、同生成生物を利用するパターン
1-8. RAG(拡張検索): 検索に利用した既存著作物が生成物に含まれないパターン
1-9. RAG(拡張検索): 検索に利用した既存著作物が生成物に含まれるパターン
2. 生成AIと著作権侵害
2-1. AI開発・学習と著作権侵害(パターン1)
[1] 具体例
(1) 第三者が提供する画像生成AIのOSSを使い、他者の画像でファインチューニング(FT; LoRA(Low-Rank Adaptation)を含む)を行って自社専用の画像生成AIを構築
(2) 第三者が提供するLLM(Large Language Models)のAPI を利用した自社専用FAQシステムの構築の際、回答精度を上げるため、各種データによる当該LLMのFTを行う。
[2] 原則
– いずれの具体例も30条の4第2号により原則として適法。
*「情報解析」には LoRA、FTも含む
(著作物に表現された思想又は感情の享受を目的としない利用)
第三十条の四 著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合
二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。)の用に供する場合
三 前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用(プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。)に供する場合
[3] 日本著作権法30条の4の特殊性
– 主体や利用目的に制限がない。
例:英国の場合、「非商業的調査のためのテキストおよびデータの解析のための複製」のみが権利制限の対象(著作権・意匠・特許法29A条、2014年改正) 。
– 利用行為が国外で行われた場合に日本の著作権法30条の4が適用されるか(準拠法の問題)
「当該著作物が利用される地」(利用行為地国)の法律が適用
→LLM開発目的で著作物の利用行為を行う場合でも、当該利用に関する利用行為地(≒サーバ所在地)が日本であれば日本著作権法が適用され、米国であれば米国著作権法が適用されることになる。
– 著作権者が誰かは無関係
準拠法の問題は、あくまで「利用行為地」が日本国内か否かの問題であって、当該著作物の著作権者が日本の企業なのか外国の企業なのかは無関係
[4] 例外
(1) 例外1:学習時に学習対象著作物の享受目的も併存している場合
(2) 例外2:30条の4但書「ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。」
(1) 例外1:学習時に学習対象著作物の享受目的も併存している場合
「情報解析(学習)のために対象著作物の利用行為を行うに際して、対象著作物の「表現上の本質的な特徴」を感じ取れるような著作物の作成目的(=対象著作物の享受目的)が併存している場合、対象著作物の利用行為は30条の4の対象にならない。
→ ただし、ChatGPTなどの文章作成AIをビジネスで活用する場合、学習行為(FT含む)に「享受目的」が認められることはほとんどないのではないか
例外1:学習時に学習対象著作物の享受目的も併存している場合
https://www8.cao.go.jp/cstp/ai/ai_team/3kai/shiryo.pdf
(2) 例外2: 30条の4但書「ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。」
ただし書に該当するか否かは、同様のただし書を置いている他の権利制限規定(法35条第1項等)と同様に、著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的市場を阻害するかという観点から判断
1) 典型的には、改正前47条の7ただし書に該当する行為、具体的には「情報解析の用に供するために作成されたデータベースの著作物」の利用行為が該当
2) 一般論としては「ある非享受目的の利用を本来的な利用目的として創作された著作物について、当該目的で利用する行為」について、本ただし書きに該当することが多いとされている 。
令和5年度著作権セミナー「AIと著作権」文化庁著作権課講義資料より
2-2. AI生成物の生成・利用と著作権侵害(パターン2)
[1] どのようなパターンか
生成AIに既存著作物を入力しているだけであり、生成AIによる処理結果として類似著作物が生成されていないパターン
[2] 権利制限規定の適用
– 原則
生成AI内において、入力された既存著作物を解析しAI生成物を生成する行為(正確には「AI生成物の生成を行うための、入力著作物のモデル内での解析行為」)
→「情報解析(30条の4第2号)」に該当
[1] 当該「情報解析」のために既存著作物を入力する行為
[2] 入力のためにDB内に既存著作物を蓄積する行為
[3] 既存著作物を電子化する行為
はすべて「情報解析のために必要な行為」に該当し、30条の4第2号により原則として適法
– 例外
享受目的併存の場合②30条の4但書(学習段階の例外と同じ)
– 享受目的併存について
享受目的:「情報解析(生成)のために、対象著作物の利用行為を行うに際して、対象著作物の「表現上の本質的な特徴」を感じ取れるような著作物の作成目的
どのような場合にこの「享受目的」が認められてしまうのか?
→パターン3へ
2-3. AI生成物の生成・利用と著作権侵害(パターン3)
[1] どのようなパターンか
生成AIに既存著作物を入力し、生成AIによる処理結果として入力データと類似するAI生成物が生成され、当該AI生成物を配信・譲渡等するパターン
[2] 各行為の分析
(1) 入力行為
パターン1と同様、「情報解析」のために必要な行為に該当。しかし、このパターンは入力のみ行っているパターン2と異なり、AI生成物を実際に生成し、かつ配信等していることから入力行為について享受目的ありとして30条の4の適用なくNGと思われる。
(2) AI生成物の生成行為
私的利用目的複製(30条)・検討過程における利用(30条の3)が適用されれば適法。なお、AI生成物の生成行為は「情報解析の結果」なので30条の4の適用はない。
(3) AI生成物の複製行為
各種権利制限の適用がなく著作権侵害に該当する。
[3] パターン2(適法)とパターン3(違法)の違い
既存著作物と同一・類似のAI生成物が生成・利用されているか否か
パターン2(適法)
パターン3(違法)
[4] パターン2(適法)とパターン3(違法)の違い
既存著作物と同一・類似のAI生成物が生成・利用されているか否か
パターン2(適法)
パターン3(違法)
[5] パターン3が適法となる余地はないのか
a)非著作物しか出力されなければもちろん適法
– 既存著作物がウェブページ上の著作物の場合に、当該ウェブページのリンクだけを出力する。
– 既存著作物が書籍の場合に、当該書籍の書誌情報及び頁番号だけ出力する。
b)出力された既存著作物の利用が「軽微利用」(著作権法47条の5第1項)に該当すれば適法
たとえば、既存著作物(テキスト)の一部分だけ出力、既存著作物(画像)のサムネルだけ出力するなど
*軽微利用:当該公衆提供等著作物のうちその利用に供される部分の占める割合、その利用に供される部分の量、その利用に供される際の表示の精度その他の要素に照らし軽微なもの
c)出力された既存著作物の利用が「引用」(著作権法32条)に該当すれば適法
ただし、「引用」の要件(明瞭区分性や主従関係、出所表示など)を満たす必要あり
2-4. AI生成物の生成・利用と著作権侵害(パターン4)
[1] どのようなパターンか
学習に既存著作物が使われており、生成AIに生成指示や非著作物を入力したところ、生成AIによる処理結果として既存著作物の類似著作物が生成され、当該類似著作物を利用(公衆送信・譲渡等)しているパターン
[2] ユーザーが既存著作物の存在を知っていたり、学習に既存著作物が利用されていることを知っている場合(ユーザー自身が既存著作物を用いてFTした場合等)
– 依拠性:肯定
– 権利制限規定:適用なし
– 故意・過失:あり
[3] ユーザーが既存著作物の存在を知らない場合
– 依拠性:難問
– 権利制限規定:適用なし
– 故意・過失:なし
講師プロフィール
柿沼 太一 (Taichi Kakinuma) 弁護士
[所属]
STORIA法律事務所
[経歴]
– 1997年京都大学卒業
– 2000年4月弁護士登録
– 2015年STORIA法律事務所設立
– AI、データ、知的財産、スタートアップ法務を主として取り扱う
– 経産省の「AI・データ契約ガイドライン」検討委員会委員(2018)
– 経済産業省 「オープンイノベーションを促進するための技術分野別契約ガイドラインに関する調査研究」委員会事務局(2021~)
– 日本データベース学会理事
– JDLA有識者委員・理事