三田評論ONLINE

【特集:AIと知的財産権】
座談会:生成AIと共生するために考えておくべきこと

2023/06/05

(出席者)

  • 852話(はこにわ)

    AIアートディレクター
    2010年頃からイラストレーター、映像作家としてクリエイター職に就く。ゲームディベロッパーとしての実績もあり、22年夏からAI技術に傾倒。

  • 杉浦 孔明(すぎうら こうめい)

    慶應義塾大学理工学部情報工学科教授
    2007年京都大学大学院情報学研究科博士後期課程修了。博士(情報学)。情報通信研究機構主任研究員等を経て、20年慶應義塾大学理工学部准教授。22年より現職。専門は知能ロボティクス、深層学習等。

  • 矢向 高弘(やこう たかひろ)

    慶應義塾大学大学院システムデザイン・マネジメント研究科教授
    塾員(1989工、94理工博)。博士(工学)。慶應義塾大学理工学部准教授等を経て23年より現職。専門は符号理論、コンピュータネットワーク等。慶應義塾大学AI・高度プログラミングコンソーシアム代表。

  • 奥邨 弘司(おくむら こうじ)

    慶應義塾大学大学院法務研究科教授

    1991年京都大学法学部卒業。98年ハーバード大学ロースクールLL.M. 修了。専門は著作権法、企業内法務。電機メーカー法務本部、神奈川大学経営学部准教授等を経て2013年より現職。

  • 君嶋 祐子(司会)(きみじま ゆうこ)

    慶應義塾大学法学部教授、同大学グローバルリサーチインスティテュート(KGRI)所長

    塾員(1989法、96法博)。博士(法学)。1992年より弁護士、法学部助手等を経て2012年より教授。05年ジョージ・ワシントン大学ロースクールLL.M. 修了。専門は、知的財産法、イノベーションと法。

「ChatGPT」の仕組み

君嶋 本日は、現在、非常に早いスピードで普及している生成AIと知的財産権にかかわることを中心に、皆さまとお話ししていきたいと思います。

今、「ChatGPT」について、テレビをつけても、ネットを開いても、毎日のように議論が行われています。これまでの言語処理に比べると非常に自然な文章が出てくるということで、ものすごいスピードで世界的に普及しています。

これは便利だというポジティブな評価の一方で、AIを教育の場でどの程度使うべきかなどについては論争中で、子どもの成長のためには12歳まで触れさせないほうがいいという意見もあり、議論が巻き起こっています。

一気にAIの技術が身近なものになってきましたが、研究者としてこの技術の開発にずっと取り組んでこられた杉浦さん、ご自身のこれまでの研究と、現在のAIができる技術について、ま ずご紹介いただければと思います。

杉浦 私の専門は知能ロボティクス、機械知能、深層学習です。私は3年前まで国立研究所で音声翻訳も研究していました。音声翻訳はかなり昔から研究されているAIの分野ですが、今は音声翻訳ソフトがスマホに入っていることを知らない人がいないぐらい、一般的なものになっているかと思います。

人間を凌駕するAIもたくさん出てきています。クイズを解くもの、ゲームなどは、人間のチャンピオンを超えています。また、平均的な人と同等以上ということであれば、機械翻訳、音声翻訳は30言語以上できますので、普通の人より優れていると思います。

画像の認識技術も、精度は向上してエラーはどんどん減っており、2015年あたりに人間の認識よりも精度が高いものが得られています。さらにノーベル賞を取れるAIを作るというチャレンジングな研究もあります。

このような人間を凌駕するAIが出てくることは人間にとってどのようなプラスの側面があるかというと、1つには、囲碁の棋士などがAIを使って練習を繰り返し、強くなります。2017年に「AlphaGo」が囲碁のチャンピオンを破ったのですが、それ以降、棋士のスコアが急激に上がっているという研究結果が今年報告されています。AIを練習に使うことで人間のスキルが上がることは様々な分野で見られます。

大規模言語モデルについて少しご紹介します。話題のChatGPT は2022年11月に発表された対話的に文章生成を行う大規模言語モデルです。今年の3月にはGPT-4が出て、これは米国統一司法試験において、上位10%と同等のスコアが取れるレベルになっています。

仕組みは「言語モデル」と呼ばれるものなのですが、やっていることは簡単で、次に来る単語を予測するだけです。例えば「むかしむかしあるところに」の次に、「おじいさんがいました」というのはありそうですが、「おとうさんがいました」は違和感がある。つまり実際の文章の中で発生する確率が違います。大量のテキストデータを読み込み、頻度を学習し、次に出てくる単語を精度よく予測する。これが言語モデルのやっていることです。

この言語モデルからChatGPTのようなプログラムが生まれるというのが、われわれ研究者にとっても非常に驚くべきところです。

また、ChatGPTは、お使いいただくと、毎回同じ文章が出てくるわけではないことがわかると思いますが、ランダムな要素を少し入れることで全く違う文章を出すことができます。このような枠組みで言語モデルはできています。

画像生成AIの進化

君嶋 よくわかりました。次にAIアートディレクターとして画像の創作をされ、AIの技術をまさに実用化されている852話さん、創作の中で直面していることなどをお話しいただけますか。

852話 画像生成AIというモデルで言えば、去年の7月にMidjourneyというサービスが出て、とても話題になりました。

このサービスは、「テキスト・トゥー・イメージ」という形態を利用しています、つまり、文字を入力すると、それが画像になって出力されるモデルです。例えば「花・女の子」と入れたら、花と女の子の画像が出力される。元のモデルとして億単位の大量の画像を学習させ、ベクトルの形にして特徴を覚えさせたものがデータの塊としてあり、その中からテキストで入力した情報と近似した特徴を拾い上げ、画像生成して出力する、と考えればイメージしやすいと思います。

Midjourney が出てきた時、それまでの画像生成AIのシステムとは比べ物にならないクオリティーで、クリエイティブな画像が生成されたので大変な話題になりました。「え、これ、人間がつくったんじゃないの?」というクオリティーの画像がどんどん出力されるようになったわけです。

それで、もしかして今までクリエイターの人たちがつくった商業的な画像を、つぎはぎしてコラージュしているのではないかというイメージが一般に広がり、問題になったのですね。

基本的にはAIのモデルのデータの塊の中には画像そのものは入っていません。ここに線があったら人間は気持ちよく感じるといった概念的特徴や、杉浦さんが文章生成で説明されたように、ここに線があったら、次にこの色がくるといった「お約束」をモデルが覚えるのです。基本的に、言語モデルの仕組みとそれほど変わらないのです。

でも、画というのは、ピクセルの塊なので、並ぶとわからないので、結果、既成の作品を切り貼りしたのではないかというぐらい、精度の高いAIによる画ができてしまう。アートには、これまで人間によるオリジナリティーや技術、創作活動が強くかかわっていたと思っていたのに、機械がそれを何のことはなく瞬時にやってしまう。

なので、これはもしかして人間が創った画像がコピーされていたり、つぎはぎしているのではないかという疑念が生まれて問題になったりしています。もともと、何で勝手に私の画が学習されているのかといった心情的な問題もあり、クリエイターの方々は複雑な感情を抱えているのです。

君嶋 AIを使って創作している方はどのようにやっているのでしょう?

852話 「プロンプト」という文章で指定をして、ランダムに何百何千と出した画像の中から1枚を選び取る方と、頭の中にある想像した画像を思い通りに出力するために、棒人間(手足を棒のように表現したキャラクター)でポーズをとらせ、それにAIの画像を合わせていく手法を取っている方の2種類がいます。

この2つは創作活動としては別物だと思うのですが、出力される画像は見分けがつきません。どこに創作的活動の部分があるのかは、すごく難しいところだと思います。私はどちらの手法も取りつつ画像を生成しています。

君嶋 852話さんの画集を拝見しましたが、非常に素敵なイラストで、一部は、こういうプロンプトを入れたと紹介された上で画を出されている。「この言葉を入れるとこういう画が出てくるのか」と思い、感心しました。

クリエイターの方は創作活動の中でどういう形でご自分の表現を加えていくのでしょうか。

852話 頭の中にあるイメージをAIに指示する際、画像を指示データとして与える「イメージ・トゥー・イメージ」というやり方もあるのです。つまり、似たような画像を出して指示を与えることができます。それは完成した画でもいいですが、棒人間で、こんなポーズを取ってほしいという指示画像でもいいわけです。

これは、テキスト・トゥー・イメージで、漠然と「太陽があって、ヒマワリがあって、麦わら帽子の女の子がいるのをつくって」と言う指示と、全然違うわけです。

ただこのイメージ・トゥー・イメージには問題があって、画像データであれば何でも指示できてしまうので、例えば他人の著作物でも指示画像として利用できてしまう。そして数値を操作することによってそれとかけ離れた画を出すこともできるし、ほとんどオリジナルと変わらないような画像を出すこともできるわけです。

君嶋 ネット上で、自分のイラストが変えられたAI画像が出ていたなどと炎上して大騒ぎになる事例は、イメージ・トゥー・イメージで作成されているのでしょうか。

852話 大体はその問題だと思われます。

カテゴリ
三田評論のコーナー

本誌を購入する

関連コンテンツ

最新記事