「著作物が自由に使える場合」と機械学習

久々の記事です。

日頃ソフトウェアに関する案件にかかわることが多いので、著作物に関して調べる際どうしてもプログラムの著作物の話に中心になってしまいますが、何かと話題の機械学習に影響する著作権の話がありました。

 

最近、文科省のサイトに著作権法の一部を改正する法律案が掲載され、その中に”デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定の整備”がありました。それでは現状著作権はどうなっているのか今更ながら調べてみると、既に情報解析のための複製等(47条7)があり、

 コンピュータ等を用いて情報解析を行うことを目的とする場合には,必要と認められる限度において記録媒体に著作物を複製・翻案することができる(*1)

となっていました。これなら自然言語処理の学習データなどに青空文庫のデータだけでなく著作権がまだ切れていない小説や記事も使えるはずと思いましたが、どうやら本当にそうらしく、コラム:機械学習パラダイス で大学の先生が”この規定が、今になって(思いもよらず)AIの発展に欠かせない機械学習に活用できそう”とブログで書かれています。しかも日本では営利目的でも構わないようです。

 

関連記事:「日本は機械学習パラダイス」 その理由は著作権法にあり - ITmedia NEWS

 

*1:著作物が自由に使える場合 | 文化庁