DLLAB DAY 2018(カンファレンス)に参加してきました。①

DLLAB DAYとは


DLLABとはDEEP LEARNING LABの略でディープラニングに関する開発事例や最新技術動向の情報発信を行うコミュニティです。
PreferdNetworks社(Chainer開発した会社)、日本マイクロソフト、キカガク(DLL関係を扱うアカデミー)などの企業が参加し、日本ディープラーニング協会(JDLA)もオフィシャルでサポートしています。
勉強会やカンファレンスなどのイベントを行っており、connpassなどを使用して参加が可能です。
DeepLearningやAIに興味があるなら、注目しておきたい団体です。

参考URL:https://dllab.connpass.com/

そのDLLABの一周年イベント、それがDDLAB DAY 2018〜深層学習を使いこなす日〜です。
このイベントはカンファレンスとハッカソンの2種類あり、開催時間は10時〜18:30という大ボリュームなものでした。

ハッカソンでは主催者が用意した課題に対してDeepLearningで学習モデルを構築し、その精度を争うものでした。
課題は著者判別(自然言語処理)と、ポテトチップスの味と袋の大きさを分類する問題で、後者はChainerを使用していたようです。
ちょっとやってみたかったですね。

カンファレンスは15社が開発事例・技術情報などを講演するというものでした。
15社もありますが、40分刻みで3Track*5回という構成となっており、5社分しか見れないのですよね。
見たいのがたくさんあって色々悩みましたね。

参考URL:http://dllab.ai/dllab-day-2018/

ハッカソンも魅力的でしたが、実案件の話や最新の技術情報を知りたい気持ちが強く、カンファレンスにしました。
参加したTrackは以下通りです。

  • ユーザとベンダ双方にとって幸せなAI開発のための3つのポイント 柿沼 太一 氏(弁護士法人STORIA)
  • AIを活用した架空送電線画像診断システムの開発について 東京電力パワーグリッド株式会社/テクノスデータサイエンス・エンジニアリング株式会社
  • マイクロソフトが考えるAI活用のロードマップ 日本マイクロソフト株式会社
  • 人工知能が変える医療の現状と未来
  • 研究を加速するChainerファミリー 株式会社Preferred Networks

今回は私が参加したTrackについて紹介していこうと思います。

ユーザとベンダ双方にとって幸せなAI開発のための3つのポイント


登壇者の柿沼 太一 氏はAI、IT、知的財産、ベンチャーなどを中心に扱う弁護士で、
AI関係では自動車・医療・工場・Web系などの企業から相談を受けているとのこと。

参考URL:http://www.meti.go.jp/press/2018/06/20180615001/20180615001.html

AI開発と通常のシステム開発では色々違いがあり、ユーザーとAIベンダ側の双方が特性の違いを理解することが重要です。
2018年3月に経済産業省
「AI・データ契約ガイドライン」を策定したのでこちらを活用するのが有用なようです。
こちらのガイドラインは以下のようなものとなっているので顧客との契約時のやりとりで色々参考になりそうです。


経済産業省は、民間事業者等が、データの利用等に関する契約やAI技術を利用するソフトウェアの開発・利用に関する契約を締結する際の参考として、契約上の主な課題や論点、契約条項例、条項作成時の考慮要素等を整理した「AI・データの利用に関する契約ガイドライン」を作成し、あわせて、本ガイドライン(案)に対する意見募集の結果を取りまとめました。

参考URL:「AI・データの利用に関する契約ガイドライン」より
http://www.meti.go.jp/press/2018/06/20180615001/20180615001.html

開発プロセス・契約の分割は探索型段階型開発方式で進めるのがおススメで、いきなり開発の契約に入らず、いくつか段階を踏んで契約するのがよいそうです。


1.アセスメント
 → 一定量の教師データを顧客からもらい学習済みモデルの生成が可能か検証
2.PoC
 → 少量のデータで学習させ、精度が出るか検証
 → ここがうまくいってから開発の契約に入る
3.開発
 → 実際に開発&学習 
4.追加学習
 
DeepLearning等の機械学習はどれぐらいの精度が出るかは学習させてみないとわからないため、
PoCの段階で実現可能か検証してから本開発の契約に入らないと危ないってことですね。

それと機械学習の開発では通常のシステム開発と異なり、
複数の材料・中間成果物など、最終成果物以外に色々なものができますが、
それの利権(知財・法務)が誰にあるかを契約時に明確にした方がよいとのことです。
具体的には以下のようなものがあります。

・学習の生データ(集めた学習用データ)
・学習データセット機械学習させるために加工したデータ)
・学習済みモデル
・学習済みパラメータ
・学習プログラム
・開発時のノウハウ

これらのデータは開発側も顧客側も所有しておきたいと思うものです。
なぜなら別案件でも流用できるから。

学習データは類似した案件で役に立ちますし、データセット自体を販売することもできます。
また、学習済みモデル+パラメータをファインチューニングして、類似問題に流用することもできるなど、色々便利です。

これの利権で問題にならないように、知財権のルールをあらかじめ知っておくことは非常に有効です。
なぜならAI関する成果物に知財権のないものがあり、そういったものにはルールがないので契約に記載がなければ権利が
どこになるのかあいまいになってしまうためです。

ただ、結局開発側も顧客もほしがってしまうので、権利帰属ではなく、利用条件で実をとるのがベターらしいです。
つまり、第三者提供ルールを定めて、何の制限もなく利用できる、そんな契約にすればWinWinになることが多いようです。

そのほか、以下のような問題が起こりやすいとのことです。

1.開発時の問題
 納期遅延は開発側の責任

2.納品してるときに問題
 納品後、誤判定したなど。
 しかし、AIの場合、原因が不明なことが多く、開発側も結果が予見できない
 そのため、責任はベンダにはない…とできる…はず

3、知財を侵害してしまった
 開発側は一切保証しない
 著作権侵害のみ保証 
 知的財産権の比侵害を保証する
 すべての特許を侵害していないから調べるのは難しい


といったように、AIの開発は通常のシステム開発とは違うので
契約で色々縛る必要がある、とのことです。