このブログの続きです。
AIESとは
コースの正式名称は、AI, Ethics, and Societyです。
ざっくり、いわゆるAIだったりビッグデータだったりを使うにあたり、倫理的な問題というのは必ずついて回ります。個人情報の取り扱いというのは、その最たる例ですね。現状でどんな対策がなされているのか、どこに問題があるのか、それらについて考える授業です。
コースの詳細は、OMSCSの下記ページで読むことができます!
CS 6603: AI, Ethics, and Society | Online Master of Science in Computer Science (OMSCS) (gatech.edu)
Week3のTODO
Week3は次のようなことをやりました!
- 講義動画のLesson5を視聴
- Homework Project が1題
Lesson5を視聴
「偏見とはなんぞや」という内容でした。
偏見の中でも、AIにおいて発生しうる偏見について語られていました。
AIって、動き出してしまえば、人間の意思を反映せずプログラム通りに動くので、偏見が挟まる余地は一見ないかもしれません。
けれど、最初にアルゴリズムを組むのは人間であることや、AIが学習に使うのは基本的に蓄積されたデータであることから、意図的なものもそうですし、意図しない差別が結果的に生まれることがあるらしいです。
例えば、Googleで「医師」で画像検索をすると、少し前までは男性の画像が出てくることが多かったそう。これからがどうであれ、今まで医師は男性が多かったというのが事実としてあるので、それらのデータを学習したAIは男性の画像をサジェストしてくるんですね。
こういう問題は、たぶん結果として少しずつ現れるものなので、出た問題を都度修正するのは可能でも、最初からすべての問題を洗い出して全部に対策をする、というのはなかなか現実的ではなさそうです。視聴していて、なるほどと思いながら見てました。
Homework Project
今回は、フェイスブック等のSNSについて、広告データを分析してみるという課題でした。
世界的に主流のSNSといえばFacebookですが、わたしはそのアカウントを持っていないので、X/Twitterのアカウントで取り組みました。
具体的にやったことは次の通りです。
- Xのデータのアーカイブダウンロードの申請・ダウンロード
- 広告データをカテゴライズして分析(グラフを作ったり表を作ったり)
- 課題PDFに記載の質問リストに答えて結果を振り返り
この課題をやってて詰まったのは、主に2つでした。
アーカイブの申請からダウンロードまでに時間がかかる
Xでは、アカウントの設定からダウンロードの申請ができます。
申請後、「データの準備には24時間以上かかることがあります。」と表示されていました。
「そんなにかかったりするのか~、大変だな~」と思いながら待っていましたが、ほんとに27時間かかりました!!
わたしが申請をしたのは火曜日だったのでまだ全然耐えてましたが、これを週末に申請してたら、本気で課題が終わらないところでした。危ない危ない。
JDFフォーマットって何ぞや
「レポートをJDF形式で提出すること」って課題PDFにありまして。
PDFみたいな形式ってことかな~~とか思うじゃないですか。ところが調べてもOMSCS関連のサイト以外あまりひっかからない。
結果としては、なんとOMSCS独自のレポート形式でした(たぶん)。
フォントサイズやフォント、余白やタイトルの書き方など細かく決められていて、こいつは大変だ、と。
もう少し調べたところ、Overleafという、tex形式の文書をブラウザ上で作成できるツールがあり、そこにJDFのテンプレがありました。しかもOMSCS生なら、Overleafに学生メールを登録すると最初から上位アカウントを無料で使えます。結局それを使うことにして、無事に解決しました。
Joyner Document Format v2.2 – Overleaf, Online LaTeX Editor
Week3でかかった時間
総計11時間36分でした。
ただ、ここにPythonの環境を調べて作った時間(pyenvとjupyter notebookで作りました)も含むので、課題本体に取り組んだ時間はここから1,2時間ほど縮まりますね。
おわりに
外部ツールや製品を使いそうなときは、なるべく早く動き始めるのが吉ですね。