AIジョブカレ体験記 第7,8回(最終回):ついに来た最終回、果たしてテストに合格したのか?
AIジョブカレは第8回で最終テストがあります。
その結果、合格であれば、運営会社エッジコンサルティングの転職支援サービスを受けられる、という仕組みです。
第7回:教師なし学習(unsupervisd learning)はk-meansがパワフル
教師なし学習は、教師あり学習と違い、「教師データ」を使わない機械学習の手法です。
そのため、未知データに対する予測力をつけるわけではなく、
データの関係性や構造を理解するために用いられます。
人間ではバイアスがかかって読み解けないようなことでも、
教師なし学習で判明することも大いにありえます。
主にやることはクラスタリングと次元圧縮です。
クラスタリングとは、データの特徴量を分析して、その類似性から仲間わけをすることです。
クラスタリングには、データの距離をベースとしたものと、密度をベースとしたものがあります。
データをプロットしてみると、どちらが向いているのかよくわかります。
次元圧縮は、データの分散を僅かな主成分で捉えることで計算を簡単にする手法です。
モデルや処理の方法に寄って、だいぶ結果が変わります。
そのため、どのような癖を各モデルが持っているのか、あるいは、どのような処理を各モデルがしているか、ということを理解していないと、的確なモデル選定をすることができません。
そういう意味でも、モデルの特性とその背景となる数学的概念を抑えておくことは重要です。
線形代数も、解析も大活躍です。
第8回:最終テストと最終課題と深層学習(Deep learning:ディープラーニング)
最終テストは知識と実技
最終テストは知識を問うテストと、実技のテストでした。
持ち込み可、過去のファイル参照し放題です。
内容は特に言及しませんが、とりあえずファイルを開いた瞬間はよかったものの、
後に行くにつれて、、、
いや、これ、授業だけじゃ無理じゃん・・・
という感じでした。
テストに殆どの時間を使ったので、深層学習(ディープラーニング)については簡単に概要を触れるだけ、という感じでした。
とはいえ、前に教師あり学習でパーセプトロンの話が出てきたときに、ディープラーニングで用いられる多層パーセプトロンの原理も教わっていたので、ほとんどその復習といった感じでした。
まとめ:深層学習は流行っているけれど、教師あり学習・教師なし学習で事足りることが多い
人工知能ブームは深層学習(ディープラーニング)によって起こったと言っても過言ではないと思います。
しかし、実務の世界ではディープラーニングを使うよりも、教師あり学習・教師なし学習などの旧来の機械学習の活躍の場が圧倒的に多いそうです。
その理由は、パラメータの説明のしやすさにあります。
ディープラーニングは、その特性上パラメータチューニングが職人芸のようになります。
そのため、うまく行ったことを証明することがなかなかに難しい。
それに対して、教師あり学習・教師なし学習はパラメータチューニングが明確です。
そのため、これから就職しよう、仕事に活用しよう、という場面においては、旧来の機械学習をきちんと使えて、データクレンジングなどの前処理がきちんとできることが重要ということで、全体的にそのような構成になっていました。
また、ライブラリが充実しているぶん、コーディングはさほど難易度が高くありません。
しかし、モデリングをするにあたっては、ライブラリにより呼び出したモデルが、どのような特性を持っているのか、というのを知っている必要があります。
モデルの癖がわからないと、適切なモデルを選定することができないためです。
そのあたりの観念を様々な現場の体験をもとに語ってもらえたと言うのは、
現場の第一線で活躍するデータサイエンティスト・AIエンジニアが講師を努めているAIジョブカレの非常に良いところじゃないかと思います。
もう少し予習に力を入れていれば、もっと授業時間やSlackでの質問を活用できた気もしますが、、、
AIジョブカレの受講生・卒業生のコミュニティがあるので、そこもうまく使いながら学習を深めていければいいかな、という感じです。
結局テストはどうなったのか?
はい。テスト落ちました。
しかしAIジョブカレの試験は一発勝負ではありません。一応、再試験もあります。
再試験と、結局どんなことができるようになったかは、最後の記事でまとめたいと思います。