人口知能について自分の現在の理解・メモ
まだまだ理解が足りていないが、振り回されないための記録。
人工知能とはディープラーニングと同義で、ディープラーニングはニューラルネットワークによっている。
ディープラーニングの基礎であるパーセプトロンは1950年の古いアイディア。
パーセプトロンを多層にする時、バックプロパゲーションという隠れ層を採用。
教師あり機械学習
教師なし機械学習
強化学習
の3つがある。
教師あり機械学習 → 分類器 ニューラルネットワーク、SVM、決定木
SVM(サポートベクターマシン) 線形分類しかできないので、軸をゆがめて線形分類させる
強化学習 「エージェント・環境・行動・報酬」で学習する。Q学習、Actor Critic
遺伝的アルゴリズム 選択(淘汰)・交叉・突然変異
汎化学習 ⇔ 過学習
エピソード記憶 時間と場所に依存した記憶
大脳基底核 報酬の予測を行い、予測との誤差を測定する → Q学習