📄️ 機械学習入門
このドキュメントでは、Kaggleのタイタニック問題に挑戦する前に、機械学習の基本的な概念について学びます。
📄️ 機械学習の主な種類
機械学習は、その学習方法によって大きく3つの種類に分類されます。それぞれの特徴と代表的な使いみちを見ていきましょう。
📄️ 教師あり学習の基本的な流れ
タイタニックのような典型的な機械学習プロジェクトは、いくつかの決まったステップに沿って進められます。ここでは、教師あり学習の基本的な流れを追いながら、それぞれのステップで何を行うのかを理解しましょう。
📄️ 環境構築とデータ準備 (Google Colab)
機械学習プロジェクトを始めるにあたり、最初のステップは環境構築です。ここでは、面倒なインストール作業が不要で、ブラウザさえあればすぐにPythonと機械学習ライブラリを使えるGoogle Colaboratory (Colab) を利用します。
📄️ データ分析ライブラリPandas入門 (演習付き)
Pandasは、Pythonでデータを扱うための強力なライブラリです。Excelの表計算のように、データを自由自在に読み込み、確認し、加工できます。このページでは、タイタニックのデータを使いながら、Pandasの基本的な操作を学びましょう。
📄️ データ可視化入門 (Matplotlib & Seaborn)
データ分析において、数値の羅列だけでは気づきにくいパターンや傾向を直感的に理解するために、データの可視化は不可欠なスキルです。ここでは、Pythonで最も代表的な可視化ライブラリであるMatplotlibと、そのラッパーであり、より美しいグラフを簡単に描画できるSeabornの使い方を学びます。
📄️ Scikit-learnで機械学習モデル構築 (実践)
いよいよ、これまでの知識を総動員して、機械学習モデルを構築します。Pythonで機械学習を行う際の標準的なライブラリであるScikit-learn (サイキット・ラーン) を使って、タイタニック号の乗客の生存を予測するモデルを作成しましょう。