¥6,050  ¥3,300

【機械学習自動化第3弾】短時間で精度の良いモデルを作るコツ!AI×Pythonで学ぶAutoML-特徴量エンジニアリング編-
1.はじめに

公開日

2025年07月23日

総再生時間

1時間24分08秒

セミナー概要

データ分析や機械学習に興味はあるけれど、専門的すぎてハードルが高いと感じていませんか?
そんな皆さんにおすすめするのが「AutoML(自動機械学習)」です。

AutoMLとは機械学習の分析を行う一連の流れを自動化する技術のことです。
一般的に機械学習を使った分析を行う場合、以下のような操作を繰り返す必要があります。

①問題・仮説の定義
②データを予測しやすいように綺麗に加工する(特徴エンジニアリング)
③色々な種類がある機械学習モデルの中から最適なモデルの選定
④精度を高めるためのパラメータ調整(パラメータチューニング)
⑤複数のモデルの性能比較

ひとつひとつの操作を1からPythonで書こうとすると時間がかかってしまうものですが、これらの手順を自動化してコーディングにかける時間を最小限にしようという試みがAutoMLなのです。

第3回となる今回は、作成する機械学習モデルの精度をより高めるための必須スキル「特徴量エンジニアリング」を実践する方法について学んでいきましょう!
様々なAutoMLツールがある中で、今回もPyCaretというライブラリを使ってAutoMLの入門編を学んでいきましょう。これらを使えば、圧倒的に少ないコードで、上記の一連の処理、つまりデータの処理から複数のモデル比較までを行えます。

今回の講義では実際のビジネスの場面でよく見られるデータを使って、特徴量エンジニアリングの流れを体感できます。例えば顧客情報データはよく散見されるのは、何も入力されていない箇所(欠損値)があったり、文字データが入力されていたりと、そのまま機械学習モデル作成には使えないようなデータです。

これらを使ってモデルを作成するには、汚いデータを綺麗にする必要や、あるいはより良い予測精度を出すためにデータの加工を行う必要があります。これを特徴量エンジニアリングと言います。

しかし、これらの処理を手書きでコードを書こうとすると非常に大変で、モデルを作成出来た頃には疲れ果ててしまうことも…。

そこでPyCaretの出番です。PyCaretを使えば、特徴量エンジニアリングを行うことが非常に簡単にできます(と言いますか勝手に行ってくれます!)。コードを各時間をなるべく短くし、それ以外の考えることに時間を使う、そういった機械学習の一連の流れをご紹介していきます。
もちろん、Python、機械学習の専門知識は不要です。

※こちらの動画にはお得なシリーズセット版(第1弾~5弾収録)がございます。
■【機械学習自動化】 Pythonで学ぶAutoML講座(セット版)
岡崎 凌
Okazaki Ryo
<講師略歴>
「大人のための数学教室・統計教室」経営企画室室長
大阪大学基礎工学部修士。
人工知能(AI)の画像認識モデルを構築。
初学者向けの統計学や、機械学習や人工知能を含む高度な分析手法まで幅広く対応。
データ分析の目的やニーズに合わせてExcel、R言語やPython言語を含むプログラミング言語、BIツールなどソフトウェアを活用する講座を開発し、法人向け研修やセミナーを行う。
分析のコンサルティングも行っており、大手アパレルメーカーの売上分析などを手がける。

<<研修・外部提供講座>>
・澤田経営道場 統計学講師
・株式会社オンラインスクール「誰でも簡単!ビジネス統計学講座」
・株式会社TAC「統計検定® 2級 試験対策講座」
・スポーツ系専門学校 データアナリスト講師
・データ分析コンサルティング(製造、アパレル、美容、医療関連企業等)
他、年間約30社にて法人向け研修を実施。

セミナー内容

・特徴量エンジニアリングとは
・欠損値の処理
・ワンホットエンコーディング、ラベルエンコーディング
・特徴量選択
・Python言語による実践(顧客の購買金額予測モデル)

受講対象

・お仕事でデータ分析にかかわる方(マーケティング・人事・販売管理)
・ビジネスにデータサイエンスを導入したい経営者の方
・統計学やデータサイエンスを学びたい方
・機械学習に興味のある方

関連動画