banner

ブログ

Feb 04, 2024

機械学習における回帰とは何ですか?

KOHb - Getty Images

回帰手法は、データ内の関係を明らかにし、販売予測からリスク分析に至るまで、幅広い企業ユースケースの予測モデルを構築するために不可欠です。 ここでは、この強力な機械学習技術について詳しく説明します。

機械学習における回帰は、結果を予測することを主な目的として、独立変数と従属変数の間の関係を把握するために使用される手法です。 これには、各データ ポイントの分布を特徴付けるパターンを明らかにする一連のアルゴリズムのトレーニングが含まれます。 パターンが識別されると、モデルは新しいデータ ポイントまたは入力値を正確に予測できるようになります。

回帰にはさまざまな種類があります。 最も一般的な 2 つは、線形回帰とロジスティック回帰です。 線形回帰では、すべてのデータ ポイントを明確な線に沿って当てはめることが目標です。 ロジスティック回帰は、各データ ポイントが線より下にあるのか上にあるのかを判断することに焦点を当てています。 これは、観察結果を詐欺/詐欺ではない、スパム/スパムではない、または猫/猫ではないなどの個別のバケットに分類するのに役立ちます。

回帰は、ほとんどの統計における基本的な概念です。 TCS Researchの上級科学者であり、IITボンベイの客員准教授であるHarshad Khadilkar氏は、機械学習は、アルゴリズムを使用して自動プロセスを通じてこれらの基本的な関係を抽出することで、物事をさらにレベルアップすると述べています。

「回帰は、科学者や企業が定量的な質問、具体的には『いくつ』、『どのくらい』、『いつになるか』などの質問に答えるときに使用するものです。機械学習では、現在システムで利用できない測定値を発見します。データです」とカディルカル氏は説明した。

機械学習の回帰で使用される 2 つの一般的な手法は、内挿と外挿です。 内挿の目的は、利用可能なデータ ポイント内の値を推定することです。 外挿の目的は、既存の回帰関係に基づいて、既存のデータの範囲を超える値を予測することです。

世界的なコンサルティング会社SSA & Companyの応用ソリューション担当バイスプレジデント、ニック・クレイマー氏は、回帰は予測分析の基本的な手法であるため、機械学習の専門家だけでなく、すべてのビジネスリーダーにとっても不可欠な概念であると述べた。 回帰はさまざまなタイプの予測によく使用されます。 回帰手法は変数間の関係の性質を明らかにすることで、企業に顧客離れや価格弾力性などの重要な問題に対する洞察を与えます。

世界的な資産運用会社である Legal & General のデータ サイエンス責任者、David Stewart 氏は、回帰モデルは私たちがすでに知っている情報に基づいて予測を行うために使用されており、さまざまな業界に幅広く関連していると述べました。 たとえば、数値結果を予測する線形回帰を使用して、年齢や性別などの要因に基づいて人の身長を測定することができます。 対照的に、ロジスティック回帰は、過去の製品購入を指標として使用することで、その人が新製品を購入する可能性を予測するのに役立ちます。

線形回帰は、株価、明日の天気、小売需要の予測など、依存する変数に対して固定または一定の感度を持ちます。 たとえば、1 つの変数が 2 倍変化すると、出力に特定の偏差が生じるとカディルカー氏は述べました。 業界標準のアルゴリズムの多くは、時系列需要予測などの線形回帰を使用します。

対照的に、ロジスティック回帰は、イベントの確率を 0 ~ 1、または 0% ~ 100% のスケールで測定することに焦点を当てます。 このアプローチの中心的な考え方は、イベント発生の確率を示す S 字曲線を作成することです。システム障害やセキュリティ侵害などのイベントは、曲線の一方の側では非常にありそうもないことですが、その近くでは起こりそうもありません。一方では確かに。

前述したように、線形回帰手法は、新しいデータ ポイントを直線に当てはめることに焦点を当てています。 これらは予測分析にとって価値があります。

対照的に、ロジスティック回帰は、新しいデータ ポイントが線の上または下に属する、つまり特定のクラスに属する確率を決定することを目的としています。 ロジスティック回帰手法は、トランザクションが不正であるか、電子メールがスパムであるか、または画像が猫であるかどうかを判断する、上記のような分類タスクに役立ちます。

共有