科目A問16
教師あり学習において,正解となる情報を付与する作業を表す用語として,最も適切なものはどれか。
| アノテーション | |
| エンコード | |
| データクレンジング | |
| フィルタリング |
『情報処理過去問.com』からiPhoneアプリがリリースされました!!
正解
- ア
解説
教師あり学習では、学習用データに正解情報であるラベルを付ける工程が不可欠です。これをアノテーションと呼びます。例えば、画像に「猫」、文章に「好意的」といったラベルを与え、モデルがそのラベルを手掛かりに識別を学習できるようにします。
| ア. | アノテーション |
| アノテーションは、対象データに正解となる情報(ラベル)を付与する作業を指します。モデルは付与されたラベルを基に識別を学ぶため、特に教師あり学習で欠かせない工程です。 | |
| イ. | エンコード |
| エンコードは、一定の規則に従ってデータを別の形式へ変換することです。例として、映像の圧縮、文字列のURL用変換、データの暗号化などが該当します。 | |
| ウ. | データクレンジング |
| データクレンジングは、誤りや欠損、不整合、重複、表記ゆれといった問題を修正・除去する作業です。分析や機械学習の前処理として重要で、データ品質を高めることで結果の信頼性向上に寄与します。 | |
| エ. | フィルタリング |
| フィルタリングは、条件に基づいてデータを抽出・除外する処理です。機械学習では、データセット作成時に外れ値やノイズ、欠損、目的と関係の薄いデータを取り除く用途で用いられます。 |