フィーチャエンジニアリングとは、機械学習モデルのトレーニング準備のため、データセットのプロパティを選択し、変換するプロセスです。そして、機械学習システムの成功において不可欠な要素です。多くの場合、この作業は、やっかいでボイラープレートなコードを書く必要があったり、特定の処理システムに強く依存してしまいがちです。Spotify では、この時間のかかる作業を簡素化し、共通 API 配下で複数の処理フレームワークをサポートし、Scala な強力な機能と型安全を活用した Featran を開発しました。本トークでは、Spotify でのビッグデータや機械学習の概要、Featran の設計と実装について紹介します。
票中 票投票済み