ローカル実行からお手軽に始めるSpark Structured Streaming

Sparkは「並列分散処理のフレームワーク」ですが、その題目で、興味はあるものの、使うには敷居が高いと思っている方はいないでしょうか。ですが、言ってしまうとSparkはローカルマシンでの実行から、大規模クラスタでの実行まで両方のモードで実行できるデータ処理のツールです。同時に、Scala製OSSであるため、Scalaユーザであれば特に利用に障壁を感じることはありません。そのため、ローカルマシンでのお手軽な実行からScalaでデータ処理を構築することが出来ますし、文字列や数値型などの構造化されたデータの処理からストリーム処理まで扱うこともできます。本セッションでは、ストリーム処理を構造化データとして簡易に記述可能なSparkの新機能Spark Structured Streamingを用いて、お手軽にストリーム処理を構築する方法を実例を交えて説明します。

トークの長さ: 40分
発表言語: 日本語
聴衆の対象: 初心者: 分野の事前知識を必要としない
こんな人におすすめ: Sparkに興味があり、入門してみたい人
Sparkの実際の使いどころを知りたい人
ストリームデータ処理をお手軽に構築してみたい人
発表者: 木村宗太郎(kimutansk) (株式会社ドワンゴ)

応募一覧