How to Perform Distributed Spark Streaming With PySpark

I am excited to share my experience with Spark Streaming, a tool which I am playing with on my own. Before we get started, let’s have a sneak peak at the code that lets you watch some data stream through a sample application.

from operator import add, sub
from time import sleep
from pyspark import SparkContext
from pyspark.streaming import StreamingContext # Set up the Spark context and the streaming context
sc = SparkContext(appName="PysparkNotebook")
ssc = StreamingContext(sc, 1) # Input data
rddQueue = []
for i in range(5): rddQueue += [ssc.sparkContext.parallelize([i, i+1])] inputStream = ssc.queueStream(rddQueue) inputStream.map(lambda x: "Input: " + str(x)).pprint()
inputStream.reduce(add) .map(lambda x: "Output: " + str(x)) .pprint() ssc.start()
sleep(5)
ssc.stop(stopSparkContext=True, stopGraceFully=True)

Spark Streaming has a different view of data than Spark. In non-streaming Spark, all data is put into a Resilient Distributed Dataset, or RDD. That isn’t good enough for streaming. In Spark Streaming, the main noun is DStream — Discretized Stream. Thats basically the sequence of RDDs. The verbs are pretty much the same thing — the way we have actions and transformations with RDDs, we also have actions and transformations with DStreams.

Source de l’article sur DZONE

L’assistance proposée par ANKAA PMO

ANKAA PMO présent depuis plus de 20 ans sur le marché des services IT, accompagne les DSI dans leur recherche de compétences pour des besoins de renforts en mode régie ou l’externalisation de projets.
Vous souhaitez plus d’information ? Cliquez ici

0 réponses

Laisser un commentaire

Participez-vous à la discussion?
N'hésitez pas à contribuer!

Laisser un commentaire

Notre différence : Redonner du sens à la performance

– En centrant les compétences des managers d’activité internes Ankaa PMO®, chargés de votre suivi dès les premiers contacts commerciaux, sur l’organisation, le pilotage et le suivi Qualité de vos projets.
– En restant objectifs dans le conseil car détachés de tout partenariat constructeur et/ou éditeur.
– En sollicitant de façon flexible et dynamique notre équipe d’experts métiers, fonctionnels ou techniques constituée exclusivement de consultants externes accrédités, gage de vous fournir le meilleur niveau d’expertise sur les projets.
– En apportant une organisation éprouvée sur des projets stratégiques de PME-PMI ou les attentes des grands comptes

Notre organisation est ainsi totalement établie sur l’écoute de vos besoins et l’élaboration de réponse les plus adaptées à vos challenges pour vous permettre d’apporter une réelle valeur ajoutée à vos processus et projets d’entreprise.

L’assistance proposée par ANKAA PMO

Vous aimerez peut-être aussi

Laisser un commentaire

Laisser un commentaire