spark-streaming

Here are 1,039 public repositories matching this topic...

risingwavelabs / risingwave

SQL stream processing, analytics, and management. We decouple storage and compute to offer efficient joins, instant failover, dynamic scaling, speedy bootstrapping, and concurrent query serving.

Updated Jul 26, 2024
Rust

nandoabreu / spark-log-analyser

Star

Spark log analyser, merging Apache with Application logs to analyse users' request to Apache and response from App

application dashboard apache python3 spark-streaming kafka-streams python-dashboard

Updated Jul 25, 2024
Python

cdapio / cdap

Star

An open source framework for building data analytic applications.

python java platform middleware spark integration dataset spark-streaming java-8 unified mapreduce cdap

Updated Jul 26, 2024
Java

DebanjanSarkar / pyspark-maestro

Star

This repo contains implementations of PySpark for real-world use cases for batch data processing, streaming data processing sourced from Kafka, sockets, etc., spark optimizations, business specific bigdata processing scenario solutions, and machine learning use cases.

json kafka spark python3 pyspark spark-streaming kafka-streams spark-sql spark-mllib kafka-python pyspark-mllib pyspark-api pyspark-streaming pyspark-machine-learning

Updated Jul 24, 2024
Jupyter Notebook

LuisFalva / ophelia

Star

Ophelian On Mars! More than a simple framework.

spark spark-streaming dask dataframe rdd spark-mllib spark-ml ophelia ophelia-spark

Updated Jul 23, 2024
Python

AlexRogalskiy / spark-patterns

Star

🏆 Spark4You Design patterns

patterns spark ebook spark-streaming spark-sql spark-structured-streaming patterns-design

Updated Jul 22, 2024
Shell

Sowrabhm1931 / Data_Processing_using_Spark_Flink

Star

This project demonstrates data cleaning, processing with Apache Spark and Apache Flink, both locally and on AWS EMR.

aws spark aws-s3 aws-emr spark-streaming flink flink-stream-processing emr-cluster spark-flink

Updated Jul 20, 2024
Python

neema233 / Kafka-Spark

Star

kafka postgresql spark-streaming hdfs kafka-cluster

Updated Jul 20, 2024
Java

Shankar-Anumula / data-engineer

Star

java scala spark spark-streaming spark-sql

Updated Jul 18, 2024
Scala

polaternez / Big-Data-Applications

Star

Big Data Applications from different fields

elasticsearch kafka spark spring-boot mongodb spark-streaming

Updated Jul 17, 2024
Jupyter Notebook

adnanrahin / Spark-Flights-Data-Analysis

Star

The U.S. Department of Transportation's (DOT) Bureau of Transportation Statistics tracks the on-time performance of domestic flights operated by large air carriers. Summary information on the number of on-time, delayed, canceled, and diverted flights is published in DOT's monthly Air Travel Consumer Report and in this dataset of 2015 flight dela…

java docker spark apache-spark maven docker-compose docker-container spark-streaming spark-sql big-data-analytics

Updated Jul 17, 2024
Scala

kalyani33 / food-delivery-real-time-data-analysis

Star

emr airflow spark-streaming kinesis-stream

Updated Jul 16, 2024
Python

kagenihisomi / spark-and-all-things-streaming

Star

Spark and all things Streaming

streaming kafka spark spark-streaming questdb

Updated Jul 16, 2024
Jupyter Notebook

databrickslabs / dbldatagen

Star

Generate relevant synthetic data quickly for your projects. The Databricks Labs synthetic data generator (aka `dbldatagen`) may be used to generate large simulated / synthetic data sets for test, POCs, and other uses in Databricks environments including in Delta Live Tables pipelines

python spark faker pyspark spark-streaming data-generation databricks synthetic-data datagen datagenerator deltalake datageneration delta-live-tables

Updated Jul 26, 2024
Python

polaternez / Introduction-to-Big-Data

Star

Big Data projects for beginners

java elasticsearch kafka mongodb zookeeper spark-streaming spark-sql spark-mllib spark-core

Updated Jul 15, 2024
Java

tuancamtbtx / etl-spark-k8s

Star

ETL With Apache Spark Deployed on K8s

spark apache spark-streaming k8s spark-sql

Updated Jul 13, 2024
TypeScript

dell-datascience / Data_Engineering

Star

This repository is dedicated to my participation in Datatalks Mlzoomcamp

data streaming spark gcp spark-streaming dbt batch-processing datawarehouse prefect dataanalytics gbq datalakes

Updated Jul 22, 2024
Jupyter Notebook

appuv / KafkaTemperatureAnalyticsSpark

Star

Explore real-time temperature data analysis using Apache Spark Streaming. This repository provides a sample solution for processing streaming data, performing analytics, and visualizing insights from temperature sensor data.

kafka spark spark-streaming

Updated Jul 13, 2024
Java

dotnet / spark

Star

.NET for Apache® Spark™ makes Apache Spark™ easily accessible to .NET developers.

Updated Jul 12, 2024
C#

antonioscardace / Systems-Monitor-By-Keylogger

Star

Real-Time Monitor Panel for Systems Infected by a Keylogger.

docker nginx real-time spring-boot docker-compose grafana spark-streaming keylogger zuul-api-gateway panel-control

Updated Jul 8, 2024
Java

Improve this page

Add a description, image, and links to the spark-streaming topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the spark-streaming topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

spark-streaming

Here are 1,039 public repositories matching this topic...

risingwavelabs / risingwave

nandoabreu / spark-log-analyser

cdapio / cdap

DebanjanSarkar / pyspark-maestro

LuisFalva / ophelia

AlexRogalskiy / spark-patterns

Sowrabhm1931 / Data_Processing_using_Spark_Flink

neema233 / Kafka-Spark

Shankar-Anumula / data-engineer

polaternez / Big-Data-Applications

adnanrahin / Spark-Flights-Data-Analysis

kalyani33 / food-delivery-real-time-data-analysis

kagenihisomi / spark-and-all-things-streaming

databrickslabs / dbldatagen

polaternez / Introduction-to-Big-Data

tuancamtbtx / etl-spark-k8s

dell-datascience / Data_Engineering

appuv / KafkaTemperatureAnalyticsSpark

dotnet / spark

antonioscardace / Systems-Monitor-By-Keylogger

Improve this page

Add this topic to your repo