myweekend_work

Reference's

Weekend work

Create a EMR Cluster (should be 6.10)
Connect to SSH
Check Table Format all required Jars
Understand Iceberg Files
Understand Hudi Files
Understand Delta Lake Files
Create a MYSQL DB (create Retail_DB)
Copy MYSQL DB to S3 as Parquet Files
Source as : S3 Parquet

Flow Like below

MYSQL ---> (Spark Read as Files) ---> Write as S3 Files
S3 Read Files ---> Write as Hudi FS
S3 Read Files ---> Write to Iceberg
S3 Read Files ----> Write to HUDI

Clean process

Terminate EMR Cluster
Terminate EMR S3 Logs

Next Steps

Create FastAPi Microservice ---> Configure Read as JDBC MYSQL Table ---> Write to S3 ---> Write to S3 Different Table Format FS

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
delta_lake_fs		delta_lake_fs
week2		week2
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

myweekend_work

Reference's

Weekend work

Flow Like below

Clean process

Next Steps

Do some experments on Livy Server on EMR

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

myweekend_work

Reference's

Weekend work

Flow Like below

Clean process

Next Steps

Do some experments on Livy Server on EMR

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages