Senior Databricks Data Engineer
2 weeks ago
Fișă de Post: Senior Databricks Data Engineer / Dezvoltator DWH (Data Warehouse) cu Expertiză Databricks
I. Scopul Postului
Dezvoltarea, implementarea și optimizarea soluțiilor complexe de Data Warehouse (DWH) și Data Lakehouse folosind platforma Databricks (inclusiv Delta Lake, Unity Catalog și Spark) pentru a asigura o fundație de date scalabilă, performantă și guvernată pentru analiză, raportare și Machine Learning.
II. Responsabilități Principale
A. Dezvoltare și Arhitectură Databricks
- Proiectare și Implementare Avansată: Proiectarea și implementarea de pipeline-uri de date ETL/ELT robuste, scalabile și de înaltă performanță utilizând PySpark/Scala și Databricks SQL pe platforma Databricks.
- Delta Lake: Expertiză în implementarea și optimizarea arhitecturii Medallion (Bronze, Silver, Gold) folosind Delta Lake pentru a asigura calitatea, coerența și istoricitatea datelor.
- Lakehouse Platform: Implementarea eficientă a arhitecturii Lakehouse pe Databricks, combinând cele mai bune practici din DWH și Data Lake.
- Optimizarea Performanței: Optimizarea clusterelor Databricks, a operațiunilor Spark și a tabelelor Delta (ex: Z-ordering, Compaction, Tuning Queries) pentru a reduce latența și costurile de calcul.
- Streamare: Proiectarea și implementarea de soluții de procesare a datelor în timp real/cvasireal (streaming) folosind Spark Structured Streaming și Delta Live Tables (DLT).
B. Guvernanță și Securitate
- Unity Catalog: Implementarea și administrarea Unity Catalog pentru guvernanța centralizată a datelor, securitate fină (row/column-level security) și lineage de date.
- Calitatea Datelor (Data Quality): Definirea și implementarea standardelor și a regulilor de calitate a datelor (ex: folosind DLT sau Great Expectations) pentru a menține integritatea datelor.
C. Operațiuni și Colaborare
- Orchestrare: Dezvoltarea și gestionarea fluxurilor de lucru (workflows) complexe folosind Databricks Workflows (Jobs) sau instrumente externe (ex: Azure Data Factory, Airflow) pentru automatizarea pipeline-urilor.
- DevOps/CI/CD: Integrarea pipeline-urilor Databricks în procese de CI/CD folosind instrumente precum Git, Databricks Repos și Bundles.
- Colaborare: Lucrul îndeaproape cu Data Scientists, Analisti și Arhitecți pentru a înțelege cerințele de business și pentru a oferi soluții tehnice optime.
- Mentorat: Oferirea de îndrumare tehnică (mentorship) dezvoltatorilor juniori și promovarea celor mai bune practici.
III. Calificări și Competențe Tehnice
A. Cunoștințe Obligatorii (Nivel Expert)
- Databricks Platform: Experiență demonstrată, de nivel expert, cu întregul ecosistem Databricks (Workspace, Cluster Management, Notebooks, Databricks SQL).
- Apache Spark: Cunoștințe aprofundate ale arhitecturii Spark (RDD, DataFrames, Spark SQL) și a tehnicilor avansate de optimizare.
- Delta Lake: Expertiză în implementarea și administrarea Delta Lake (ACID properties, Time Travel, Merge, Optimize, Vacuum).
- Limbaje de Programare: Python (cu PySpark) și/sau Scala (cu Spark) la nivel avansat/expert.
- SQL: Competențe avansate/expert în SQL și Data Modeling (Dimensional, 3NF, Data Vault).
- Cloud: Experiență solidă cu o platformă Cloud majoră (AWS, Azure sau GCP), în special cu serviciile de stocare (S3, ADLS Gen2, GCS) și rețelistică.
B. Cunoștințe Suplimentare (Avantaj Major)
- Unity Catalog: Experiență practică cu implementarea și administrarea Unity Catalog.
- Lakeflow: Experiență cu Delta Live Tables (DLT) și Databricks Workflows.
- Noțiuni de ML/AI: Înțelegerea conceptelor de bază MLOps și experiență cu MLflow pentru a facilita integrarea cu echipele de Data Science.
- DevOps: Experiență cu Terraform sau echivalent pentru Infrastructure as Code (IaC).
- Certificări: Certificările Databricks (ex: Databricks Certified Data Engineer Professional) reprezintă un avantaj semnificativ.
IV. Educație și Experiență
- Educație: Licență în Informatică, Inginerie, Matematică sau un domeniu tehnic relevant.
- Experiență Profesională: Minimum 5+ ani de experiență în Data Engineering, dintre care cel puțin 3+ ani cu Databricks și Spark la scară largă.
Recomandare pentru Titlu:
Pentru a sublinia nivelul de expertiză, titlurile pot fi:
- Senior Databricks Data Engineer
- Expert DWH Developer (Databricks Focus)
-
Senior Databricks Data Engineer
2 weeks ago
Bucharest, Bucureşti, Romania Inetum Full timeCompany Description OrganizationOur Mission StatementDigital and human resources at the center of the sustainable development of our society.In a world of continuous transformation, accelerated by technological developments and societal challenges, it is necessary to adapt in an ongoing, agile way to meet the challenges of the future.About InetumInetum is a...
-
Senior Databricks Data Engineer
2 weeks ago
Bucharest, Bucureşti, Romania Raiffeisen Bank Romania Full timeI. Scopul PostuluiDezvoltarea, implementarea și optimizarea soluțiilor complexe de Data Warehouse (DWH) și Data Lakehouse folosind platformaDatabricks(inclusiv Delta Lake, Unity Catalog și Spark) pentru a asigura o fundație de date scalabilă, performantă și guvernată pentru analiză, raportare și Machine Learning.II. Responsabilități...
-
Senior Databricks Engineer
2 weeks ago
Bucharest, Bucureşti, Romania Reconomy Full timeReconomy is an international circular economy specialist that combines technology, skills and incredible people to enable businesses to better manage their resources, helping reduce waste, optimise their supply chains, and contribute in a meaningful way toward the circular economy.Reconomy is bending the edges of linear business models across the world,...
-
Data Engineer
3 days ago
Bucharest, Bucureşti, Romania Shape Your Future with Us Full timeEngagement: Freelance / Contract 6 months/ SRL or PFALocation: Remote (RO)Role Overview We are looking for a highly skilled and versatile Senior Data Engineer with strong expertise in building scalable, cloud-based data solutions. The ideal candidate has significant hands-on experience with Databricks, Azure Synapse, Microsoft Fabric, and Power BI, as well...
-
Data Engineer
3 days ago
Bucharest, Bucureşti, Romania Shape Your Future with Us Full timeJob Description: Engagement: Freelance / Contract 6 months/ SRL or PFALocation: Remote (RO)Role OverviewWe are looking for a highly skilled and versatile Senior Data Engineer with strong expertise in building scalable, cloud-based data solutions. The ideal candidate has significant hands-on experience with Databricks, Azure Synapse, Microsoft Fabric, and...
-
Databricks Platform Administrator
2 weeks ago
Bucharest, Bucureşti, Romania Veeam Software Full timeVeeam, the #1 global market leader in data resilience, believes businesses should control all their data whenever and wherever they need it. Veeam provides data resilience through data backup, data recovery, data portability, data security, and data intelligence. Based in Seattle, Veeam protects over 550,000 customers worldwide who trust Veeam to keep...
-
Senior Data Engineer
2 weeks ago
Bucharest, Bucureşti, Romania The Brief Full timeAbout The BriefThe Brief is the AI agency for modern marketers, our platform powers the entire campaign lifecycle, helping teams create on-brand assets, launch across channels, analyze performance and apply learnings to start again, smarter. Trusted by leading global brands, The Brief removes friction and transforms how marketers move from insight to...
-
Data Engineer
2 weeks ago
Bucharest, Bucureşti, Romania NTT DATA Europe & Latam Full timeWho We AreOur client is a leading payment system company specializing in designing and building real-time, account-based payment infrastructures, applications, and services. They are committed to innovation and excellence, constantly driving the evolution of payment solutions in a dynamic and growing industry.We are seeking a highly skilled Data Engineer to...
-
Data Engineer
2 weeks ago
Bucharest, Bucureşti, Romania PureQuad Full timeOur client is concerned with excessive charging attributed to the Databricks Lakehouse environment. Client would now like to implement some of the recommendations. These will be delivered in two workstreams:Databricks Environment Changes - changes which can be made to Databricks environment setup including data deletion and control of instances Pipeline...
-
Senior Data Engineer
2 weeks ago
Bucharest, Bucureşti, Romania Evolve today Full timeFor our business partner, a global leader in sustainable wood processing with operations across 80 markets and seven production facilities in Europe, we are seeking a Senior Data Engineer. The company is committed to developing high-tech products from renewable wood sources and drives innovation through close collaboration with scientists and industry...