dataprof
Profilazione Arrow-nativa in Rust con interfacce CLI e Python, pensata per flussi di data quality a memoria limitata.
Andrea Bozzo
Strumenti open-source, esperimenti lakehouse e note di ingegneria dai punti in cui pipeline, storage e tooling per sviluppatori si incontrano.
Prove selezionate
Parti da qui se vuoi il segnale più chiaro: uno strumento costruito, una traccia di contribuzione upstream e un archivio di scrittura.
Profilazione Arrow-nativa in Rust con interfacce CLI e Python, pensata per flussi di data quality a memoria limitata.
PR pubbliche su Arrow, DataFusion, Iceberg Rust e Fluss Rust, riconducibili a vincoli reali downstream.
Articoli lunghi su piattaforme dati, sistemi Rust/Python, trade-off lakehouse e note di progetti open-source.
Vista di sistema
La superficie pubblica è intenzionalmente costruita a mano, ma il repository dietro è un vero sistema di delivery: homepage statica, archivio Hugo, pagine work generate, workbench Rust/WASM, harvester Go e una companion API su Vercel.
La landing page è HTML, CSS e JavaScript puri: la superficie pubblica resta leggera ed esplicita.
Hugo gestisce l'archivio scritto, mentre la logica del workbench vive sia in JavaScript sia in Rust compilato a WebAssembly.
Generatori Go trasformano JSON strutturato e dati del repository in pagine case study, card di contribuzione e artefatti statici.
GitHub Pages serve il sito statico, e Vercel porta solo le statistiche GitHub live e gli endpoint badge.
Workbench
Un solo input per case study, post del blog, lavoro open-source, paper recensiti e i fili tecnici che li collegano.
Open Source
Alcuni progetti a cui ho mandato patch. La lista è estratta dal README del repository.
Recensioni & Paper
Materiale pubblico per due submission IEEE, con benchmark, demo e asset companion riproducibili.
Contatti
Per consulenze freelance su infrastruttura dati, contesto recruiting o follow-up tecnico, l'email è il primo passo più pulito.