Archivi tag: spark

Tesi Magistrale: Soluzioni distribuite per l’analisi di dati biomedici in ambiente Virtual Data Center

Aprile 4, 2017(Digital) life, Programmingcloud, garr, hadoop, iaas, iperconvergenza, server convergenti, sparklgwebproject

Ultimo aggiornamento: 04-06-2017

Sono stato un pò fermo con il blog a causa del mio lavoro di tesi magistrale: benchmark di applicazioni distribuite biomediche su un cluster privato del GARR. In sostanza avevo due applicazioni per l’estrazione dei k-mer, una Hadoop e l’altra Spark e ne ho testato le performance su di un cluster composto da server con tecnologia convergente.

Soluzioni distribuite per l’analisi di dati biomedici in ambiente Virtual Data Center from Giuseppe Luciano

Approfondimenti:

Best practice KVM – I/O schedulers
Lezioni di Cloud
BlueData: Data Locality is Irrelevant for Hadoop (2015) vs Hyperconverged Arch (dove la data locality è il re)

Kryo and FastUtil wrapper

Dicembre 16, 2016ProgrammingfastUtil, inheritance, java, kryo, serialization, serializer, spark, wrapperlgwebproject

While I was working with Apache Spark, I had a problem to write a FastUtil wrapper with Kryo Serializer. So I passed a day to working on it and I found a solution.
This is an example code that uses a Int2LongOpenHashMap wrapper that has public long counter attribute.

WrappedInt2LongOpenHashMap p = new WrappedInt2LongOpenHashMap();
p.addTo(220, 20);
p.addTo(30, 5);
p.addTo(30, 15);
p.addTo(220, 5);
p.counter = 10;
p.inputName="prova";

System.out.println(p.counter);
System.out.println("---------");

The Java default serializer works fine, it serializes HashMap and the counter attribute. Continue reading Kryo and FastUtil wrapper →

Apri un sito e guadagna con Altervista - Disclaimer - Segnala abuso - Privacy Policy - Personalizza tracciamento pubblicitario