dnet-hadoop/dhp-workflows/dhp-enrichment/src/main/java/eu/dnetlib/dhp/resulttoorganizationfromsemrel/SparkResultToOrganizationFr...

30 lines
1.2 KiB
Java

package eu.dnetlib.dhp.resulttoorganizationfromsemrel;
public class SparkResultToOrganizationFromSemRel {
//per ogni figlio nel file delle organizzazioni
//devo fare una roba iterativa che legge info da un file e le cambia via via
//passo 1: creo l'informazione iniale: organizzazioni che non hanno figli con almeno un padre
//ogni organizzazione punta alla lista di padri
//eseguo la propagazione dall'organizzazione figlio all'organizzazione padre
//ricerco nel dataset delle relazioni se l'organizzazione a cui ho propagato ha, a sua volta, dei padri
//e propago anche a quelli e cosi' via fino a che arrivo ad organizzazione senza padre
//organizationFile:
//f => {p1, p2, ..., pn}
//resultFile
//o => {r1, r2, ... rm}
//supponiamo che f => {r1, r2} e che nessuno dei padri abbia gia' l'associazione con questi result
//quindi
//p1 => {r1, r2}
//p2 => {r1, r2}
//pn => {r1, r2}
//mi serve un file con tutta la gerarchia per organizzazioni
//un file con le organizzazioni foglia da joinare con l'altro file
//un file con le associazioni organizzazione -> result forse meglio result -> organization
}