30 lines
1.2 KiB
Java
30 lines
1.2 KiB
Java
package eu.dnetlib.dhp.resulttoorganizationfromsemrel;
|
|
|
|
public class SparkResultToOrganizationFromSemRel {
|
|
|
|
//per ogni figlio nel file delle organizzazioni
|
|
//devo fare una roba iterativa che legge info da un file e le cambia via via
|
|
//passo 1: creo l'informazione iniale: organizzazioni che non hanno figli con almeno un padre
|
|
//ogni organizzazione punta alla lista di padri
|
|
//eseguo la propagazione dall'organizzazione figlio all'organizzazione padre
|
|
//ricerco nel dataset delle relazioni se l'organizzazione a cui ho propagato ha, a sua volta, dei padri
|
|
//e propago anche a quelli e cosi' via fino a che arrivo ad organizzazione senza padre
|
|
|
|
//organizationFile:
|
|
//f => {p1, p2, ..., pn}
|
|
//resultFile
|
|
//o => {r1, r2, ... rm}
|
|
|
|
//supponiamo che f => {r1, r2} e che nessuno dei padri abbia gia' l'associazione con questi result
|
|
//quindi
|
|
//p1 => {r1, r2}
|
|
//p2 => {r1, r2}
|
|
//pn => {r1, r2}
|
|
|
|
|
|
//mi serve un file con tutta la gerarchia per organizzazioni
|
|
//un file con le organizzazioni foglia da joinare con l'altro file
|
|
//un file con le associazioni organizzazione -> result forse meglio result -> organization
|
|
|
|
}
|