Uso dei dati ODP nel proprio sito

micser

Member
Joined
Jul 7, 2005
Messages
10
weppos said:
Il file rdf risulta già suddiviso in diverse parti, non per categorie, ma per contenuti.
Potrà trovare il file dei siti, quello di cui si sta parlando nei post precedenti, quello delle categorie, quello dei log e non ricordo cos'altro.

Tempo fa lo scaricai anche io, non più di un mese fa, ed il file completo .rdf pesava intorno ai 250 Mb.

Lo può gestire con un editor testuale, senza però utilità.

Il mio consiglio è di generarne un contenuto adattabile usando perl, asp o php.
Esistono script in circolazione in grado di leggere il file e salvarlo in un db MySQl, per poter essere comodamente usato ed interrogato. :)

chi mi sa dire dove posso scaricare qualche script per la trasformazione in MySQl ?
 

micser

Member
Joined
Jul 7, 2005
Messages
10
tenxor said:
In tanto grazie per rispondermi. Sinceramente sto ancora studiando qual sia il miglior modo di farlo. In prattica vorrei fare un portale ed aggiungere un motore di ricerca (con lettura su MySQL) + la directory DMOZ.

Vorrei montare tutto ciò su un server dedicato con un server MySQL e aggiornare i dati DMOZ e del motore di ricerca nella base dati.
Secondo quello che ho letto poso aggiornare DMOZ per ogni volta che si aggiorna (credo sia tutti i lunedì) in più so che i dati del file XML si possono covertire in SQL (per MySQL) e leggergli da lì. Mi sbaglio?

Non sono un programmatore, ne tanto meno uno esperto, quindi sto cercando di studiare la situazione. Penso che per la parte de la directory DMOZ siete gli unici che potete aiutarmi.

In tanto grazie mile, e sono al ascolto di qualche vostro suggerimento.
Saluti,

Anche io devo fare un portale in MySQL e PHP, ho letto da tutte le parti c'è di tutto ma alla fine sarebbe meglio che qualcuno ti dicesse usa questo programma e fai così....... Tu se hai risolto cosahai usato?

Grazie
 

micser

Member
Joined
Jul 7, 2005
Messages
10
Marc25 said:
Ciao grazie per i suggerimenti

Mi puoi indicare il link di questo file ?

Sto tentando di scaricare il file content.rdf da
http://rdf.dmoz.org/
anche a me mi segna 279 Mb ma il problema è che continua il download fino ad oltre 1gb .
Dove si può scaricare quello da circa 250mb ?

In realta siamo gia riusciti a parsare il codice per inserirlo in mysql ma non riesco a trovare la categoria italia :D

Ciao

cosa hai usato per parsare?
 

weppos

Member
Joined
Mar 3, 2004
Messages
602
Ci saranno errori nella connessione al database o nell'esecuzione della query.
Verifica la documentazione e la struttura del database richiesta.
 

It_27a

Member
Joined
Aug 19, 2005
Messages
2
errore nel file class_command.php di dmoz2mysql

Ho scaricato ed installato dmoz2mysql su sistema operativo windows 2000 con IIS 5 e MYSQL 4 e con Php 4.

Ho scaricato i due file structure.rdf.u8.gz e contents.rdf.u8.gz.
Eseguendo il file create_tables.php le tabelle vengono create regolarmente.
Eseguendo il file start_script.php ricevo il seguente errore:

Code:
undefined variable: break in C:\.....\class_command.php on line 101

alla linea 101 è il seguente codice

Code:
echo $break . $ansi_color . $__text . $break . "\033[0m";

e poco piu su il codice

Code:
if($__line_wrap) {
$break = "\n";
}

il tutto fa parte della funzione
Code:
function printToConsole($__text, $__line_wrap = true) {

presente nel file class_command.php

Come posso risolvere il problema ?
Grazie.
 

massy

Member
Joined
Nov 4, 2004
Messages
190
Premessa: non conosco lo script...
Credo che quello che lei cita non sia un errore ma un notice.

Non è stata dichiarata una variabile ($break) che viene cmq richiamata in stampa.

Può risolvere in vari modi:
1) dichiarandola ad inizio codice
Code:
$break="";
2) imposti il php in modo che avverta solo gli errori e non i notice
Code:
error_reporting(E_ERROR | E_WARNING);
3) modo brutale e pericoloso: metta un @ prima del codice "incriminato" (serve per non dar notizia di errori... ma in questo modo potrebbe non accorgersi di altri problemi).

Ps cmq questo forum non è un help desk degli script: la prossima volta si rivolga direttamente a chi ha scritto il codice :)

Ciao
 

giorgio83

Member
Joined
Jul 3, 2008
Messages
4
Struttura dei dati + DataBase

Buongiorno, questo è il mio primo messagio in questo forum.
Ho scoperto l'esistenza della directory DMOZ da poco ed ero interessato ad avere alcune informazioni.

Ho visto che è possibile avere a disposizione in maniera libera dei dati utilizzati da dmoz, scaricabili dall'indirizzo http://rdf.dmoz.org/.

Io li ho scaricati ed ho capito che per poterli vedere e per utilizzarli è necessario caricarli un un DataBase, giusto? E se non sbaglio esistono vari tools che permettono di fare questa importazione.

Prima di fare un lavoro di questo tipo, volevo sapere come erano strutturati questi dati. Non è possibile vedere un esempio o trovare da qualche parte la loro struttura?

Ringrazio anticipatamente tutti coloro che mi risponderanno e se ho scritto qualcosa di sbagliato vi prego di scusarmi e di farmi sapere. Attendo una risposta...

Un saluto a tutti
 

Avionix

Member
Joined
Apr 4, 2008
Messages
36
Struttura dati e documantazione in merito

Per vedere un esempio di struttura ci sono dei link "short example" proprio nella pagina da te indicata (http://rdf.dmoz.org/), penso questo ti interessi.

Mi aggancio al tuo post perchè anch'io vorrei sapere qualcosa in più su questi dati, siccome all'indirizzo indicato manca documentazione in merito.
Per esempio vorrei sapere se è possibile scaricare soltanto i dati di alcune categorie, oppure che programmi consigliate per estrapolare i dati.
Grazie a tutti anticipatamente :)
 

giorgio83

Member
Joined
Jul 3, 2008
Messages
4
Grazie per la risposta, ma i tag li avevo visti.

Forse non mi sono spiegato bene, vorrei avere un esempio di pagina indicizzata da DMOZ, come è strutturata, dove sono messi i tag ed il contenuto, eccetera.
 

Hogudo

Member
Joined
Jun 8, 2004
Messages
38
Ciao,
se vuoi usare tali dati ti consiglio di prendere visione delle cat
http://search.dmoz.org/cgi-bin/search?search=rdf&all=yes&cs=UTF-8&cat=World/Italiano

Se invece cerchi info su rdf
http://www.w3.org/RDF/

però ti consiglio:
a) dai una pulitina che l'output di dmoz ha bisogno di una sistematina (per questo ti ho messo il link sopra) se vuoi tutte le cosine al loro posto
b) occhio che è una mole di tali gigantesca
c) stressa gli editori italiani perchè manca una cat sul web semantico in italiano :D
 
This site has been archived and is no longer accepting new content.
Top