Segnalazione URL non funzionanti, hijack, mirror e redirect

albovicamp

Member
Joined
Sep 28, 2005
Messages
476
Onestamente non vedo come favorire maggiormente il controllo degli utenti oltre ad avere un thread come questo.

Ma se ci sono suggerimenti siamo dispostissimi a discuterli e valutarne la fattibilità.
 

lukad1

Member
Joined
Feb 22, 2006
Messages
36
Non avevo guardato bene:

www.casapoint.it
In costruzione... rischedulare per controllo.

www.censiweb.it
Andrebbe forse rivisto... il contenuto editoriale pubblico è nullo.
Servirebbe una password...
Fate voi :)


www.mediacompany.it
E' un'agenzia pubblicitaria. Non dovrebbe essere qui.

www.mediacomweb.it/mediacomcase
Questo è "mitico" :D
E' un minisito di test per siti di agenzie.
E' tutto inventato: persino il nome delle agenzie e gli indirizzi sono dimostrativi.
A parte la fregatura che si è beccato l'editore (succede!) la descrizione fa acqua. "Soluzioni...altamente professionali" non va.

Smetto e vado a casa!
Alle prossime puntate...

PS: sdifettare le categorie immobiliari è un lavoraccio! :)
 

lukad1

Member
Joined
Feb 22, 2006
Messages
36
Comunque... lascio perdere lo sfogo :) e vi do il mio contributo:

www.abitarea.it
Adesso è di una banca... il dominio sarà passato di mano.
Tirerei via.

www.alleanzaimmobiliare.com
Questo è scaduto da qualche giorno... è in redemption period.
Verrà preso da qualcun altro molto probabilmente che poi magari ci metterà sopra uno spam engine.
Rischedulerei per un controllo fra un mesetto e per ora lo toglierei.

www.didox.it
Da vedere così è tutt'altro che un network di agenzie.:cool:
Cosa ne dite?

www.nwwea.net/e_it/
Questo è un caso più sottile: cosa vuol dire "network di agenzie"?
Se i network sono gruppi (diversi dai franchising che hanno la loro categoria apposita) allora questo non sembr aun gruppo... semmai una directory.
Comunque vada la descrizione non è corretta.

www.professionecasa.it
Questo (come si legge bene nel logo) è un franchising immobiliare... e quindi va messo forse qui: World/Italiano/Affari/Opportunit%c3%a0/Franchising/Immobiliari/.

:)
 

mauri

Curlie Meta
Joined
Mar 29, 2002
Messages
4,333
Location
Italy
lukad1 said:
Comunque... lascio perdere lo sfogo :) e vi do il mio contributo:
Grazie, tutti gli URL sono stati controllati e sono stati presi gli opportuni provvedimenti. :)
 

albovicamp

Member
Joined
Sep 28, 2005
Messages
476
La domanda mi dà l'occasione di chiarire, se vi riesco, la questione del deeplink per mezzo di un esempio.

http://punto-informatico.it/
E' l'URL principale ed è presente in Computer/Notizie_e_Media/Riviste_Elettroniche

http://punto-informatico.it/fader/pixml.xml
Questa è la versione RSS di Punto Informatico e il suo listing è previsto, in generale nella stessa categoria, ma in un'area separata denominata "Canali XML".
La sua presenza non ha nulla a che fare con il deeplinking.

http://punto-informatico.it/p.asp?i=47515
Questo articolo riguarda la questione della proprietà intellettuale e risulta inserito in una categoria molto diversa e "distante" dal ramo Computer: Società/Temi_e_Dibattiti/Proprietà_Intellettuale/Condivisione_di_File/

La presenza dei listing fino a qui illustrata non credo che meriti alcuna considerazione ulteriore.
Ci avviciniamo all'area più sensibile del deeplinking con gli altri 4 listing:

http://punto-informatico.it/p.asp?i=40601
Questo articolo parla di noi, di dmoz.
Abbiamo discusso vivacemente e a lungo nel nostro forum interno di come trattare pagine di questo tipo (provenienti da siti di riviste e non) e la conclusione (per motivi di orgoglio? di autopromozione? di giusto risalto al nostro lavoro?) alla quale è arrivata finora la discussione è stata quella di definire meglio la categoria nella quale si trovavano rinominandola in Notizie_e_Media (era Rassegna_Stampa) ma considerando sostanzialmente accettabili quei link.
Posso dire che quelli del tipo di PI erano tra i meno discussi.

E veniamo agli ultimi 3 siti che trovandosi nell'area /Computer potrebbero ricadere nella indicazione delle direttive che ci dice "il deeplink è un'eccezione piuttosto che la regola".
http://punto-informatico.it/p.asp?i=45193 in Computer/Formato_Dati/Formati_Aperti
http://punto-informatico.it/p.asp?i=46401 in Computer/Internet/Abusi/Spam
http://punto-informatico.it/p.asp?i=47532 in Computer/Software/Grafica/The_Gimp

L'unico errore che ho rilevato (e corretto) è il mancato uso, in due casi, del formato che abbiamo discusso e scelto per i titoli dei deeplink: Titolo_del_Sito: Titolo_del_Deeplink (in questi casi "Punto Informatico: titolo dell'articolo").

In questi casi hanno molto peso nella decisione da prendere:
* il contenuto del deeplink (pertinente, ampio, unico e non copiato)
* l'ampiezza della categoria (categorie con molti siti dedicati ad un argomento potrebbero non avere necessità di utilizzare anche dei deeplink)
* la presenza nel deeplink di idee, opinioni, informazioni non altrimenti rintracciabili in altri siti
Sono cioè i singoli deeplink significativi in ciascuna categoria e contribuiscono ad offrire un ventaglio di informazioni e opinioni più completo ed esauriente ?

La risposta che gli editori che hanno lavorato in quelle categorie hanno dato la potete intuire dalla presenza del deeplink.
Personalmente ritengo che non siamo in presenza di deeplink selvaggio: pensate a quanti articoli sono su PI e vi rendete conto che sono stati selezionati solo 3 pezzi per categorie di 6, 5 e 25 listing complessivi.
Direi un uso intelligente e molto moderato del deeplink.

Siamo naturalmente in un'area dove gli editori hanno una certa discrezionalità cioè sono invitati ad utilizzare la loro intelligenza, il loro discernimento critico, il loro buon senso e la loro esperienza di editori.
Altri editori avrebbero potuto fare scelte un po' diverse ? certamente sì; come ciascuno di voi potrebbe trovare indispensabile uno e meno importante l'altro degli esempi proposti dalla domanda.
Ma l'omologazione delle idee e delle valutazioni non è richiesta né imposta nell'ODP.
 

agriturismo

Member
Joined
Sep 30, 2004
Messages
120
Come utente non posso che ringraziare gli editori che si sbattono a cercare ed inserire intelligentemente deeplink verso pagine con contenuti unici ed in categorie vuote.

Noto dai toni dell’ultima parte del suo post un tono polemico, come se io fossi un ex editore o qualcuno che voglia omologare od imporre il suo pensiero: nulla di tutto ciò :)

Volevo gettare, (non per la prima volta) un sasso nello stagno facendo notare quello che io definisco il “deeplinking selvaggio”, normalmente indirizzato verso (meritevoli) siti “grossi” e qui ne trova un altro esempio, ma come ben sa ce ne sono molti altri.

Proseguo, richiamando il punto 2 da lei accennato:
“l'ampiezza della categoria (categorie con molti siti dedicati ad un argomento potrebbero non avere necessità di utilizzare anche dei deeplink)”
In molti casi i deeplink vengono inseriti in categorie con decine di altre segnalazioni, e quindi, oggettivamente non hanno una logica motivazione per essere inseriti.

Alla sua domanda:
“Sono cioè i singoli deeplink significativi in ciascuna categoria e contribuiscono ad offrire un ventaglio di informazioni e opinioni più completo ed esauriente?”
Se rispondessi sì, questo potrebbe valere anche per migliaia di altri siti, e non solo per i soliti “grossi”, ergo, se non vi mettete delle regole chiare e precise sul tema vi troverete in futuro sempre più sommersi di deeplink submission.

E prevedo anche un aumento di lamentele del tipo: ma perché pi, repubblica ecc ecc vengono selvaggiamente deeplinkati ed il mio sito no?

Perché sono grossi?
Perché (qui ci può aggiungere tutte le insinuazioni che spesso si leggono in giro in rete)?
O perché gli editor vanno sul sicuro (sapendo di listare siti autorevoli) solo per aumentare il loro score?
 

albovicamp

Member
Joined
Sep 28, 2005
Messages
476
Noto dai toni dell’ultima parte del suo post un tono polemico,
Certamente no.
Era una conclusione che voleva sottolineare che accanto al rispetto delle regole che ci siamo dati ha diritto di esistenza anche la propria personale valutazione dell'importanza di un sito, di un deeplink.
Chiediamo cioè agli editori integrità e intelligenza e non solo l'applicazione di regole rigide che quasi mai esistono nell'ODP.
E con questo vengo al punto successivo:

questo potrebbe valere anche per migliaia di altri siti
Certamente sì.
Non è la dimensione del sito o la sua autorevolezza che giustifica il deeplink ma il suo contenuto concreto e la valutazione dell'editore della sua importanza in una specifica categoria.
E non è nemmeno vero che nelle grandi categorie non si può inserire dei deeplink: ho detto che "potrebbe" non essere necessario per il semplice motivo che essendoci molti siti forse il contenuto del deeplink non aggiunge alcunchè.
Ma se un deeplink contiene qualcosa di originale ad una categoria immensa può a ben diritto esservi inserito.

vi troverete in futuro sempre più sommersi di deeplink
Non credo.
O meglio potrà esservi il tentativo ma vorrei che si sapesse che le submission di deeplink vengono quasi automaticamente cancellate a vista.
Il deeplink è una possibilità offerta agli editori più che ai submitter.
Costruendo una categoria un editore incontra contenuti che ritiene pertinenti e utili: li inserisce sia che riempiano un intero sito sia se provengano da una sezione, da un deeplink.

Regole rigide, stringenti su questioni come questa non possono essere scritte.
Quando ci troviamo di fronte ad un particolare tipo di deeplink ne parliamo e decidiamo un orientamento e qualche criterio che ci aiuti a decidere che poi inseriamo nelle direttive di categoria.

Come detto sin dal precedente post, fare l'editore è ben più che ricevere submission e applicare regole.
E per il rischio spam ci stiamo sempre più attrezzando per fermare sulla porta di casa tutto ciò che non è utile alla directory. :)
 

lukad1

Member
Joined
Feb 22, 2006
Messages
36
A proposito di usi "impropri"

Sono passato a dare uno sguardo al thread (per le mie segnalazioni sul tree immobiliare) e mi sono imbattuto in questo interessante spunto sul deeplink.

Da questo sono passato qui:World/Italiano/Computer/Internet/Ricerca/Directory/Open_Directory_Project/Notizie_e_Media/

e poi in una vera e propria "fucina di problemi": World/Italiano/Computer/Internet/Ricerca/Directory/Open_Directory_Project/Siti_Che_Utilizzano_ODP/

Non me ne vogliate ma questa categoria è un inno all'uso improprio di ODP :( nonché una fucina di spam pazzesca.:eek:
Vi converrebbe rinominarla in "iscrivetevi qui per avere un link gratuito da PR 6" (!!) oppure "iscrivi qui il tuo spam engine che vive con/sui dati di Dmoz".

I siti basati sulla dicotomia dmoz-adsense (senza quindi alcun contenuto originale... neanche una riga!) sono la stragrande maggioranza.
Solo pensare di listarli è un'offesa alla stessa filosofia che Dmoz (e voi che mi rispondete con pazienza in questo forum) cercate di trasmettere.

Un altro ampio numero sono i siti di SEO che vengono iscritti qui solo per prendere pagerank e che poi vengono probabilmente stravolti una volta listati.

La mia non è veramente e in alcun modo una critica all'editore (anzi, ho dato uno sguardo al profilo e mi sono sentito a disagio al pensiero che possa essere messo in dubbio il lavoro di una persona così) ma all'esistenza stessa della categoria.
Siete sicuri abbia un senso?

Più che altro: sono il primo che se ne accorge o tira fuori questa categoria? (il che potrebbe essere una dimostrazione dell'interesse diffuso di tutti dentro-e-fuori nell'averla :cool: ).
 

albovicamp

Member
Joined
Sep 28, 2005
Messages
476
Non è il primo.
Nella mia risposta in http://resource-zone.com/forum/showpost.php?p=211110&postcount=249 avevo cercato di rendere conto del fatto che anche all'interno abbiamo discusso quelle categorie e che la decisione è stata di effettuare alcune modifiche ma non di eliminarle.

Vedi, a noi del pagerank non importa proprio nulla, né in un senso (siti che non inseriamo) né nell'altro (siti che inseriamo).
Se il pagerank crea così tante tensioni è un problema dei SEO e di Google.
Noi possiamo farne a meno.
Se verrà tolto potremo lavorare con minori pressioni e minori contestazioni.

Quella categoria comprende tutti i siti che utilizzano ODP rispettandone la licenza d'uso.
Se crea un vantaggio per il link che vale 6 di PR a noi non interessa niente: tutti hanno la possibilità di esservi inseriti a condizione che utilizzino i dati odp e che rispettino la licenza d'uso.
Non c'è parzialità o favoritismo: le regole sono valide per tutti.

E non è vero che non c'è contenuto: il contenuto dei siti inseriti in quella categoria è la directory ODP.

L'unica vera obiezione che ho sentito su quella categoria è se non siamo in presenza di siti mirror: ODP che moltiplica se stessa.
In parte è vero ma sono molte le motivazioni di tipo promozionale, del progetto e dei siti utilizzatori, che sostengono e giustificano quella categoria.

Non si trovano su molti siti i link ai collaboratori o ai clienti?
I siti che utilizzano i dati ODP sono i nostri collaboratori (nel diffondere il prodotto da noi elaborato) e i nostri clienti (nell'"acquistare" free of charge il prodotto RDF o gli stessi dati elaborati diversamente).
 

lukad1

Member
Joined
Feb 22, 2006
Messages
36
Albovicamp,
forse può essere utile andare oltre alla superficie perché (almeno) capire il funzionamento di Google credo sia vitale per Dmoz e non marginale.

Se il pagerank crea così tante tensioni è un problema dei SEO e di Google.

Il PR non crea tensioni e soprattutto non è un problema.
Google che da un bonus ai siti listati da Dmoz, sopratutto (e non solo) per le keywords relative alla categoria in cui la redazione di Dmoz inserisce il sito.

Il problema semmai ce l'hanno i webmaster "onesti" che si inalberano (vi giuro molto spesso con ragione) perché il proprio sito non entra mentre il sito di loro concorrenti diretti entra oppure perché la loro categoria è ingessata e i siti che sono presenti dentro sono (tornando all'esempio da cui è partita la mia crociata) quantomeno inadeguati.

Come Dmoz avete molto potere conseguente a questi aspetti.

Alcuni esempi?
Un buon redattore di Dmoz (magari di livello Word/Italiano/) ha un valore + alto sul mercato del lavoro per le aziende di SEO.
Un link dato "bene" ha un valore economico consistente... parliamo di diverse centinaia di euro (che volendo si possono ottenere all'anno con la minaccia di rimuovere o modificare il listing) se non migliaia per le categorie ingessate e competitive.

Non considerare Google (o dichiarare di non considerarlo) è un approccio sbagliato.
Google cita Dmoz come fonte primaria di trust e voi sperate di rimanere fuori dalla bagarre?
Vi mettono in mezzo e quindi ci siete dentro per forza ;)

Visto che metà buona degli editori sono SEO o SEO-related, non vi è venuto in mente di creare un comitato interno dedicato a rapportarsi con il mondo dei SEO? (che purtroppo per noi sta molto vicino al mondo dello spam)

In merito alla categoria "siti che utilizzano Dmoz" mi spiace ma la penso in modo diversissimo:
i siti che usano Dmoz (parlo di quelli che basano la quasi totalità del proprio contenuto su Dmoz) fosse per me non andrebbero listati.
Mi batterei strenuamente per questa posizione :icon_excl

Perché?
1) perché sono tutti spam engine! Fate tanta filosofia sui contenuti originali dei siti e poi listate la minaccia numero 1 di tutti i "poveri" navigatori che non sanno distinguerli?
Mannaggia:) : rimuovete i siti che utilizzano dati di altri siti e poi non applicate la regola a voi stessi?

2) perché il processo è questo: scopro la categoria (generalmente guardando i backlink dei miei concorrenti), scarico uno script che grabbi i contenuti di Dmoz e piazzo tutto in una cartella del mio sito in modo da potermi iscrivere anche io.

Se ci vedete del buono in questo processo... :(

Un esempio a caso (è l'ultimo sito in fondo alla categoria):
http://www.yourway.it/
Pure Google l'ha bannato...

Io (nel mio essere idealista) penso che online ci sia bisogno di un grosso apporto di etica di comportamento.
Molti siti sono contrari a questa etica e vivono del "fare i furbi".
Quello che sostengo è che in questa categoria ce ne siano veramente tanti e belli concentrati.

Quasi quasi (visto che il "mio" sito è ancora in attesa da altre parti, gli aggiungo la categoria di Dmoz e almeno lo listo qua). Scherzo :D
 

albovicamp

Member
Joined
Sep 28, 2005
Messages
476
che volendo si possono ottenere all'anno con la minaccia di rimuovere o modificare il listing
Dopo il primo cambiamento accertato l'editore sarebbe indagato e alla modifica successiva rimosso.
Non vi viene in mente che il valore di mercato dipenda non dal fatto di essere lì, ma dal fatto che per essere lì ha mostrato certe qualità che sono importanti per lavorare sul web ?

Vi mettono in mezzo e quindi ci siete dentro per forza
Possono metterci in mezzo ma non possono obbligarci a lavorare in modo diverso da quello che ci siamo dati come comunità di editori.

Un esempio a caso... Pure Google l'ha bannato...
I motivi che possono portare al ban da Google sono diversi dai nostri.
Per dirne solo uno che ricorre spesso anche nelle segnalazioni di abuso ma che non ha per noi alcun peso:
i siti che utilizzano testo nascosto leggibile dai motori ma non dai navigatori sono bannati da Google ma non da noi che valutiamo solo il testo leggibile.
 

lukad1

Member
Joined
Feb 22, 2006
Messages
36
Capisco.

Comunque forse l'effettiva lunghezza del messaggio ha allontanato dal cuore della mia questione "filosofica":

quella categoria non rispetta le policy di Dmoz.

Nessun contenuto originale... anzi: la categoria vive quasi esclusivamente di contenuti non originali (al 100%) o di deeplink di contenuto non originale in siti che invece originali sono.

Questo aspetto merita una riflessione e mi meraviglia che questa linea sia risultata minoritaria.

Anzi, quella categoria è un costante insulto a Dmoz.

I siti che utilizzano i dati ODP sono i nostri collaboratori (nel diffondere il prodotto da noi elaborato)...

Bah, sono siti che hanno bisogno di contenuti free-of-charge per poter popolare siti in cui mettere annunci di Adsense e li trovano facilmente su Dmoz.
Non lo fanno per filantropia, non creda. :(

E per questo non andrebbero aiutati listandoli.
 

igorx81

Member
Joined
Feb 13, 2005
Messages
104
Chiarito che "a noi del pagerank non importa proprio nulla" (e nemmeno di aiutare/sfavorire i webmaster, pensiamo solo alla directory e agli utenti quando recensiamo i siti) e che "sono molte le motivazioni di tipo promozionale" il motivo sta tutto qui: ci piace che un utente che capita in quella categoria veda che molti siti utilizzano quello che noi abbiamo creato per passione, e che i modi per farlo sono anche svariati.

hanno bisogno di contenuti free-of-charge
e noi glielo forniamo volentieri...

Prova a metterti nei nostri panni e in quelli della maggior parte degli utenti, con le premesse che ho citato dal post di albovicamp. ;)

P.S.: Visto che tanto al PR ci pensa Google, che sa il fatto suo, io non mi preoccuperei eccessivamente (dai un occhio al PR di http://dmoz.org/Computers/Internet/.../Open_Directory_Project/Sites_Using_ODP_Data/ ).
 
This site has been archived and is no longer accepting new content.
Top