Jump to content

Segnalazione URL non funzionanti, hijack, mirror e redirect


Recommended Posts

  • Replies 531
  • Created
  • Last Reply

Top Posters In This Topic

Posted
Noto dai toni dell’ultima parte del suo post un tono polemico,

Certamente no.

Era una conclusione che voleva sottolineare che accanto al rispetto delle regole che ci siamo dati ha diritto di esistenza anche la propria personale valutazione dell'importanza di un sito, di un deeplink.

Chiediamo cioè agli editori integrità e intelligenza e non solo l'applicazione di regole rigide che quasi mai esistono nell'ODP.

E con questo vengo al punto successivo:

 

questo potrebbe valere anche per migliaia di altri siti

Certamente sì.

Non è la dimensione del sito o la sua autorevolezza che giustifica il deeplink ma il suo contenuto concreto e la valutazione dell'editore della sua importanza in una specifica categoria.

E non è nemmeno vero che nelle grandi categorie non si può inserire dei deeplink: ho detto che "potrebbe" non essere necessario per il semplice motivo che essendoci molti siti forse il contenuto del deeplink non aggiunge alcunchè.

Ma se un deeplink contiene qualcosa di originale ad una categoria immensa può a ben diritto esservi inserito.

 

vi troverete in futuro sempre più sommersi di deeplink

Non credo.

O meglio potrà esservi il tentativo ma vorrei che si sapesse che le submission di deeplink vengono quasi automaticamente cancellate a vista.

Il deeplink è una possibilità offerta agli editori più che ai submitter.

Costruendo una categoria un editore incontra contenuti che ritiene pertinenti e utili: li inserisce sia che riempiano un intero sito sia se provengano da una sezione, da un deeplink.

 

Regole rigide, stringenti su questioni come questa non possono essere scritte.

Quando ci troviamo di fronte ad un particolare tipo di deeplink ne parliamo e decidiamo un orientamento e qualche criterio che ci aiuti a decidere che poi inseriamo nelle direttive di categoria.

 

Come detto sin dal precedente post, fare l'editore è ben più che ricevere submission e applicare regole.

E per il rischio spam ci stiamo sempre più attrezzando per fermare sulla porta di casa tutto ciò che non è utile alla directory. :)

Posted

A proposito di usi "impropri"

 

Sono passato a dare uno sguardo al thread (per le mie segnalazioni sul tree immobiliare) e mi sono imbattuto in questo interessante spunto sul deeplink.

 

Da questo sono passato qui:World/Italiano/Computer/Internet/Ricerca/Directory/Open_Directory_Project/Notizie_e_Media/

 

e poi in una vera e propria "fucina di problemi": World/Italiano/Computer/Internet/Ricerca/Directory/Open_Directory_Project/Siti_Che_Utilizzano_ODP/

 

Non me ne vogliate ma questa categoria è un inno all'uso improprio di ODP :( nonché una fucina di spam pazzesca.:eek:

Vi converrebbe rinominarla in "iscrivetevi qui per avere un link gratuito da PR 6" (!!) oppure "iscrivi qui il tuo spam engine che vive con/sui dati di Dmoz".

 

I siti basati sulla dicotomia dmoz-adsense (senza quindi alcun contenuto originale... neanche una riga!) sono la stragrande maggioranza.

Solo pensare di listarli è un'offesa alla stessa filosofia che Dmoz (e voi che mi rispondete con pazienza in questo forum) cercate di trasmettere.

 

Un altro ampio numero sono i siti di SEO che vengono iscritti qui solo per prendere pagerank e che poi vengono probabilmente stravolti una volta listati.

 

La mia non è veramente e in alcun modo una critica all'editore (anzi, ho dato uno sguardo al profilo e mi sono sentito a disagio al pensiero che possa essere messo in dubbio il lavoro di una persona così) ma all'esistenza stessa della categoria.

Siete sicuri abbia un senso?

 

Più che altro: sono il primo che se ne accorge o tira fuori questa categoria? (il che potrebbe essere una dimostrazione dell'interesse diffuso di tutti dentro-e-fuori nell'averla :cool: ).

Posted

Non è il primo.

Nella mia risposta in http://resource-zone.com/forum/showpost.php?p=211110&postcount=249 avevo cercato di rendere conto del fatto che anche all'interno abbiamo discusso quelle categorie e che la decisione è stata di effettuare alcune modifiche ma non di eliminarle.

 

Vedi, a noi del pagerank non importa proprio nulla, né in un senso (siti che non inseriamo) né nell'altro (siti che inseriamo).

Se il pagerank crea così tante tensioni è un problema dei SEO e di Google.

Noi possiamo farne a meno.

Se verrà tolto potremo lavorare con minori pressioni e minori contestazioni.

 

Quella categoria comprende tutti i siti che utilizzano ODP rispettandone la licenza d'uso.

Se crea un vantaggio per il link che vale 6 di PR a noi non interessa niente: tutti hanno la possibilità di esservi inseriti a condizione che utilizzino i dati odp e che rispettino la licenza d'uso.

Non c'è parzialità o favoritismo: le regole sono valide per tutti.

 

E non è vero che non c'è contenuto: il contenuto dei siti inseriti in quella categoria è la directory ODP.

 

L'unica vera obiezione che ho sentito su quella categoria è se non siamo in presenza di siti mirror: ODP che moltiplica se stessa.

In parte è vero ma sono molte le motivazioni di tipo promozionale, del progetto e dei siti utilizzatori, che sostengono e giustificano quella categoria.

 

Non si trovano su molti siti i link ai collaboratori o ai clienti?

I siti che utilizzano i dati ODP sono i nostri collaboratori (nel diffondere il prodotto da noi elaborato) e i nostri clienti (nell'"acquistare" free of charge il prodotto RDF o gli stessi dati elaborati diversamente).

Posted

Albovicamp,

forse può essere utile andare oltre alla superficie perché (almeno) capire il funzionamento di Google credo sia vitale per Dmoz e non marginale.

 

Se il pagerank crea così tante tensioni è un problema dei SEO e di Google.

 

Il PR non crea tensioni e soprattutto non è un problema.

Google che da un bonus ai siti listati da Dmoz, sopratutto (e non solo) per le keywords relative alla categoria in cui la redazione di Dmoz inserisce il sito.

 

Il problema semmai ce l'hanno i webmaster "onesti" che si inalberano (vi giuro molto spesso con ragione) perché il proprio sito non entra mentre il sito di loro concorrenti diretti entra oppure perché la loro categoria è ingessata e i siti che sono presenti dentro sono (tornando all'esempio da cui è partita la mia crociata) quantomeno inadeguati.

 

Come Dmoz avete molto potere conseguente a questi aspetti.

 

Alcuni esempi?

Un buon redattore di Dmoz (magari di livello Word/Italiano/) ha un valore + alto sul mercato del lavoro per le aziende di SEO.

Un link dato "bene" ha un valore economico consistente... parliamo di diverse centinaia di euro (che volendo si possono ottenere all'anno con la minaccia di rimuovere o modificare il listing) se non migliaia per le categorie ingessate e competitive.

 

Non considerare Google (o dichiarare di non considerarlo) è un approccio sbagliato.

Google cita Dmoz come fonte primaria di trust e voi sperate di rimanere fuori dalla bagarre?

Vi mettono in mezzo e quindi ci siete dentro per forza ;)

 

Visto che metà buona degli editori sono SEO o SEO-related, non vi è venuto in mente di creare un comitato interno dedicato a rapportarsi con il mondo dei SEO? (che purtroppo per noi sta molto vicino al mondo dello spam)

 

In merito alla categoria "siti che utilizzano Dmoz" mi spiace ma la penso in modo diversissimo:

i siti che usano Dmoz (parlo di quelli che basano la quasi totalità del proprio contenuto su Dmoz) fosse per me non andrebbero listati.

Mi batterei strenuamente per questa posizione :icon_excl

 

Perché?

1) perché sono tutti spam engine! Fate tanta filosofia sui contenuti originali dei siti e poi listate la minaccia numero 1 di tutti i "poveri" navigatori che non sanno distinguerli?

Mannaggia:) : rimuovete i siti che utilizzano dati di altri siti e poi non applicate la regola a voi stessi?

 

2) perché il processo è questo: scopro la categoria (generalmente guardando i backlink dei miei concorrenti), scarico uno script che grabbi i contenuti di Dmoz e piazzo tutto in una cartella del mio sito in modo da potermi iscrivere anche io.

 

Se ci vedete del buono in questo processo... :(

 

Un esempio a caso (è l'ultimo sito in fondo alla categoria):

http://www.yourway.it/

Pure Google l'ha bannato...

 

Io (nel mio essere idealista) penso che online ci sia bisogno di un grosso apporto di etica di comportamento.

Molti siti sono contrari a questa etica e vivono del "fare i furbi".

Quello che sostengo è che in questa categoria ce ne siano veramente tanti e belli concentrati.

 

Quasi quasi (visto che il "mio" sito è ancora in attesa da altre parti, gli aggiungo la categoria di Dmoz e almeno lo listo qua). Scherzo :D

Posted
che volendo si possono ottenere all'anno con la minaccia di rimuovere o modificare il listing

Dopo il primo cambiamento accertato l'editore sarebbe indagato e alla modifica successiva rimosso.

Non vi viene in mente che il valore di mercato dipenda non dal fatto di essere lì, ma dal fatto che per essere lì ha mostrato certe qualità che sono importanti per lavorare sul web ?

 

Vi mettono in mezzo e quindi ci siete dentro per forza

Possono metterci in mezzo ma non possono obbligarci a lavorare in modo diverso da quello che ci siamo dati come comunità di editori.

 

Un esempio a caso... Pure Google l'ha bannato...

I motivi che possono portare al ban da Google sono diversi dai nostri.

Per dirne solo uno che ricorre spesso anche nelle segnalazioni di abuso ma che non ha per noi alcun peso:

i siti che utilizzano testo nascosto leggibile dai motori ma non dai navigatori sono bannati da Google ma non da noi che valutiamo solo il testo leggibile.

Posted

Capisco.

 

Comunque forse l'effettiva lunghezza del messaggio ha allontanato dal cuore della mia questione "filosofica":

 

quella categoria non rispetta le policy di Dmoz.

 

Nessun contenuto originale... anzi: la categoria vive quasi esclusivamente di contenuti non originali (al 100%) o di deeplink di contenuto non originale in siti che invece originali sono.

 

Questo aspetto merita una riflessione e mi meraviglia che questa linea sia risultata minoritaria.

 

Anzi, quella categoria è un costante insulto a Dmoz.

 

I siti che utilizzano i dati ODP sono i nostri collaboratori (nel diffondere il prodotto da noi elaborato)...

 

Bah, sono siti che hanno bisogno di contenuti free-of-charge per poter popolare siti in cui mettere annunci di Adsense e li trovano facilmente su Dmoz.

Non lo fanno per filantropia, non creda. :(

 

E per questo non andrebbero aiutati listandoli.

  • Like 1
Posted

Chiarito che "a noi del pagerank non importa proprio nulla" (e nemmeno di aiutare/sfavorire i webmaster, pensiamo solo alla directory e agli utenti quando recensiamo i siti) e che "sono molte le motivazioni di tipo promozionale" il motivo sta tutto qui: ci piace che un utente che capita in quella categoria veda che molti siti utilizzano quello che noi abbiamo creato per passione, e che i modi per farlo sono anche svariati.

 

hanno bisogno di contenuti free-of-charge

e noi glielo forniamo volentieri...

 

Prova a metterti nei nostri panni e in quelli della maggior parte degli utenti, con le premesse che ho citato dal post di albovicamp. ;)

 

P.S.: Visto che tanto al PR ci pensa Google, che sa il fatto suo, io non mi preoccuperei eccessivamente (dai un occhio al PR di http://dmoz.org/Computers/Internet/Searching/Directories/Open_Directory_Project/Sites_Using_ODP_Data/ ).

  • Cateditall
Posted
quella categoria non rispetta le policy di Dmoz.

 

Nessun contenuto originale... anzi: la categoria vive quasi esclusivamente di contenuti non originali (al 100%) o di deeplink di contenuto non originale in siti che invece originali sono.

E' del tutto inutile che continui a spiegarci che i siti di quella categoria sono siti mirror: lo sapevamo già.

Come già spiegato da Albovicamp, il tuo pensiero non è nuovo e se n'è già discusso più volte nel forum interno degli editori, se ne discute e se ne discuterà anche in futuro.

 

Se non seguiamo la tua idea non è perché non l'abbiamo capita ma perché abbiamo deciso (per il momento) di chiudere un occhio (facciamo tutti e due) e di usare quella cat per fare promozione.

 

Dai un'occhiata a questo pagina, in basso http://www.dmoz.org/World/Italiano/about.html

E' linkata la categoria dei siti che utilizzano ODP, perché quella categoria è l'equivalente della pagina PARTNERS che trovi in qualsiasi sito aziendale, perché ODP è un'azienda (in certo modo).

Come ogni azienda abbiamo le sezioni: chi siamo, cosa facciamo, con chi lavoriamo.

 

Per ora ci fa comodo così. ;)

Posted

Salve, volevo una delucidazione su un sito belsalento.it che si trova sulla directory di Google (http://www.google.com/Top/World/Italiano/Regionale/Europa/Italia/Puglia/Provincia_di_Lecce/Localit%C3%A0/Martano/?il=1) ma non è presente dentro dmoz (http://dmoz.org/World/Italiano/Regionale/Europa/Italia/Puglia/Provincia_di_Lecce/Localit%c3%a0/Martano/) volevo sapere che fine ha fatto, se per caso è stato tolto, più che altro perchè attualmente il sito è senza grafica, non vorrei che qualcuno avesse pensato che è in costruzione o quant'altro. Per questo vorrei capire se posso riproporlo in qualche altra categoria più attinente:

 

World/Italiano/Regionale/Europa/Italia/Puglia/Provincia_di_Lecce/

World/Italiano/Regionale/Europa/Italia/Puglia/Aree_Geografiche/Salento/

 

ciao e grazie

Posted

Ha intuito giusto.

Il sito è stato tolto perchè in elaborazione.

 

L'informazione è ricavabile dal sito stesso: "Attualmente il sito è nella sua fase embrionale"

e dal fatto che il sito non dà quello che promette ("informazioni utili e consigli") limitandosi ad un mero elenco di strutture ed eventi senza alcuna informazione.

Una specie di elenco telefonico/agenda del Salento.

 

Il sito verrà ripreso in esame nei tempi già scadenzati per la verifica del suo stato e l'editore che lo recensirà di nuovo valuterà se apporta informazioni utili e per quale categoria.

 

Al momento attuale nemmeno io lo valuterei interessante per la categoria /Salento né tantomeno per /Martano o /Provincia_di_Lecce.

Posted
Da quello che mi risulta il sito è appena stato messo in elaborazione, come dici tu, infatti su Google puoi trovare le cache. Avete un editore molto veloce da quelle parti ;). Ma non è un problema, figuriamoci. Sono sicuro, perchè ne faccio parte, che l'editore com'è stato veloce a toglierlo, sarà alquanto veloce a rimetterlo su :D un abbraccio.
Posted
Avete un editore molto veloce da quelle parti

Alla qualità della directory teniamo molto e vi sono molti editori veloci nel togliere quanto ne diminuisce il livello.

A scadenze successive i siti vengono visitati di nuovo per verificarne lo stato.

Se dopo un tempo ragionevole il sito non è tornato attivo viene definitivamente cancellato anche dalle categorie di servizio.

 

E contiamo molto anche sugli utenti per tenere d'occhio quei siti che ci sfuggono.

Come vede le risposte alle segnalazioni in questo forum sono molto veloci.

 

Come pure sono veloci gli interventi su segnalazioni di ripristino di siti già catalogati e che tornino ad essere online e completi.

Posted

@igorx81

 

Hai citato il PR della categoria in inglese (e hai fatto bene perché anche io l'avevo notato).

Ho cercato di capire se fosse un robots.txt o qualche altra cosa.

Ho il dubbio (se avete voglia chiedetelo voi) che nella cat internazionale abbiano preso una decisione diversa dalla vostra.

Google non c'entra...

 

PS: La cat in questione (quella italiana) ha invece il suo bel PR. Non svicolare :p

 

 

@yocoandra

 

Guarda, io lo dicevo "per voi" (per quanto capisco ti possa suonare falsa questa frase).

Io penso che quelli che voi chiamate testimonials siano sanguisughe/piattole.

Ma se a voi sta bene così ben venga.

 

A questo punto ne approfitto: dirò al mio AD di aggiungere Dmoz in una sottocategoria fittizia del suo portale in modo da essere listato almeno una volta visto che nelle categorie "giuste" non si riesce a entrare.

Ovviamente lui (come gli altri) non si iscrive per filantropia o perché stimi Dmoz.

Lo fa perché io gli ho detto che Google da credito ai siti che sono dentro a Dmoz.

 

Dal suo punto di vista di imprenditore (e non di ottimizzatore o di informatico ecc.) Dmoz vive di luce riflessa.

 

Comunque riprenderò a segnalare abusi e non tornerò sull'argomento.

Contenti voi non vedo perché ci debba stare male io!! :(

Posted

Sì, abbiamo messo il file robots anche su Google:

http://www.google.com/Top/Computers/Internet/Searching/Directories/Open_Directory_Project/Sites_Using_ODP_Data/ :)

Non so dirti il motivo, ma se cerchi forse trovi qualcosa in qualche forum internazionale.

Non svicolare

Lo dicevo solo per te, magari prima o poi verrà tolto in tutte le aeree linguistiche...

 

P.S.: DMOZ vive perché migliaia di persone ci hanno messo la loro passione, tutti i giorni, per anni...

  • Like 1
  • Meta
Posted

Contenti voi non vedo perché ci debba stare male io!! :(

 

Aggiungo solo una mia considerazione e qualche informazione a quanto già esposto da chi mi ha preceduto:

la categoria in questione esiste in 16 lingue e se pur controversa appartiene alla storia di ODP, per cui ha avuto e ha tuttora il benestare di chi questo progetto lo dirige legalmente e ne orienta le strategie.

 

Se anche la maggior parte degli editori appartenenti all'area italiana la ritenesse da smantellare, non potrebbe farlo a cuor leggero e sarebbe opportuno informare e attendere un opinione dagli admin e/o dallo staff di Netscape/AOL.

 

Proprio recentemente è partito un progetto interno di studio e analisi di *come* vengono utilizzati i dati ODP dai vari siti. Questo lavoro durerà qualche mese e porterà alla stesura di una approfondita relazione sull'argomento.

 

Verrà molto probabilmente fatto anche un annuncio pubblico con una breve panoramica del lavoro svolto ma soprattutto dei risultati. Alla luce di quei dati ci sarà la possibilità di ridiscutere l'utilità attuale di /Siti_Che_Utilizzano_ODP, e perché no, magari di riconsiderare i requisiti richiesti ai siti potrebbero essere inseriti a quel livello.

 

:)

  • Meta
Posted
Se qualcuno sa con esattezza la data nella quale viene cancellato un dominio, non potreste saperlo anche voi? :)

 

Abbiamo dei tool automatici che si occupano di problematiche come queste,

ma non esistendo solo il nic e con più di 5 milioni di siti inseriti

l'intercettazione non è immediata come nel caso di un controllo manuale.

 

Ho tolto dal lato pubblico i 2 URL in attesa di un evoluzione; grazie della segnalazione. :)

Posted

Il testo nascosto, come precisato più volte, non ci interessa.

Non inganna gli occhi umani, solo i motori.

E' problema che devono risolvere i motori di ricerca.

 

Per il resto ho datato il listing in modo che risulti l'anno al quale si riferisce.

Grazie della segnalazione.

Posted
Abbiamo dei tool automatici che si occupano di problematiche come queste,

ma non esistendo solo il nic e con più di 5 milioni di siti inseriti

l'intercettazione non è immediata come nel caso di un controllo manuale

 

Come già detto in passato, nessuno chiede alla comunità italiana di occuparsi dei 5 milioni di siti su dmoz, ma almeno dei 180.000 del ramo Italiano, e non penso sia una cosa così difficile da attuare. (avendone la volontà)

 

http://www.cellulari.it/

http://dmoz.org/World/Italiano/Affari/Telecomunicazioni/Notizie_e_Media/

 

Questo penso abbia fatto il record di fax al nic

 

Quindi ribadisco la domanda: come mai molte persone sanno esattamente quando un dominio viene cancellato e la vostra comunità non è in grado di farlo?


×
×
  • Create New...