Παρόμοιες (διπλότυπες) σελίδες. Πώς να αναγνωρίσετε διπλό περιεχόμενο

Παιδικά προϊόντα 27.07.2019
Επισκόπηση προγράμματος Η έκδοση υπολογιστή του Microsoft Excel Viewer θα επιτρέψει...

Οι μηχανές αναζήτησης όπως η Google αντιμετωπίζουν ένα πρόβλημα – και αυτό ονομάζεται «διπλότυπο περιεχόμενο». Το περιεχόμενο ονομάζεται διπλότυπο εάν εμφανίζεται με παρόμοια μορφή σε διαφορετικά σημεία στο παγκόσμιο Διαδίκτυο (σε διαφορετικές διευθύνσεις URL), με αποτέλεσμα οι μηχανές αναζήτησης να μην γνωρίζουν ποια διεύθυνση URL να εμφανίσουν στα αποτελέσματα αναζήτησης. Αυτό μπορεί να έχει αρνητικό αντίκτυπο στην κατάταξη μιας ιστοσελίδας και όταν οι χρήστες αρχίζουν να συνδέονται με διαφορετικές εκδόσεις του ίδιου περιεχομένου, το πρόβλημα επιδεινώνεται.

Αυτό το άρθρο θα σας βοηθήσει να κατανοήσετε τις αιτίες του διπλότυπου περιεχομένου και θα σας δώσει μια κατανόηση του τι πρέπει να γίνει σε κάθε συγκεκριμένη περίπτωση.

Τι είναι το διπλότυπο περιεχόμενο;

Το διπλότυπο περιεχόμενο μπορεί να συγκριθεί με ένα σταυροδρόμι όπου τα οδικά σήματα δείχνουν προς διαφορετικές κατευθύνσεις για την ίδια τοποθεσία: ποια διαδρομή πρέπει να ακολουθήσετε; Για να γίνουν τα πράγματα χειρότερα, ο τελικός προορισμός είναι επίσης διαφορετικός, λίγο. Ως αναγνώστης, δεν σας ενδιαφέρει τόσο πολύ όσο παίρνετε αυτό για το οποίο ήρθατε, αλλά η μηχανή αναζήτησης πρέπει να επιλέξει ποια σελίδα θα εμφανίσει στα αποτελέσματα αναζήτησης, επειδή φυσικά δεν θέλει να εμφανίζει το ίδιο περιεχόμενο επανειλημμένα.

Ας υποθέσουμε ότι το άρθρο σας σχετικά με τη λέξη-κλειδί x εμφανίζεται αμετάβλητο στις διευθύνσεις Και http://www.example.com/article-category/keyword-x/. Η κατάσταση δεν είναι τραβηγμένη: αυτό συμβαίνει σε πολλά σύγχρονα συστήματα διαχείρισης περιεχομένου. Στη συνέχεια, ας πούμε, το άρθρο σας καταλήφθηκε από αρκετούς bloggers, μερικοί από τους οποίους συνδέονται με την πρώτη διεύθυνση URL και άλλοι με τη δεύτερη. Αυτή είναι ακριβώς η στιγμή που το πρόβλημα της μηχανής αναζήτησης δείχνει την πραγματική του φύση - αφορά και εσάς. Το διπλότυπο περιεχόμενο είναι το πρόβλημά σας επειδή αυτοί οι σύνδεσμοι προωθούν διαφορετικές διευθύνσεις URL. Εάν συνδέονταν με την ίδια διεύθυνση URL, οι πιθανότητες κατάταξης της λέξης-κλειδιού x θα ήταν υψηλότερες.

1 Λόγοι για διπλό περιεχόμενο

Υπάρχουν δεκάδες λόγοι για τους οποίους εμφανίζεται διπλό περιεχόμενο. Τα περισσότερα από αυτά είναι τεχνικής φύσης: δεν είναι πολύ συχνά που ένα άτομο αποφασίζει να δημοσιεύσει το ίδιο περιεχόμενο σε δύο διαφορετικά μέρη χωρίς να ξεκαθαρίσει ποιο από αυτά είναι πρωτότυπο - για τους περισσότερους από εμάς αυτό φαίνεται αφύσικο. Ωστόσο, υπάρχουν πολλοί τεχνικοί λόγοι και προκύπτουν κυρίως επειδή οι προγραμματιστές σκέφτονται με τον δικό τους τρόπο - όχι όπως τα προγράμματα περιήγησης, ούτε καν σαν τους χρήστες, για να μην αναφέρουμε τις αράχνες αναζήτησης - σκέφτονται σαν προγραμματιστές. Πάρτε, για παράδειγμα, το άρθρο που αναφέρθηκε προηγουμένως, που βρίσκεται στη διεύθυνση http://www.example.com/keyword-x/ και http://www.example.com/article-category/keyword-x/. Αν ρωτήσετε τους προγραμματιστές για τη γνώμη τους, θα σας διαβεβαιώσουν ότι υπάρχει μόνο ένα άρθρο εδώ.

1.1 Παρανόηση της έννοιας του URL

Όχι, οι προγραμματιστές δεν είναι τρελοί, απλώς μιλούν διαφορετική γλώσσα. Πιθανότατα, ο ιστότοπος θα υποστηρίζεται από ένα σύστημα διαχείρισης περιεχομένου CMS και η βάση δεδομένων του θα περιέχει μόνο ένα άρθρο, αλλά το λογισμικό του ιστότοπου θα επιτρέπει την πρόσβαση σε αυτό το άρθρο μέσω πολλαπλών διευθύνσεων URL. Η παρεξήγηση συμβαίνει επειδή από την άποψη των προγραμματιστών, το μοναδικό αναγνωριστικό για ένα άρθρο είναι το αναγνωριστικό που του έχει εκχωρηθεί στη βάση δεδομένων και όχι κάποιο είδος URL. Αλλά για μια μηχανή αναζήτησης, η διεύθυνση URL είναι ένα μοναδικό αναγνωριστικό για το περιεχόμενο. Εάν εξηγήσετε την κατάσταση στους προγραμματιστές, θα αρχίσουν να κατανοούν την ουσία του προβλήματος και αφού διαβάσετε το άρθρο, μπορείτε ακόμη και να τους παρέχετε μια έτοιμη λύση.

1.2 Αναγνωριστικά περιόδου σύνδεσης

Συχνά θέλετε να παρακολουθείτε τις ενέργειες των επισκεπτών και να τους επιτρέπετε, για παράδειγμα, να αποθηκεύουν τα επιθυμητά προϊόντα στο καλάθι αγορών τους. Για να το πετύχετε αυτό πρέπει να τους παρέχετε μια «συνεδρία». Μια περίοδος σύνδεσης είναι ένα σύντομο ιστορικό της δραστηριότητας ενός επισκέπτη στον ιστότοπό σας, το οποίο μπορεί να περιλαμβάνει τα στοιχεία που αναφέρθηκαν προηγουμένως στο καλάθι αγορών και παρόμοια. Για να αποθηκεύσετε τη συνεδρία δραστηριότητας ενός χρήστη (ενώ συνεχίζει να κάνει κύλιση στις σελίδες του ιστότοπου), πρέπει να αποθηκεύσετε κάπου ένα μοναδικό αναγνωριστικό περιόδου σύνδεσης, το οποίο ονομάζεται επίσης αναγνωριστικό περιόδου σύνδεσης. Η πιο κοινή λύση είναι η χρήση cookies, αλλά οι μηχανές αναζήτησης συνήθως δεν τα αποθηκεύουν.

Σε αυτήν την περίπτωση, ορισμένα συστήματα σταματούν να χρησιμοποιούν αναγνωριστικά περιόδου σύνδεσης στη διεύθυνση URL. Αυτό σημαίνει ότι στη διεύθυνση URL κάθε εσωτερικού συνδέσμου ιστότοπου εκχωρείται ένα αναγνωριστικό περιόδου σύνδεσης και, δεδομένου ότι αυτό το αναγνωριστικό είναι μοναδικό για την περίοδο σύνδεσης, αυτό οδηγεί στη δημιουργία νέων διευθύνσεων URL και επομένως διπλότυπου περιεχομένου.

1.3 Παράμετροι URL που χρησιμοποιούνται για παρακολούθηση και ταξινόμηση

Ένας άλλος λόγος για διπλό περιεχόμενο είναι η χρήση παραμέτρων URL που δεν αλλάζουν το περιεχόμενο της ίδιας της σελίδας, όπως σε συνδέσμους παρακολούθησης. Βλέπετε, για μια μηχανή αναζήτησης, διευθύνσεις URL http://www.example.com/keyword–x/Και http://www.example.com/keyword-x/? source=rss είναι διαφορετικά. Αυτό μπορεί να σας επιτρέψει να παρακολουθείτε ποιος πόρος έφερε επισκέπτες, αλλά ταυτόχρονα να κάνει την κατάταξη πιο δύσκολη για εσάς - μια πολύ ανεπιθύμητη συνέπεια!

Αυτό, φυσικά, δεν ισχύει μόνο για τις παραμέτρους παρακολούθησης, αλλά για όλες τις παραμέτρους που μπορούν να προστεθούν σε μια διεύθυνση URL που δεν αλλάζουν ένα θεμελιωδώς σημαντικό μέρος του περιεχομένου. Και δεν έχει σημασία για ποιο σκοπό χρησιμοποιείται αυτή η παράμετρος, είτε πρόκειται για "αλλαγές στην ταξινόμηση για μια κατηγορία προϊόντων" είτε για "εμφάνιση άλλης πλευρικής γραμμής" - οποιαδήποτε από αυτές προκαλεί την εμφάνιση διπλού περιεχομένου.

1.4 Scrappers και διανομή περιεχομένου

Ως επί το πλείστον, το διπλό περιεχόμενο είναι λάθος είτε του ιστότοπού σας είτε δικό σας. Ωστόσο, μερικές φορές το περιεχόμενό σας κοινοποιείται από άλλους ιστότοπους, με ή χωρίς τη συγκατάθεσή σας. Δεν συνδέονται πάντα με την αρχική πηγή, με αποτέλεσμα η μηχανή αναζήτησης να ασχολείται με μια άλλη έκδοση του ίδιου άρθρου. Όσο πιο δημοφιλής γίνεται ο ιστότοπός σας, τόσο περισσότερους scrapper προσελκύει, καθιστώντας το πρόβλημα όλο και χειρότερο.

1.5 Σειρά παραμέτρων

Ένας άλλος συνηθισμένος λόγος είναι ότι το CMS δεν χρησιμοποιεί ωραίες καθαρές διευθύνσεις URL, αλλά μάλλον μια διεύθυνση URL όπως / ?id=1&cat=2, στο οποίο το "ID" αναφέρεται στο άρθρο και το "cat" στην κατηγορία. URL /?cat=2&id=1θα παρουσιάσει το ίδιο αποτέλεσμα στα περισσότερα συστήματα ιστοτόπων, αλλά σε μια μηχανή αναζήτησης τα αποτελέσματα θα είναι εντελώς διαφορετικά.

1.6 Σελιδοποίηση σχολίων

Στο αγαπημένο μου WordPress, καθώς και σε κάποια άλλα συστήματα διαχείρισης περιεχομένου, υπάρχει επιλογή για σελιδοποίηση σχολίων. Αυτό έχει ως αποτέλεσμα διπλό περιεχόμενο στη διεύθυνση URL του άρθρου, καθώς τα /comment-page-1/, /comment-page-2/, κ.λπ. προστίθενται στη διεύθυνση URL του άρθρου.

1.7 Εκτυπώσιμη έκδοση σελίδων

Εάν το σύστημα διαχείρισης περιεχομένου δημιουργήσει μια εκτυπώσιμη έκδοση των σελίδων και συνδέσετε προς αυτές από το άρθρο σας, η Google πιθανότατα θα τις βρει (εκτός και αν αποκλείστηκαν σκόπιμα, φυσικά). Τώρα απαντήστε ειλικρινά: ποια έκδοση θα προτιμούσατε να δείτε στα αποτελέσματα αναζήτησης Google; Η έκδοση με τις διαφημίσεις και το υποστηρικτικό σας περιεχόμενο ή αυτή με μόνο το άρθρο;

1.8 με και χωρίς WWW

Αυτός ο λόγος είναι τόσο παλιός όσο ο κόσμος, αλλά αν είναι διαθέσιμες και οι δύο εκδόσεις του WWW και χωρίς το WWW, οι μηχανές αναζήτησης κάθε τόσο (αν και όχι συχνά) συνεχίζουν να αντιλαμβάνονται το αντίστοιχο περιεχόμενο ως διπλότυπο. Ένας άλλος λόγος (όχι τόσο δημοφιλής, αλλά τον οποίο συνάντησα επίσης) είναι το HTTP και το διπλότυπο περιεχόμενο.

2 Εννοιολογική λύση: "κανονική" διεύθυνση URL

Όπως έχουμε ήδη μάθει, όταν πολλές διευθύνσεις URL παραπέμπουν στο ίδιο περιεχόμενο, προκύπτει ένα πρόβλημα, το οποίο όμως μπορεί να λυθεί. Ένα άτομο που εργάζεται σε μια δημοσίευση δεν θα πρέπει να έχει πρόβλημα να εξηγήσει ποια θα πρέπει να είναι η "σωστή" διεύθυνση URL για ένα συγκεκριμένο άρθρο, αλλά αν ρωτήσετε τρία άτομα από την ίδια εταιρεία, μπορεί να λάβετε εντελώς διαφορετικές απαντήσεις...

Αυτό το πρόβλημα μπορεί να λυθεί μόνο με τη χρήση διευθυνσιοδότησης, καθώς, όπως και να έχει, μπορεί να υπάρχει μόνο μία διεύθυνση URL. Μια τέτοια "σωστή" διεύθυνση URL για ένα συγκεκριμένο περιεχόμενο θεωρείται από τις μηχανές αναζήτησης ως κανονική.

Ειρωνική παρατήρηση

Κανονικός» είναι ένας όρος που προέρχεται από τη ρωμαιοκαθολική παράδοση, σύμφωνα με την οποία δημιουργήθηκε ένας κατάλογος ιερών βιβλίων και έγινε αποδεκτός ως αυθεντικό. Έγιναν γνωστά ως το κανονικό Ευαγγέλιο της Καινής Διαθήκης. Κατά ειρωνικό τρόπο, η Ρωμαιοκαθολική Εκκλησία χρειάστηκε σχεδόν 300 χρόνια και πολλές μάχες για να δημιουργήσει αυτόν τον κανονικό κατάλογο. Τελικά, συμφώνησαν σε τέσσερις εκδοχές της ίδιας ιστορίας...

3 Προσδιορισμός ζητημάτων διπλότυπου περιεχομένου

Μπορεί να μην γνωρίζετε τι προκάλεσε την εμφάνιση του διπλού περιεχομένου σας, είναι ο ιστότοπος ή το ίδιο το περιεχόμενο; Υπάρχουν διάφοροι τρόποι για να μάθετε.

3.1 Google Search Console

Το Google Search Console είναι ένα εξαιρετικό εργαλείο για τον εντοπισμό διπλού περιεχομένου. Μεταβείτε στο Search Console για τον ιστότοπό σας, στη συνέχεια Προβολή Αναζήτησης -> Βελτιώσεις HTML και θα δείτε τα εξής:

Το να υπάρχουν σελίδες με διπλότυπους τίτλους ή περιγραφείς είναι σχεδόν πάντα κακό. Μόλις κάνετε κλικ, θα βρεθούν διευθύνσεις URL με διπλότυπους τίτλους ή λαβές, οι οποίες θα σας βοηθήσουν να εντοπίσετε το πρόβλημα. Σε περίπτωση που έχετε ένα άρθρο σαν αυτό που αναφέραμε προηγουμένως (λέξη-κλειδί Χ) και εμφανίζεται σε δύο κατηγορίες, μπορεί να έχει διαφορετικούς τίτλους. Για παράδειγμα, «Λέξη-κλειδί X – Κατηγορία X – Παράδειγμα τοποθεσίας» και «Λέξη-κλειδί X – Κατηγορία Υ – Παράδειγμα τοποθεσίας». Η Google δεν θα θεωρήσει αυτές τις επικεφαλίδες ως διπλότυπες, αλλά μπορούν να βρεθούν με αναζήτηση.

3.2 Αναζήτηση για τίτλους ή αποσπάσματα

Υπάρχουν αρκετοί τελεστές αναζήτησης που είναι πολύ χρήσιμοι σε περιπτώσεις όπως αυτή που περιγράφηκε παραπάνω. Εάν θέλετε να βρείτε όλες τις διευθύνσεις URL του ιστότοπού σας που περιέχουν το άρθρο "λέξη-κλειδί X", πρέπει να εισαγάγετε την ακόλουθη φράση στην αναζήτηση Google:

site:example.com intitle:"Λέξη-κλειδί X"

Στη συνέχεια, η Google θα σας εμφανίσει όλες τις σελίδες που προσδιορίζονται στο example.com και περιέχουν την καθορισμένη λέξη-κλειδί. Όσο πιο συγκεκριμένος είναι ο τίτλος, τόσο πιο εύκολο θα είναι να εξαλείψετε το διπλό περιεχόμενο. Μπορείτε να χρησιμοποιήσετε αυτήν τη μέθοδο για να αναγνωρίσετε διπλό περιεχόμενο στο Διαδίκτυο. Εάν, για παράδειγμα, ο πλήρης τίτλος του άρθρου σας είναι "Λέξη-κλειδί X - Γιατί είναι ωραίο", θα χρησιμοποιούσατε τη φράση:

intitle:"Λέξη-κλειδί X - γιατί είναι ωραία"

Και η Google θα σας δώσει όλους τους ιστότοπους που εμπίπτουν σε αυτόν τον τίτλο. Μερικές φορές είναι λογικό να αναζητήσετε ακόμη και μόνο μία ή δύο ολόκληρες προτάσεις του άρθρου σας, καθώς ορισμένα ξύστρα μπορεί να αλλάξουν τον τίτλο. Σε ορισμένες περιπτώσεις, μια τέτοια αναζήτηση μπορεί να έχει ως αποτέλεσμα την εμφάνιση της ακόλουθης ειδοποίησης στις τελικές σελίδες της αναζήτησης Google:

Αυτό είναι ένα σημάδι ότι η Google είναι ήδη απασχολημένη με την αφαίρεση διπλού περιεχομένου. Αλλά αυτό εξακολουθεί να μην είναι αρκετό, επομένως αξίζει να ακολουθήσετε τον σύνδεσμο και να δείτε όλα τα άλλα αποτελέσματα για να δείτε εάν τουλάχιστον μερικά από αυτά μπορούν να διορθωθούν.

4 Πρακτικές λύσεις σχετικά με διπλό περιεχόμενο

Αφού αποφασίσετε ποια διεύθυνση URL είναι κανονική για ένα συγκεκριμένο τμήμα του περιεχομένου σας, πρέπει να προχωρήσετε στη διαδικασία κανονικοποίησης ("ναι, ξέρω" δοκιμάστε να το πείτε τρεις φορές γρήγορα και δυνατά). Αυτό σημαίνει ότι πρέπει να ενημερώσουμε τις μηχανές αναζήτησης για την κανονική έκδοση της σελίδας και να τους επιτρέψουμε να τη βρουν όσο το δυνατόν γρηγορότερα. Υπάρχουν τέσσερις πιθανές λύσεις, με σειρά προτίμησης:

  1. Μην δημιουργείτε διπλό περιεχόμενο
  2. Ανακατεύθυνση διπλού περιεχομένου σε κανονική διεύθυνση URL
  3. Προσθέστε το χαρακτηριστικό rel=canonical σε μια σελίδα με διπλό περιεχόμενο
  4. Προσθέστε έναν σύνδεσμο HTML από μια σελίδα με διπλό περιεχόμενο στην κανονική έκδοση της σελίδας

4.1 Πώς να αποφύγετε το διπλότυπο περιεχόμενο

Μερικοί από τους παραπάνω λόγους για διπλό περιεχόμενο μπορούν να εξαλειφθούν εύκολα:

  • Οι διευθύνσεις URL σας έχουν αναγνωριστικά περιόδου σύνδεσης;Συχνά μπορείτε απλώς να τα απενεργοποιήσετε στις ρυθμίσεις συστήματος.
  • Έχετε εκτυπώσιμες εκδόσεις των σελίδων;Δεν χρειάζονται: απλά πρέπει να χρησιμοποιήσετε στυλ CSS για εκτύπωση.
  • Χρησιμοποιείτε σελιδοποίηση σχολίων στο WordPress;Απλώς πρέπει να απενεργοποιήσετε αυτήν τη δυνατότητα (στην ενότητα ρυθμίσεων του 99% των τοποθεσιών).
  • Η σειρά των παραμέτρων παραμένει ίδια;Πείτε στον προγραμματιστή σας να γράψει ένα σενάριο που θα διατάσσει πάντα τις παραμέτρους (συχνά ονομάζεται "εργοστάσιο URL").
  • Υπάρχουν προβλήματα με τους συνδέσμους παρακολούθησης;Στις περισσότερες περιπτώσεις, μπορείτε να αναπτύξετε παρακολούθηση hashtag αντί να χρησιμοποιείτε παραμέτρους.
  • Έχετε προβλήματα με "WWW και non-WWW";Επιλέξτε ένα και, στη συνέχεια, εφαρμόστε μια ανακατεύθυνση στην υπόλοιπη διεύθυνση. Μπορείτε επίσης να ορίσετε προτιμήσεις χρησιμοποιώντας τα Εργαλεία για Webmasters Google, αλλά πρέπει να είστε κάτοχος και των δύο εκδόσεων του ονόματος τομέα.

Ακόμα κι αν η επίλυση του προβλήματός σας δεν είναι εύκολη, η προσπάθεια μπορεί να αξίζει τον κόπο. Ο στόχος πρέπει να είναι να αποτραπεί το διπλότυπο περιεχόμενο, καθώς αυτή είναι μακράν η καλύτερη λύση.

4.2 301 ανακατεύθυνση διπλού περιεχομένου

Υπάρχουν φορές που απλά δεν είναι δυνατό να αποφευχθεί εντελώς το σύστημα από τη χρήση εσφαλμένων διευθύνσεων URL (για περιεχόμενο), αλλά αυτές μπορεί να είναι περιπτώσεις όπου μπορούν να χρησιμοποιηθούν ανακατευθύνσεις. Αν νομίζετε ότι αυτό δεν έχει νόημα (μπορώ να σας καταλάβω), απλώς θυμηθείτε να το θυμάστε όταν μιλάτε με τους προγραμματιστές. Καθώς εργάζεστε για την επίλυση προβλημάτων διπλού περιεχομένου, βεβαιωθείτε ότι έχετε ανακατευθύνει όλο το διπλότυπο περιεχόμενο από παλιές διευθύνσεις URL σε κανονικές διευθύνσεις URL.

4.3 Χρήση συνδέσμων

Μερικές φορές, παρόλο που γνωρίζετε ότι η διεύθυνση URL είναι λάθος, δεν θέλετε ή δεν μπορείτε να απαλλαγείτε από την διπλότυπη έκδοση του άρθρου. Για να λύσουν αυτό το πρόβλημα, οι μηχανές αναζήτησης παρουσιάζουν ένα στοιχείο κανονικού συνδέσμου, που βρίσκεται στο τμήμα κεφαλίδας του ιστότοπού σας και έχει την εξής μορφή:

σύνδεσμος rel=”canonical” href=”http://example.com/wordpress/seo-plugin/

Το χαρακτηριστικό κανονικός σύνδεσμος href είναι το σημείο όπου εκχωρείτε τη σωστή κανονική διεύθυνση URL στο άρθρο σας. Όταν μια μηχανή αναζήτησης που υποστηρίζει κανονικούς συνδέσμους συναντά ένα τέτοιο στοιχείο, εκτελεί μια ανακατεύθυνση 301, δίνοντας έτσι ουσιαστικά όλη την αξία που κερδίζει η σελίδα στην κανονική της έκδοση.

Η αλήθεια είναι ότι θα είναι πιο γρήγορο να χρησιμοποιήσετε απευθείας μια ανακατεύθυνση 301 και επομένως, εάν έχετε επιλογή, πρέπει να της δώσετε προτίμηση.

Πολλοί ιδιοκτήτες ιστότοπων εστιάζουν κυρίως στη διασφάλιση ότι το περιεχόμενο είναι μοναδικό σε σύγκριση με άλλους πόρους. Ωστόσο, δεν πρέπει να χάσετε την παρουσία διπλού περιεχομένου στον ίδιο ιστότοπο. Αυτό έχει επίσης ισχυρό αντίκτυπο στην κατάταξη.

Τι είναι διπλό περιεχόμενο

Το επαναλαμβανόμενο ή διπλό περιεχόμενο είναι ογκώδη μπλοκ κειμένου που συμπίπτουν εντός του ιστότοπου σε διαφορετικές σελίδες. Αυτό δεν γίνεται απαραίτητα με κακόβουλη πρόθεση - πιο συχνά συμβαίνει για τεχνικούς λόγους, οι οποίοι αναλύονται λεπτομερώς παρακάτω.

Ο κίνδυνος είναι ότι συχνά το διπλό περιεχόμενο δεν μπορεί να δει με γυμνό μάτι, αλλά η μηχανή αναζήτησης το βλέπει τέλεια και αντιδρά ανάλογα.

Από πού προέρχεται το διπλό περιεχόμενο και πού είναι πιο συνηθισμένο;

Οι κύριοι λόγοι για αυτό το φαινόμενο:

  • Αλλαγή της δομής του ιστότοπου.
  • Σκόπιμη χρήση για συγκεκριμένο σκοπό (για παράδειγμα, έντυπες εκδόσεις).
  • Εσφαλμένες ενέργειες προγραμματιστών και webmasters.
  • Προβλήματα με το CMS.

Για παράδειγμα, παρουσιάζεται μια συνηθισμένη κατάσταση: το replytocom (απάντηση σε ένα σχόλιο) στο WordPress δημιουργεί αυτόματα νέες σελίδες με διαφορετικές διευθύνσεις URL, αλλά όχι περιεχόμενο.

Συνήθως, παρατηρείται διπλό περιεχόμενο κατά τη δημιουργία ανακοινώσεων άρθρων σε άλλες σελίδες του ιστότοπου, τη δημοσίευση κριτικών, καθώς και όταν υπάρχουν πανομοιότυπες περιγραφές προϊόντων, κατηγοριών και επικεφαλίδων.

Γιατί το διπλό περιεχόμενο είναι κακό

Το επαναλαμβανόμενο περιεχόμενο έχει ανάλογο από τον χώρο της οικονομίας - τραπεζική υπερανάληψη. Εδώ ξοδεύεται ο λεγόμενος προϋπολογισμός ανίχνευσης. Αυτός είναι ο αριθμός των σελίδων πόρων που μπορεί να ανιχνεύσει μια μηχανή αναζήτησης σε μια συγκεκριμένη χρονική περίοδο. Ο πόρος είναι πολύ πολύτιμος και είναι καλύτερο να τον ξοδέψετε σε πραγματικά σημαντικές και σχετικές σελίδες παρά σε δεκάδες αντίγραφα πανομοιότυπου κειμένου.

Έτσι, το διπλό περιεχόμενο επιδεινώνει τη βελτιστοποίηση μηχανών αναζήτησης. Επιπλέον, οι φυσικοί σύνδεσμοι χάνονται και ο χυμός συνδέσμων κατανέμεται εσφαλμένα εντός του ιστότοπου. Και επίσης αντικαθίστανται πραγματικά σχετικές σελίδες.

Πώς να βρείτε διπλό περιεχόμενο σε έναν ιστότοπο (χειροκίνητα, προγράμματα και υπηρεσίες)

Υπάρχουν ειδικά προγράμματα για ανάλυση πόρων. Από αυτά, οι χρήστες επισημαίνουν ιδιαίτερα το Netpeak Spider. Αναζητά πλήρη αντίγραφα σελίδων, αντιστοιχίσεις ανά τίτλο ή περιγραφή ή επικεφαλίδες. Μια άλλη επιλογή είναι το Screaming Frog, το οποίο έχει παρόμοια λειτουργικότητα και ουσιαστικά διαφέρει μόνο στη διεπαφή. Υπάρχει επίσης η εφαρμογή Xenu`s Link Sleuth, η οποία λειτουργεί με παρόμοιο τρόπο με μια μηχανή αναζήτησης και είναι σε θέση να χτενίζει αρκετά αποτελεσματικά έναν ιστότοπο για διπλότυπα.

Δυστυχώς, δεν υπάρχουν εργαλεία που να μπορούν να παρακολουθούν πλήρως όλα τα διπλότυπα κειμένου. Επομένως, πιθανότατα, θα πρέπει να εκτελέσετε έναν χειροκίνητο έλεγχο. Ακολουθεί μια λίστα πιθανών παραγόντων που προκάλεσαν το πρόβλημα:


Καταλάβαμε πώς να βρούμε διπλό περιεχόμενο. Και οι καλύτεροι βοηθοί στην καταπολέμησή του είναι οι ανακατευθύνσεις 301, οι κανονικές ετικέτες URL, οι οδηγίες στο robots.txt και οι παράμετροι Nofollow και Noindex ως μέρος της μετα-ετικέτας "ρομπότ".

Ένας τρόπος για να ελέγξετε γρήγορα εάν υπάρχει διπλό περιεχόμενο σε έναν ιστότοπο είναι μια σύνθετη αναζήτηση στο Yandex ή στο Google. Πρέπει να εισαγάγετε τη διεύθυνση του ιστότοπου και ένα κομμάτι κειμένου από τη σελίδα που αποφασίσατε να ελέγξετε. Μπορείτε επίσης να χρησιμοποιήσετε πολλά προγράμματα για να ελέγξετε τη μοναδικότητα του κειμένου:

  • Text.Ru;
  • eTXT Anti-plagiarism;
  • Advego Plagiatus;
  • Περιεχόμενο-Παρακολουθήστε.

Πώς να αντιμετωπίζετε και να καθαρίζετε διπλό περιεχόμενο

Το ίδιο σύστημα βοήθειας της Google παρέχει μια σειρά από συμβουλές για να αποτρέψετε την εμφάνιση αυτού του προβλήματος.

  • 301. Όταν κάνετε δομικές αλλαγές σε έναν πόρο, πρέπει να καθορίσετε μια ανακατεύθυνση 301 στο αρχείο htaccess.
  • Χρησιμοποιήστε ένα ενιαίο πρότυπο αναφοράς.
  • Το περιεχόμενο για συγκεκριμένη περιοχή τοποθετείται καλύτερα σε τομείς ανώτατου επιπέδου παρά σε υποτομείς ή υποκαταλόγους.
  • Ορίστε την προτιμώμενη μέθοδο δημιουργίας ευρετηρίου χρησιμοποιώντας το Search Console.
  • Μην χρησιμοποιείτε πρότυπα. Αντί να τοποθετείτε κείμενο πνευματικών δικαιωμάτων σε κάθε σελίδα, είναι καλύτερο να δημιουργήσετε έναν σύνδεσμο που θα οδηγεί σε μια ξεχωριστή σελίδα με αυτό το κείμενο.
  • Κατά την ανάπτυξη νέων σελίδων, βεβαιωθείτε ότι είναι κλειστές από την ευρετηρίαση μέχρι να είναι πλήρως έτοιμες.
  • Κατανοήστε ακριβώς πώς εμφανίζεται το περιεχόμενό σας - μπορεί να υπάρχουν διαφορές στην εμφάνιση σε ιστολόγια και φόρουμ.
  • Εάν υπάρχουν πολλά παρόμοια άρθρα στον ιστότοπο, είναι προτιμότερο είτε να συνδυάσετε το περιεχόμενό τους σε ένα σύνολο είτε να μοναδικοποιήσετε το καθένα.

Οι μηχανές αναζήτησης δεν επιβάλλουν κυρώσεις σε ιστότοπους που έχουν διπλό περιεχόμενο για τεχνικούς λόγους (σε αντίθεση με αυτούς που το κάνουν σκόπιμα για να χειραγωγήσουν τα αποτελέσματα αναζήτησης ή να παραπλανήσουν τους επισκέπτες).

Αφού αφαιρεθούν τα διπλότυπα, το μόνο που μένει είναι να αφαιρεθούν από τα αποτελέσματα αναζήτησης. Το Yandex το κάνει αυτό μόνο του, υπό την προϋπόθεση ότι το αρχείο robots.txt έχει ρυθμιστεί σωστά. Όσο για την Google: θα πρέπει να ορίσετε μη αυτόματα τους κανόνες στο Webmaster, στην καρτέλα "Παράμετροι URL".

Σύναψη

Η καταπολέμηση του διπλού περιεχομένου σε έναν ιστότοπο είναι μια σημαντική πτυχή των δραστηριοτήτων του κατόχου οποιουδήποτε ιστότοπου. Υπάρχουν αρκετοί λόγοι για την εμφάνισή του και εξίσου πολλοί τρόποι για να το εξαλείψετε.

Ωστόσο, ο βασικός κανόνας παραμένει: δημοσιεύστε αποκλειστικά πρωτότυπο περιεχόμενο, ανεξάρτητα από τον τύπο του ιστότοπου. Κι ας είναι μια μεγάλη αλυσίδα καταστημάτων με χιλιάδες σελίδες.

ΛΑΒΕΤΕ ΑΝΑΚΟΙΝΩΣΕΙΣ ΠΑΡΟΜΕΩΝ ΑΝΑΡΤΗΣΕΩΝ ΣΤΟ EMAIL ΣΑΣ

Εγγραφείτε και λάβετε όχι περισσότερο από μία φορά την εβδομάδα κάτι ενδιαφέρον από τον κόσμο του διαδικτυακού μάρκετινγκ, του SEO, της προώθησης ιστοσελίδων, των ηλεκτρονικών καταστημάτων, των κερδών από ιστοσελίδες.

Πολλοί ιδιοκτήτες ιστότοπων εστιάζουν κυρίως στη διασφάλιση ότι το περιεχόμενο είναι μοναδικό σε σύγκριση με άλλους πόρους. Ωστόσο, δεν πρέπει να χάσετε την παρουσία διπλού περιεχομένου στον ίδιο ιστότοπο. Αυτό έχει επίσης ισχυρό αντίκτυπο στην κατάταξη.

Τι είναι διπλό περιεχόμενο

Το επαναλαμβανόμενο ή διπλό περιεχόμενο είναι ογκώδη μπλοκ κειμένου που συμπίπτουν εντός του ιστότοπου σε διαφορετικές σελίδες. Αυτό δεν γίνεται απαραίτητα με κακόβουλη πρόθεση - πιο συχνά συμβαίνει για τεχνικούς λόγους, οι οποίοι αναλύονται λεπτομερώς παρακάτω.

Ο κίνδυνος είναι ότι συχνά το διπλό περιεχόμενο δεν μπορεί να δει με γυμνό μάτι, αλλά η μηχανή αναζήτησης το βλέπει τέλεια και αντιδρά ανάλογα.

Από πού προέρχεται το διπλό περιεχόμενο και πού είναι πιο συνηθισμένο;

Οι κύριοι λόγοι για αυτό το φαινόμενο:

  • Αλλαγή της δομής του ιστότοπου.
  • Σκόπιμη χρήση για συγκεκριμένο σκοπό (για παράδειγμα, έντυπες εκδόσεις).
  • Εσφαλμένες ενέργειες προγραμματιστών και webmasters.
  • Προβλήματα με το CMS.

Για παράδειγμα, παρουσιάζεται μια συνηθισμένη κατάσταση: το replytocom (απάντηση σε ένα σχόλιο) στο WordPress δημιουργεί αυτόματα νέες σελίδες με διαφορετικές διευθύνσεις URL, αλλά όχι περιεχόμενο.

Συνήθως, παρατηρείται διπλό περιεχόμενο κατά τη δημιουργία ανακοινώσεων άρθρων σε άλλες σελίδες του ιστότοπου, τη δημοσίευση κριτικών, καθώς και όταν υπάρχουν πανομοιότυπες περιγραφές προϊόντων, κατηγοριών και επικεφαλίδων.

Γιατί το διπλό περιεχόμενο είναι κακό

Το επαναλαμβανόμενο περιεχόμενο έχει ανάλογο από τον χώρο της οικονομίας - τραπεζική υπερανάληψη. Εδώ ξοδεύεται ο λεγόμενος προϋπολογισμός ανίχνευσης. Αυτός είναι ο αριθμός των σελίδων πόρων που μπορεί να ανιχνεύσει μια μηχανή αναζήτησης σε μια συγκεκριμένη χρονική περίοδο. Ο πόρος είναι πολύ πολύτιμος και είναι καλύτερο να τον ξοδέψετε σε πραγματικά σημαντικές και σχετικές σελίδες παρά σε δεκάδες αντίγραφα πανομοιότυπου κειμένου.

Έτσι, το διπλό περιεχόμενο επιδεινώνει τη βελτιστοποίηση μηχανών αναζήτησης. Επιπλέον, οι φυσικοί σύνδεσμοι χάνονται και ο χυμός συνδέσμων κατανέμεται εσφαλμένα εντός του ιστότοπου. Και επίσης αντικαθίστανται πραγματικά σχετικές σελίδες.

Πώς να βρείτε διπλό περιεχόμενο σε έναν ιστότοπο (χειροκίνητα, προγράμματα και υπηρεσίες)

Υπάρχουν ειδικά προγράμματα για ανάλυση πόρων. Από αυτά, οι χρήστες επισημαίνουν ιδιαίτερα το Netpeak Spider. Αναζητά πλήρη αντίγραφα σελίδων, αντιστοιχίσεις ανά τίτλο ή περιγραφή ή επικεφαλίδες. Μια άλλη επιλογή είναι το Screaming Frog, το οποίο έχει παρόμοια λειτουργικότητα και ουσιαστικά διαφέρει μόνο στη διεπαφή. Υπάρχει επίσης η εφαρμογή Xenu`s Link Sleuth, η οποία λειτουργεί με παρόμοιο τρόπο με μια μηχανή αναζήτησης και είναι σε θέση να χτενίζει αρκετά αποτελεσματικά έναν ιστότοπο για διπλότυπα.

Δυστυχώς, δεν υπάρχουν εργαλεία που να μπορούν να παρακολουθούν πλήρως όλα τα διπλότυπα κειμένου. Επομένως, πιθανότατα, θα πρέπει να εκτελέσετε έναν χειροκίνητο έλεγχο. Ακολουθεί μια λίστα πιθανών παραγόντων που προκάλεσαν το πρόβλημα:


Καταλάβαμε πώς να βρούμε διπλό περιεχόμενο. Και οι καλύτεροι βοηθοί στην καταπολέμησή του είναι οι ανακατευθύνσεις 301, οι κανονικές ετικέτες URL, οι οδηγίες στο robots.txt και οι παράμετροι Nofollow και Noindex ως μέρος της μετα-ετικέτας "ρομπότ".

Ένας τρόπος για να ελέγξετε γρήγορα εάν υπάρχει διπλό περιεχόμενο σε έναν ιστότοπο είναι μια σύνθετη αναζήτηση στο Yandex ή στο Google. Πρέπει να εισαγάγετε τη διεύθυνση του ιστότοπου και ένα κομμάτι κειμένου από τη σελίδα που αποφασίσατε να ελέγξετε. Μπορείτε επίσης να χρησιμοποιήσετε πολλά προγράμματα για να ελέγξετε τη μοναδικότητα του κειμένου:

  • Text.Ru;
  • eTXT Anti-plagiarism;
  • Advego Plagiatus;
  • Περιεχόμενο-Παρακολουθήστε.

Πώς να αντιμετωπίζετε και να καθαρίζετε διπλό περιεχόμενο

Το ίδιο σύστημα βοήθειας της Google παρέχει μια σειρά από συμβουλές για να αποτρέψετε την εμφάνιση αυτού του προβλήματος.

  • 301. Όταν κάνετε δομικές αλλαγές σε έναν πόρο, πρέπει να καθορίσετε μια ανακατεύθυνση 301 στο αρχείο htaccess.
  • Χρησιμοποιήστε ένα ενιαίο πρότυπο αναφοράς.
  • Το περιεχόμενο για συγκεκριμένη περιοχή τοποθετείται καλύτερα σε τομείς ανώτατου επιπέδου παρά σε υποτομείς ή υποκαταλόγους.
  • Ορίστε την προτιμώμενη μέθοδο δημιουργίας ευρετηρίου χρησιμοποιώντας το Search Console.
  • Μην χρησιμοποιείτε πρότυπα. Αντί να τοποθετείτε κείμενο πνευματικών δικαιωμάτων σε κάθε σελίδα, είναι καλύτερο να δημιουργήσετε έναν σύνδεσμο που θα οδηγεί σε μια ξεχωριστή σελίδα με αυτό το κείμενο.
  • Κατά την ανάπτυξη νέων σελίδων, βεβαιωθείτε ότι είναι κλειστές από την ευρετηρίαση μέχρι να είναι πλήρως έτοιμες.
  • Κατανοήστε ακριβώς πώς εμφανίζεται το περιεχόμενό σας - μπορεί να υπάρχουν διαφορές στην εμφάνιση σε ιστολόγια και φόρουμ.
  • Εάν υπάρχουν πολλά παρόμοια άρθρα στον ιστότοπο, είναι προτιμότερο είτε να συνδυάσετε το περιεχόμενό τους σε ένα σύνολο είτε να μοναδικοποιήσετε το καθένα.

Οι μηχανές αναζήτησης δεν επιβάλλουν κυρώσεις σε ιστότοπους που έχουν διπλό περιεχόμενο για τεχνικούς λόγους (σε αντίθεση με αυτούς που το κάνουν σκόπιμα για να χειραγωγήσουν τα αποτελέσματα αναζήτησης ή να παραπλανήσουν τους επισκέπτες).

Αφού αφαιρεθούν τα διπλότυπα, το μόνο που μένει είναι να αφαιρεθούν από τα αποτελέσματα αναζήτησης. Το Yandex το κάνει αυτό μόνο του, υπό την προϋπόθεση ότι το αρχείο robots.txt έχει ρυθμιστεί σωστά. Όσο για την Google: θα πρέπει να ορίσετε μη αυτόματα τους κανόνες στο Webmaster, στην καρτέλα "Παράμετροι URL".

Σύναψη

Η καταπολέμηση του διπλού περιεχομένου σε έναν ιστότοπο είναι μια σημαντική πτυχή των δραστηριοτήτων του κατόχου οποιουδήποτε ιστότοπου. Υπάρχουν αρκετοί λόγοι για την εμφάνισή του και εξίσου πολλοί τρόποι για να το εξαλείψετε.

Ωστόσο, ο βασικός κανόνας παραμένει: δημοσιεύστε αποκλειστικά πρωτότυπο περιεχόμενο, ανεξάρτητα από τον τύπο του ιστότοπου. Κι ας είναι μια μεγάλη αλυσίδα καταστημάτων με χιλιάδες σελίδες.

ΛΑΒΕΤΕ ΑΝΑΚΟΙΝΩΣΕΙΣ ΠΑΡΟΜΕΩΝ ΑΝΑΡΤΗΣΕΩΝ ΣΤΟ EMAIL ΣΑΣ

Εγγραφείτε και λάβετε όχι περισσότερο από μία φορά την εβδομάδα κάτι ενδιαφέρον από τον κόσμο του διαδικτυακού μάρκετινγκ, του SEO, της προώθησης ιστοσελίδων, των ηλεκτρονικών καταστημάτων, των κερδών από ιστοσελίδες.

Το διπλότυπο περιεχόμενο αναφέρεται συνήθως σε μεγάλα μπλοκ πληροφοριών σε έναν ή περισσότερους τομείς, το περιεχόμενο των οποίων είναι είτε εντελώς το ίδιο είτε σχεδόν το ίδιο. Κατά κανόνα, στην περίπτωση αυτή δεν επιδιώκεται ο σκοπός της παραπλάνησης του χρήστη. Το διπλότυπο περιεχόμενο μπορεί να χρησιμοποιηθεί χωρίς κακόβουλη πρόθεση, για παράδειγμα:

  • σελίδες φόρουμ σε κανονικές εκδόσεις τοποθεσιών και εκδόσεις για κινητές συσκευές.
  • προϊόντα στο ηλεκτρονικό κατάστημα που εμφανίζονται όταν κάνετε κλικ σε διαφορετικές διευθύνσεις URL.
  • εκτυπώσιμες εκδόσεις σελίδων.

Εάν ο ιστότοπός σας έχει πολλές σελίδες με σχεδόν ίδιο περιεχόμενο, μπορείτε να καθορίσετε μια προτιμώμενη διεύθυνση URL για το Google. Αυτό μπορεί να γίνει με διάφορους τρόπους. Αυτή η διαδικασία ονομάζεται "κανονικοποίηση".

Ωστόσο, σε ορισμένες περιπτώσεις, το περιεχόμενο επαναλαμβάνεται σκόπιμα σε διαφορετικούς τομείς με σκοπό τον χειρισμό της κατάταξης στις μηχανές αναζήτησης ή την αύξηση του όγκου επισκεψιμότητας. Η χρήση παραπλανητικών τακτικών όπως αυτή μπορεί να αφήσει στους χρήστες αρνητική εντύπωση βλέποντας ουσιαστικά το ίδιο περιεχόμενο να επαναλαμβάνεται ξανά και ξανά στα αποτελέσματα αναζήτησης.

Η Google καταβάλλει κάθε δυνατή προσπάθεια για την ευρετηρίαση και την εμφάνιση σελίδων με μοναδικές πληροφορίες. Για παράδειγμα, εάν ο ιστότοπός σας έχει μια "τυπική" και μια "έντυπη" έκδοση κάθε άρθρου που δεν επισημαίνεται με τη μετα-ετικέτα noindex, μόνο μία από αυτές θα εμφανίζεται στα αποτελέσματα αναζήτησης. Σε αυτές τις σπάνιες περιπτώσεις όπου η Google πιστεύει ότι εμφανίζεται διπλό περιεχόμενο για να χειραγωγήσει τις ταξινομήσεις ή να παραπλανήσει τους χρήστες, θα κάνουμε αλλαγές στο ευρετήριο και την κατάταξη των εν λόγω ιστότοπων. Ως αποτέλεσμα, η κατάταξη του ιστότοπου μπορεί να μειωθεί ή ο ιστότοπος μπορεί να αφαιρεθεί εντελώς από το ευρετήριο της Google και να μην είναι διαθέσιμος για αναζήτηση.

Δείτε πώς μπορείτε να αποφύγετε προβλήματα διπλότυπου περιεχομένου και να διασφαλίσετε ότι οι χρήστες βλέπουν το περιεχόμενο που θέλετε.

  • Χρησιμοποιήστε το 301.Εάν έχετε αλλάξει τη δομή του ιστότοπού σας, χρησιμοποιήστε μια ανακατεύθυνση 301 ("μόνιμη ανακατεύθυνση") στο αρχείο .htaccess για να ανακατευθύνετε γρήγορα τους χρήστες, το Googlebot και διάφορα spider. (Για τον Apache, αυτό μπορεί να γίνει χρησιμοποιώντας το αρχείο .htaccess. Για τις υπηρεσίες IIS, μέσω της κονσόλας διαχειριστή.)

  • Να είστε συνεπείς. Προσπαθήστε να χρησιμοποιείτε με συνέπεια εσωτερικούς συνδέσμους. Για παράδειγμα, μην κάνετε σύνδεση με τα http://www.example.com/page/, http://www.example.com/page και http://www.example.com/page/index.htm.

  • Χρησιμοποιήστε τομείς ανώτατου επιπέδου. Για να μας βοηθήσετε να επιλέξουμε την καταλληλότερη έκδοση ενός εγγράφου, χρησιμοποιήστε τομείς ανώτατου επιπέδου όποτε είναι δυνατόν για την εμφάνιση περιεχομένου για συγκεκριμένη χώρα. Για παράδειγμα, συνιστάται η δημοσίευση περιεχομένου που σχετίζεται με τη Ρωσία στον ιστότοπο http://www.example.ru και όχι στον ιστότοπο http://www.example.com/ru ή http://ru.example. com.

  • Να είστε προσεκτικοί όταν κάνετε συνδικάτο. Εάν μοιράζεστε το περιεχόμενό σας με άλλους ιστότοπους, η Google θα σας δείχνει πάντα την έκδοση που θεωρεί πιο σχετική με τους χρήστες για κάθε αίτημα αναζήτησης. Αυτή η έκδοση δεν είναι απαραίτητα ίδια με αυτήν που θα είχατε επιλέξει. Ωστόσο, αξίζει να βεβαιωθείτε ότι όλοι οι ιστότοποι όπου δημοσιεύεται το περιεχόμενό σας έχουν έναν σύνδεσμο προς το αρχικό άρθρο. Μπορείτε επίσης να ζητήσετε από τους κατόχους ιστότοπων που χρησιμοποιούν το κοινοπρακτικό περιεχόμενό σας να το αποκλείσουν με μια μετα-ετικέτα noindex για να αποτρέψετε τις μηχανές αναζήτησης από την ευρετηρίαση των εκδόσεων τους.

  • Χρησιμοποιήστε το Search Console για να ειδοποιήσετε την Google για τη μέθοδο ευρετηρίασης που προτιμάτε.Μπορείτε να καθορίσετε συγκεκριμένα τον κύριο τομέα (για παράδειγμα, http://www.example.com ή http://example.com).

  • Αποφύγετε τις επαναλήψεις μοτίβων. Για παράδειγμα, αντί να τοποθετείτε όλο το κείμενο πνευματικών δικαιωμάτων στο κάτω μέρος κάθε σελίδας, συμπεριλάβετε μόνο τις πιο βασικές πληροφορίες με έναν σύνδεσμο προς τη σελίδα όπου παρέχεται η λεπτομερής έκδοση. Μπορείτε επίσης να χρησιμοποιήσετε το εργαλείο Επιλογές URL για να επιλέξετε τον τρόπο με τον οποίο προτιμάτε η Google να χειρίζεται τις παραμέτρους URL.

  • Μην χρησιμοποιείτε "αποκόμματα" λογισμικού.Οι χρήστες δεν ενδιαφέρονται για κενές σελίδες. Για παράδειγμα, μην δημοσιεύετε σελίδες των οποίων το περιεχόμενο δεν είναι ακόμη έτοιμο. Εάν δεν μπορείτε να κάνετε χωρίς σελίδες κράτησης θέσης, αποκλείστε τις με τη μετα-ετικέτα noindex, ώστε να μην ευρετηριαστούν.

  • Κατανοήστε το σύστημα διαχείρισης περιεχομένου σας. Εξοικειωθείτε με τον τρόπο με τον οποίο εμφανίζεται το περιεχόμενο στον ιστότοπό σας. Τα ιστολόγια, τα φόρουμ και άλλα παρόμοια συστήματα εμφανίζουν συχνά το ίδιο περιεχόμενο σε πολλές μορφές. Για παράδειγμα, μια ανάρτηση ιστολογίου μπορεί να εμφανίζεται στην κύρια σελίδα του ιστολογίου, στη σελίδα των αρχείων και στη σελίδα με άλλες αναρτήσεις - και πάντα με το ίδιο όνομα.

  • Μειώστε παρόμοιο περιεχόμενο. Εάν ο ιστότοπός σας έχει πολλές παρόμοιες σελίδες, προσθέστε μοναδικό περιεχόμενο σε καθεμία από αυτές ή συνδυάστε τις σε μία. Ας υποθέσουμε ότι έχετε έναν ταξιδιωτικό ιστότοπο με ξεχωριστές σελίδες για δύο πόλεις που παρουσιάζουν τις ίδιες πληροφορίες. Αντ' αυτού, μπορείτε να τοποθετήσετε μια σελίδα που περιγράφει και τις δύο πόλεις ή να προσθέσετε μοναδικά υλικά σε καθεμία.

Η Google δεν συνιστά τον αποκλεισμό της πρόσβασης των ανιχνευτών σε διπλότυπο περιεχόμενο χρησιμοποιώντας ένα αρχείο robots.txt ή άλλα μέσα. Εάν οι μηχανές αναζήτησης δεν έχουν τη δυνατότητα να ανιχνεύουν σελίδες με τέτοιο περιεχόμενο, τότε δεν θα μπορούν να προσδιορίσουν αυτόματα ότι διαφορετικές διευθύνσεις URL έχουν το ίδιο περιεχόμενο και θα τις αντιμετωπίζουν ως μοναδικές σελίδες. Είναι καλύτερο να επιτρέψετε την ανίχνευση αυτών των διευθύνσεων URL, αλλά να τις επισημάνετε ως ακριβή αντίγραφα χρησιμοποιώντας έναν σύνδεσμο rel="canonical", ένα εργαλείο παραμέτρων διεύθυνσης URL ή μια ανακατεύθυνση 301 Εάν η ύπαρξη πολλαπλών αντιγράφων επιβραδύνει σημαντικά την ανίχνευση της σελίδας, προσαρμόστε τη συχνότητα ανίχνευσης Search Console.

Η παρουσία διπλού περιεχομένου στον ιστότοπο δεν αποτελεί λόγο για οποιαδήποτε ενέργεια σχετικά με αυτό. Τέτοια μέτρα εφαρμόζονται μόνο εάν γίνονται με σκοπό την παραπλάνηση των χρηστών ή τη χειραγώγηση των αποτελεσμάτων αναζήτησης. Εάν αντιμετωπίζετε πρόβλημα με το διπλότυπο περιεχόμενο και δεν έχετε ακολουθήσει τις παραπάνω συμβουλές, θα επιλέξουμε την έκδοση περιεχομένου που θα εμφανίζεται στα αποτελέσματα αναζήτησης κατά την κρίση μας.

Ωστόσο, εάν η κριτική μας δείχνει ότι έχετε χρησιμοποιήσει παραπλανητικές πρακτικές και ο ιστότοπός σας έχει αφαιρεθεί από τα αποτελέσματα αναζήτησής μας, ρίξτε μια πιο προσεκτική ματιά στον ιστότοπό σας. Διαβάστε τις Οδηγίες για Webmaster και κάντε τις απαραίτητες αλλαγές. Μόλις βεβαιωθείτε ότι ο ιστότοπός σας πληροί τις απαιτήσεις, στείλτε μας ένα αίτημα.

Σε ορισμένες περιπτώσεις, οι αλγόριθμοι της Google ενδέχεται να επιλέξουν τη διεύθυνση URL ενός ιστότοπου τρίτου μέρους που περιέχει αντίγραφα του περιεχομένου σας χωρίς άδεια. Εάν το περιεχόμενό σας έχει δημοσιευτεί σε άλλο ιστότοπο κατά παραβίαση πνευματικών δικαιωμάτων, ζητήστε από τον κάτοχο του ιστότοπου να αφαιρέσει το περιεχόμενο. Μπορείτε επίσης να ζητήσετε από την Google να αφαιρέσει τη σελίδα παραβίασης από τα αποτελέσματα αναζήτησής της. Για να το κάνετε αυτό, πρέπει να υποβάλετε μια ειδοποίηση DMCA.

Ήταν αυτό το άρθρο χρήσιμο;

Πώς μπορεί να βελτιωθεί αυτό το άρθρο;

Περιεχόμενο (Αγγλικά: περιεχόμενο) - πληροφορίες, δηλαδή κείμενο, εικόνες, βίντεο, αρχεία που βρίσκονται στον ιστότοπο.
Θα πρέπει να είναι:
  1. Δίνοντας την πιο ολοκληρωμένη και κατανοητή απάντηση, λύνοντας το πρόβλημα ενός ατόμου: είτε πρόκειται για κέφι, για τέρμα σε ένα δύσκολο δίλημμα ή για αγορά ποιοτικού προϊόντος.
  2. Χωρίς τη χρήση κρυφών θραυσμάτων όπως:
  • το κείμενο έχει το ίδιο χρώμα με το φόντο,
  • το κείμενο κρύβεται από την εικόνα, που βρίσκεται πίσω από αυτό,
  • Το μέγεθος της γραμματοσειράς έχει οριστεί σε 0.
  • Δομημένα και ποικίλα σχεδιασμένα, δηλαδή εύκολα οπτικά αντιληπτά:
    • Οι κύριες ιδέες επισημαίνονται με χρώμα ή τόλμη, έτσι ώστε ο χρήστης να εστιάσει σε αυτές. Μην ξεχνάτε ότι οι ιστοσελίδες δεν διαβάζονται, αλλά ξαφρίζονται.
    • μέσω της δομής του άρθρου υλοποιείται,
    • οι προτάσεις συνδυάζονται σε παραγράφους με μια κενή γραμμή μεταξύ τους,
    • χρησιμοποιημένες λίστες, εισαγωγικά, πίνακες,
    • Χρησιμοποιήθηκαν εικόνες, γραφήματα, βίντεο, ηχογραφήσεις. Οι εικόνες παίζουν μεγάλο ρόλο. Έτσι, ένας αναγνώστης αυτού του ιστολογίου ζήτησε να μεταφραστούν οι χαρακτήρες στο στιγμιότυπο οθόνης που έδειχνε τον επεξεργαστή του Blogger.
  • Μοναδικό και πρωτότυπο (δεν μπορεί να αποκατασταθεί από νεκρούς ιστότοπους ή να ληφθεί από πόρους κάτω από φίλτρα). Οι μηχανές αναζήτησης το παρακολουθούν στενά, αντιμετωπίζουν τα διπλότυπα εξαιρετικά ανεπιθύμητα και επιβάλλουν κυρώσεις για τη χρήση παρόμοιου υλικού. Φανταστείτε την κατάσταση: κάνετε ένα ερώτημα και βλέπετε την ίδια απάντηση στα αποτελέσματα αναζήτησης. Η μελέτη πολλών πηγών που καλύπτουν το θέμα με διαφορετικούς τρόπους θα μας επιτρέψει να σχηματίσουμε μια πιο ακριβή και ευρύτερη κατανόηση του ζητήματος. Μπορείτε να ελέγξετε τη μοναδικότητα του κειμένου εισάγοντας ένα απόσπασμά του σε εισαγωγικά () στη φόρμα αναζήτησης.
  • Η αντιγραφή περιεχομένου μπορεί να παρατηρηθεί όχι μόνο όταν δημοσιεύονται δεδομένα σε διαφορετικούς ιστότοπους, αλλά και όταν επαναλαμβάνονται πληροφορίες σε δύο ή περισσότερα από ένα έργα web. Ακολουθεί ένα πείραμα στο devvver.ru σχετικά με το αρνητικό των εσωτερικών διπλότυπων και πώς οι ανταγωνιστές μπορούν να επωφεληθούν από αυτό.

    Ας εξετάσουμε ποια εργαλεία έχουμε για την καταπολέμηση αυτής της ασθένειας.

    Σύνδεσμοι στη σελίδα

    Ο μόνοςΟ 100% τρόπος για να αποτρέψετε την ευρετηρίαση μιας σελίδας είναι να μην δημοσιεύετε συνδέσμους σε αυτήν και να μην την προσθέτετε στα πρόσθετα Yandex, Googleκαι τα λοιπά.

    Αρχείο Robots.txt

    Ένα αρχείο κειμένου robots.txt (όπως το ) είναι ένα εξαιρετικό εργαλείο για τη διαχείριση της ευρετηρίασης. Βοηθήστε την Yandex, την Google. Αλλά αν η Google βρει έναν σύνδεσμο προς μια κλειστή διεύθυνση URL στο robots.txt, θα την προσθέσει στα αποτελέσματα.

    Εξαιτίας αυτού, πρέπει να εισέλθετε εδώ μόνο εκείνα τα έγγραφα ιστού στα οποία δεν είναι δυνατή η πρόσβαση με άλλο τρόπο, Για παράδειγμα, . Και φυσικά χάρτης ιστότοπουγια καλύτερη και ταχύτερη ευρετηρίαση δημοφιλών σελίδων.

    Κεφαλίδα HTTP

    Η διεύθυνση URL δεν θα ευρετηριαστεί εάν εμφανίζει 404 ή 301. Και για την Google, ακόμη και όταν υπάρχει η γραμμή

    X-Robots-Tag: noindex

    Μετα-ρομπότ ετικέτες

    Αυτό κύριο εργαλείο, επειδή λειτουργεί το ίδιο τόσο για το Yandex όσο και για την Google. Στη σελίδα, η πρόσβαση στο περιεχόμενο της οποίας θα πρέπει να απαγορεύεται, αναφέρονται τα εξής:

    Το χαρακτηριστικό rel="canonical".

    Υποχρεούμαιτο χαρακτηριστικό rel="canonical" προτείνει το προτιμώμενο από πολλά έγγραφα ιστού με πολύ παρόμοιο περιεχόμενο, για παράδειγμα, http://site/2010/07/kontent..html?showComment. Η μηχανή αναζήτησης θα αγνοήσει το δεύτερο επειδή θα υπακούει στη γραμμή:

    Yandex.Webmaster

    media="print"

    Δεν χρειάζεται να δημιουργήσετε ξεχωριστή εκτυπώσιμη έκδοση. Τα στυλ μπορούν να προσαρμοστούν χρησιμοποιώντας .

    Κατάργηση διπλότυπων που βρίσκονται στο ευρετήριο κατά λάθος

    Παρά τα μέτρα που έχουν ληφθεί, τα ρομπότ αναζήτησης ενδέχεται να ευρετηριάσουν την ανεπιθύμητη σελίδα. Με την υποβολή αιτήματος

    Ελέγξτε όλα τα αποτελέσματα αναζήτησης, ειδικά αυτά με τα αποτελέσματα της Google που έχουν παραλειφθεί. Στην ιδανική περίπτωση, αυτή η επιγραφή δεν θα πρέπει να είναι:

    Τα αποτελέσματα που παραλείφθηκαν πρέπει να αφαιρεθούν χειροκίνητα. Για το Yandex θα χρησιμοποιήσουμε τη φόρμα διαγραφής σελίδας και για το Google πρέπει να μεταβείτε στα "Εργαλεία για Webmasters" - "Βελτιστοποίηση" - "Διαγραφή διευθύνσεων URL" - "Δημιουργία νέου αιτήματος διαγραφής".



    Συνιστούμε να διαβάσετε

    Κορυφή