Παρόμοιες (διπλότυπες) σελίδες. Πώς να αναγνωρίσετε διπλό περιεχόμενο

Ηλεκτρονική 27.07.2019

Επισκόπηση προγράμματος Η έκδοση υπολογιστή του Microsoft Excel Viewer θα επιτρέψει...

Το διπλότυπο περιεχόμενο, ή απλά διπλό, είναι σελίδες στον ιστότοπό σας που είναι εντελώς (καθαρά διπλότυπα) ή εν μέρει (ασαφή διπλότυπα) ίδιες μεταξύ τους, αλλά η καθεμία έχει διαφορετική διεύθυνση URL. Μία σελίδα μπορεί να έχει ένα ή περισσότερα διπλότυπα.

Πώς εμφανίζεται το διπλό περιεχόμενο σε έναν ιστότοπο;

Τόσο για σαφείς όσο και για ασαφείς λήψεις, υπάρχουν διάφοροι λόγοι για τους οποίους εμφανίζονται. Ενδέχεται να προκύψουν καθαρά διπλότυπα για τους ακόλουθους λόγους:

Εμφανίζονται λόγω του CMS του ιστότοπου. Για παράδειγμα, χρησιμοποιώντας το replytocom στο WordPress, όταν προσθέτετε νέα σχόλια, δημιουργούνται αυτόματα νέες σελίδες που διαφέρουν μόνο ως προς τη διεύθυνση URL.
Ως αποτέλεσμα σφαλμάτων webmaster.
Λόγω αλλαγών στη δομή του ιστότοπου. Για παράδειγμα, κατά την εφαρμογή ενός ενημερωμένου προτύπου με νέες διευθύνσεις URL.
Κατασκευάστηκε από τον ιδιοκτήτη του ιστότοπου για ορισμένες λειτουργίες. Για παράδειγμα, σελίδες με εκτυπώσιμες εκδόσεις του κειμένου.

Μπορεί να εμφανιστούν ασαφή διπλότυπα στον ιστότοπό σας για τους ακόλουθους λόγους:

Γιατί το διπλό περιεχόμενο είναι επιβλαβές για έναν ιστότοπο;

Επηρεάζει αρνητικά την προώθηση στα αποτελέσματα αναζήτησης.Τα ρομπότ αναζήτησης έχουν αρνητική στάση απέναντι στο διπλότυπο περιεχόμενο και μπορούν να μειώσουν τις θέσεις τους στα αποτελέσματα αναζήτησης λόγω της έλλειψης μοναδικότητας και επομένως χρησιμότητας για τον πελάτη. Δεν έχει νόημα να διαβάζετε το ίδιο πράγμα σε διαφορετικές σελίδες του ιστότοπου.
Μπορεί να αντικαταστήσει πραγματικά σχετικές σελίδες.Το ρομπότ μπορεί να επιλέξει να επιστρέψει μια διπλότυπη σελίδα εάν θεωρεί το περιεχόμενό της πιο σχετικό με το αίτημα. Ταυτόχρονα, το διπλότυπο, κατά κανόνα, έχει χαμηλότερους δείκτες παραγόντων συμπεριφοράς ή/και μάζας συνδέσμων από τη σελίδα που προωθείτε σκόπιμα. Αυτό σημαίνει ότι το διπλό θα εμφανίζεται σε χειρότερες θέσεις.
Οδηγεί σε απώλεια φυσικών συνδέσμων.Όταν ο χρήστης κάνει έναν σύνδεσμο όχι στο πρωτότυπο, αλλά σε ένα αντίγραφο.
Προωθεί τη λανθασμένη κατανομή του βάρους εσωτερικού συνδέσμου.Τα διπλότυπα τραβούν μέρος του βάρους από τις προωθούμενες σελίδες, γεγονός που εμποδίζει επίσης την προώθηση στις μηχανές αναζήτησης.

Πώς να ελέγξετε αν έχετε διπλότυπα ή όχι;

Για να μάθετε εάν οι σελίδες του ιστότοπου έχουν διπλότυπα ή όχι, υπάρχουν διάφοροι τρόποι.

Βρήκατε διπλότυπα; Διαβάζουμε πώς να τα εξουδετερώσετε:

301η ανακατεύθυνσηΑυτή η μέθοδος θεωρείται η πιο αξιόπιστη όταν απαλλαγείτε από περιττά αντίγραφα στον ιστότοπό σας. Η ουσία της μεθόδου είναι να ανακατευθύνει το ρομπότ αναζήτησης από τη διπλότυπη σελίδα στην κύρια. Έτσι, το ρομπότ παραλείπει το διπλό και λειτουργεί μόνο με την απαιτούμενη σελίδα του ιστότοπου. Με την πάροδο του χρόνου, μετά τη ρύθμιση μιας ανακατεύθυνσης 301, οι διπλότυπες σελίδες κολλάνε μεταξύ τους και πέφτουν έξω από το ευρετήριο.
Ετικέτα . Εδώ υποδεικνύουμε στη μηχανή αναζήτησης ποια σελίδα είναι η κύρια, που προορίζεται για ευρετηρίαση. Για να το κάνετε αυτό, σε κάθε λήψη πρέπει να εισάγετε έναν ειδικό κωδικό για το ρομπότ αναζήτησης , το οποίο θα περιέχει τη διεύθυνση της κύριας σελίδας. Για να αποφύγετε να κάνετε μια τέτοια εργασία με το χέρι, υπάρχουν ειδικά πρόσθετα.
Απαγόρευση στο robots.txt. Το αρχείο robots.txt είναι ένα είδος εντολής για το ρομπότ αναζήτησης, το οποίο υποδεικνύει ποιες σελίδες πρέπει να ευρετηριαστούν και ποιες όχι. Για την απαγόρευση της ευρετηρίασης και την καταπολέμηση των διπλότυπων, χρησιμοποιείται η οδηγία Disallow. Εδώ, όπως και κατά τη ρύθμιση μιας ανακατεύθυνσης 301, είναι σημαντικό να ορίσετε σωστά την απαγόρευση.

Πώς να αφαιρέσετε τα διπλότυπα από το ευρετήριο της μηχανής αναζήτησης;

Όσο για το Yandex, αφαιρεί ανεξάρτητα τα διπλότυπα από το ευρετήριο εάν το αρχείο robots.txt έχει ρυθμιστεί σωστά. Αλλά για το Google πρέπει να ορίσετε κανόνες στην καρτέλα "Παράμετροι URL" μέσω του Google Webmaster.

Εάν αντιμετωπίζετε δυσκολίες στον έλεγχο και την εξάλειψη του διπλού περιεχομένου, μπορείτε πάντα να επικοινωνήσετε με τους ειδικούς μας. Θα βρούμε όλα τα ύποπτα στοιχεία, θα ρυθμίσουμε μια ανακατεύθυνση 301, θα κάνουμε robots.txt, rel="canonical", κάνουμε ρυθμίσεις στο Google. Γενικά, θα πραγματοποιήσουμε όλες τις εργασίες για να διασφαλίσουμε ότι ο ιστότοπός σας λειτουργεί αποτελεσματικά.

Το διπλό περιεχόμενο είναι ένα από τα κύρια προβλήματα της χαμηλής κατάταξης ιστοτόπων στις μηχανές αναζήτησης. Αυτό το πρόβλημα προκαλείται από την παρουσία στον ιστότοπο σελίδων που είναι εντελώς ή εν μέρει πανομοιότυπες μεταξύ τους. Φυσικά, για τις μηχανές αναζήτησης, η παρουσία ανεπιθύμητων σελίδων σε έναν ιστότοπο δημιουργεί σοβαρό πρόβλημα, καθώς πρέπει να ξοδέψουν ισχύ διακομιστή για την επεξεργασία τους. Δεν έχει νόημα για τις μηχανές αναζήτησης να σπαταλούν φυσικούς πόρους για την ευρετηρίαση τέτοιου άχρηστου περιεχομένου. Επομένως, καταπολεμούν τέτοιους ιστότοπους εφαρμόζοντας ένα φίλτρο σε αυτούς ή μειώνοντας την κατάταξή τους, γεγονός που οδηγεί σε χαμηλές θέσεις για προωθούμενα ερωτήματα.

Διπλότυπα και SEO

Η παρουσία διπλότυπων σελίδων στον ιστότοπο οδηγεί στα εξής:

Ο χρήσιμος χυμός συνδέσμων σπαταλάται σε αυτές τις άχρηστες σελίδες.
Μετά την επόμενη ενημέρωση, η διπλότυπη σελίδα μετατοπίζει τη σελίδα προορισμού και χάνει τη θέση της.
Το διπλότυπο περιεχόμενο μειώνει τη μοναδικότητα όλων των σελίδων στις οποίες δημοσιεύεται.
Καθώς η μηχανή αναζήτησης καταπολεμά τέτοιες σελίδες αφαιρώντας τις από την αναζήτηση, μπορεί επίσης να αποκλείσει τη σελίδα που προωθείται.

Ταξινόμηση των διπλότυπων και λύσεις για την εξάλειψή τους

Τα διπλότυπα μπορεί να είναι πλήρη ή μερικά. Τα πλήρη διπλότυπα είναι όταν οι σελίδες είναι εντελώς ίδιες. Αντίστοιχα, μερικά διπλότυπα είναι όταν οι σελίδες δεν ταιριάζουν πλήρως. Τα πλήρη διπλότυπα εξαλείφονται μέσω του robots.txt και της ρύθμισης 301 ανακατευθύνσεων. Τα μερικά διπλότυπα εξαλείφονται κάνοντας τις απαραίτητες αλλαγές στον ιστότοπο.

Ακολουθεί μια λίστα με λίστες ελέγχου που πρέπει να περάσετε για να εντοπίσετε και να λύσετε το πρόβλημα των διπλότυπων:

Αναζήτηση για διπλότυπα της κύριας σελίδας του ιστότοπου. Για παράδειγμα, μπορεί να υπάρχουν οι ακόλουθες επιλογές αρχικής σελίδας: http://www.domen.com/, http://www.domen.com/index.php, http://www.domen.com, http:// /domen.com/, https://www.domen.com/, http://www.domen.com/index.html. Όπως μπορείτε να δείτε, υπάρχουν πολλές επιλογές, αλλά η βέλτιστη επιλογή είναι η http://www.domen.com/. Για την εξάλειψη άλλων αντιγράφων της κύριας σελίδας, χρησιμοποιείται ανακατεύθυνση και κλείσιμο 301 στο robots.txt (στην περίπτωση δομών όπως η https://www.domen.com/.
Έλεγχος του θεμελιώδους (χρυσού κανόνα του SEO) - κάθε σελίδα πρέπει να είναι προσβάσιμη μόνο σε μία διεύθυνση. Οι διευθύνσεις δεν μπορούν να διαφέρουν ως εξής: http://www.domen.com/stranica1/stranica2/ και http://www.domen.com/stranica2/stranica1/.
Έλεγχος για την παρουσία μεταβλητών στη διεύθυνση URL. Δεν πρέπει να βρίσκονται στη διεύθυνση της σελίδας. Για παράδειγμα, η δημιουργία διευθύνσεων URL όπως: http://www.domen.ru/index.php?dir=4567&id=515 είναι σφάλμα. Η σωστή διεύθυνση URL θα ήταν: http://www.domen.ru/dir/4567/id/515.
Έλεγχος για την παρουσία αναγνωριστικών περιόδου σύνδεσης σε διευθύνσεις URL. Για παράδειγμα, διευθύνσεις URL όπως http://www.domen.ru/dir/4567/id/515.php?PHPSESSID=3451 δεν είναι αποδεκτές. Τέτοιες διευθύνσεις URL περιέχουν άπειρο αριθμό αντιγράφων κάθε σελίδας. Επομένως, είναι απαραίτητο να κλείσετε όλα τα αναγνωριστικά περιόδου λειτουργίας στο robots.txt.

Οι μηχανές αναζήτησης όπως η Google αντιμετωπίζουν ένα πρόβλημα – και αυτό ονομάζεται «διπλότυπο περιεχόμενο». Το περιεχόμενο ονομάζεται διπλότυπο εάν εμφανίζεται με παρόμοια μορφή σε διαφορετικά σημεία στο παγκόσμιο Διαδίκτυο (σε διαφορετικές διευθύνσεις URL), με αποτέλεσμα οι μηχανές αναζήτησης να μην γνωρίζουν ποια διεύθυνση URL να εμφανίσουν στα αποτελέσματα αναζήτησης. Αυτό μπορεί να έχει αρνητικό αντίκτυπο στην κατάταξη μιας ιστοσελίδας και όταν οι χρήστες αρχίζουν να συνδέονται με διαφορετικές εκδόσεις του ίδιου περιεχομένου, το πρόβλημα επιδεινώνεται.

Αυτό το άρθρο θα σας βοηθήσει να κατανοήσετε τις αιτίες του διπλότυπου περιεχομένου και θα σας δώσει μια κατανόηση του τι πρέπει να γίνει σε κάθε συγκεκριμένη περίπτωση.

Τι είναι το διπλότυπο περιεχόμενο;

Το διπλότυπο περιεχόμενο μπορεί να συγκριθεί με ένα σταυροδρόμι όπου τα οδικά σήματα δείχνουν προς διαφορετικές κατευθύνσεις για την ίδια τοποθεσία: ποια διαδρομή πρέπει να ακολουθήσετε; Για να γίνουν τα πράγματα χειρότερα, ο τελικός προορισμός είναι επίσης διαφορετικός, λίγο. Ως αναγνώστης, δεν σας ενδιαφέρει τόσο όσο θα βρείτε αυτό για το οποίο ήρθατε, αλλά η μηχανή αναζήτησης πρέπει να επιλέξει ποια σελίδα θα εμφανίσει στα αποτελέσματα αναζήτησης, επειδή φυσικά δεν θέλει να εμφανίζει το ίδιο περιεχόμενο επανειλημμένα.

Ας υποθέσουμε ότι το άρθρο σας σχετικά με τη λέξη-κλειδί x εμφανίζεται αμετάβλητο στις διευθύνσεις Και http://www.example.com/article-category/keyword-x/. Η κατάσταση δεν είναι τραβηγμένη: αυτό συμβαίνει σε πολλά σύγχρονα συστήματα διαχείρισης περιεχομένου. Στη συνέχεια, ας πούμε, το άρθρο σας καταλήφθηκε από αρκετούς bloggers, ορισμένοι από τους οποίους συνδέονται με την πρώτη διεύθυνση URL και άλλοι με τη δεύτερη. Αυτή είναι ακριβώς η στιγμή που το πρόβλημα της μηχανής αναζήτησης δείχνει την πραγματική του φύση - αφορά και εσάς. Το διπλότυπο περιεχόμενο είναι το πρόβλημά σας επειδή αυτοί οι σύνδεσμοι προωθούν διαφορετικές διευθύνσεις URL. Εάν συνδέονταν με την ίδια διεύθυνση URL, οι πιθανότητες κατάταξης της λέξης-κλειδιού x θα ήταν υψηλότερες.

1 Λόγοι για διπλό περιεχόμενο

Υπάρχουν δεκάδες λόγοι για τους οποίους εμφανίζεται διπλό περιεχόμενο. Τα περισσότερα από αυτά είναι τεχνικής φύσης: δεν είναι πολύ συχνά που ένα άτομο αποφασίζει να δημοσιεύσει το ίδιο περιεχόμενο σε δύο διαφορετικά μέρη χωρίς να ξεκαθαρίσει ποιο από αυτά είναι πρωτότυπο - για τους περισσότερους από εμάς αυτό φαίνεται αφύσικο. Ωστόσο, υπάρχουν πολλοί τεχνικοί λόγοι και προκύπτουν κυρίως επειδή οι προγραμματιστές σκέφτονται με τον δικό τους τρόπο - όχι όπως τα προγράμματα περιήγησης, ούτε καν σαν τους χρήστες, για να μην αναφέρουμε τις αράχνες αναζήτησης - σκέφτονται σαν προγραμματιστές. Πάρτε, για παράδειγμα, το άρθρο που αναφέρθηκε προηγουμένως, που βρίσκεται στη διεύθυνση http://www.example.com/keyword-x/ και http://www.example.com/article-category/keyword-x/. Αν ρωτήσετε τη γνώμη των προγραμματιστών, θα σας διαβεβαιώσουν ότι υπάρχει μόνο ένα άρθρο εδώ.

1.1 Παρανόηση της έννοιας του URL

Όχι, οι προγραμματιστές δεν είναι τρελοί, απλώς μιλούν διαφορετική γλώσσα. Πιθανότατα, ο ιστότοπος θα υποστηρίζεται από ένα σύστημα διαχείρισης περιεχομένου CMS και η βάση δεδομένων του θα περιέχει μόνο ένα άρθρο, αλλά το λογισμικό του ιστότοπου θα επιτρέπει την πρόσβαση σε αυτό το άρθρο μέσω πολλαπλών διευθύνσεων URL. Η παρεξήγηση συμβαίνει επειδή από την άποψη των προγραμματιστών, το μοναδικό αναγνωριστικό για ένα άρθρο είναι το αναγνωριστικό που του έχει εκχωρηθεί στη βάση δεδομένων και όχι κάποιο είδος URL. Αλλά για μια μηχανή αναζήτησης, η διεύθυνση URL είναι ένα μοναδικό αναγνωριστικό για το περιεχόμενο. Εάν εξηγήσετε την κατάσταση στους προγραμματιστές, θα αρχίσουν να κατανοούν την ουσία του προβλήματος και αφού διαβάσετε το άρθρο, μπορείτε ακόμη και να τους παρέχετε μια έτοιμη λύση.

1.2 Αναγνωριστικά περιόδου σύνδεσης

Συχνά θέλετε να παρακολουθείτε τις ενέργειες των επισκεπτών σας και να τους επιτρέπετε, για παράδειγμα, να αποθηκεύουν τα επιθυμητά προϊόντα στο καλάθι αγορών τους. Για να το πετύχετε αυτό πρέπει να τους παρέχετε μια «συνεδρία». Μια περίοδος σύνδεσης είναι ένα σύντομο ιστορικό της δραστηριότητας ενός επισκέπτη στον ιστότοπό σας, το οποίο μπορεί να περιλαμβάνει τα στοιχεία που αναφέρθηκαν προηγουμένως στο καλάθι αγορών και άλλα παρόμοια. Για να αποθηκεύσετε τη συνεδρία δραστηριότητας ενός χρήστη (ενώ συνεχίζει να κάνει κύλιση στις σελίδες του ιστότοπου), πρέπει να αποθηκεύσετε ένα μοναδικό αναγνωριστικό περιόδου σύνδεσης κάπου, που ονομάζεται επίσης αναγνωριστικό περιόδου σύνδεσης. Η πιο συνηθισμένη λύση είναι η χρήση cookies, αλλά οι μηχανές αναζήτησης συνήθως δεν τα αποθηκεύουν.

Σε αυτήν την περίπτωση, ορισμένα συστήματα σταματούν να χρησιμοποιούν αναγνωριστικά περιόδου σύνδεσης στη διεύθυνση URL. Αυτό σημαίνει ότι στη διεύθυνση URL κάθε εσωτερικού συνδέσμου ιστότοπου εκχωρείται ένα αναγνωριστικό περιόδου σύνδεσης και, δεδομένου ότι αυτό το αναγνωριστικό είναι μοναδικό για την περίοδο σύνδεσης, αυτό οδηγεί στη δημιουργία νέων διευθύνσεων URL και επομένως διπλότυπου περιεχομένου.

1.3 Παράμετροι URL που χρησιμοποιούνται για παρακολούθηση και ταξινόμηση

Ένας άλλος λόγος για διπλό περιεχόμενο είναι η χρήση παραμέτρων URL που δεν αλλάζουν το περιεχόμενο της ίδιας της σελίδας, όπως σε συνδέσμους παρακολούθησης. Βλέπετε, για μια μηχανή αναζήτησης, διευθύνσεις URL http://www.example.com/keyword–x/Και http://www.example.com/keyword-x/? source=rss είναι διαφορετικά. Αυτό μπορεί να σας επιτρέψει να παρακολουθείτε ποιος πόρος έφερε επισκέπτες, αλλά ταυτόχρονα να κάνει την κατάταξη πιο δύσκολη για εσάς - μια πολύ ανεπιθύμητη συνέπεια!

Αυτό, φυσικά, δεν ισχύει μόνο για τις παραμέτρους παρακολούθησης, αλλά για όλες τις παραμέτρους που μπορούν να προστεθούν σε μια διεύθυνση URL που δεν αλλάζουν ένα θεμελιωδώς σημαντικό μέρος του περιεχομένου. Και δεν έχει σημασία για ποιο σκοπό χρησιμοποιείται αυτή η παράμετρος, είτε πρόκειται για "αλλαγές στην ταξινόμηση για μια κατηγορία προϊόντων" είτε για "εμφάνιση άλλης πλευρικής γραμμής" - οποιαδήποτε από αυτές προκαλεί την εμφάνιση διπλού περιεχομένου.

1.4 Scrappers και διανομή περιεχομένου

Ως επί το πλείστον, το διπλό περιεχόμενο είναι λάθος είτε του ιστότοπού σας είτε δικό σας. Ωστόσο, μερικές φορές το περιεχόμενό σας κοινοποιείται από άλλους ιστότοπους, με ή χωρίς τη συγκατάθεσή σας. Δεν συνδέονται πάντα με την αρχική πηγή, με αποτέλεσμα η μηχανή αναζήτησης να ασχολείται με μια άλλη έκδοση του ίδιου άρθρου. Όσο πιο δημοφιλής γίνεται ο ιστότοπός σας, τόσο περισσότερο προσελκύει ξέστρα, κάνοντας το πρόβλημα όλο και χειρότερο.

1.5 Σειρά παραμέτρων

Ένας άλλος συνηθισμένος λόγος είναι ότι το CMS δεν χρησιμοποιεί ωραίες καθαρές διευθύνσεις URL, αλλά μάλλον μια διεύθυνση URL όπως / ?id=1&cat=2, στο οποίο το "ID" αναφέρεται στο άρθρο και το "cat" στην κατηγορία. URL /?cat=2&id=1θα παρουσιάσει το ίδιο αποτέλεσμα στα περισσότερα συστήματα ιστοτόπων, αλλά σε μια μηχανή αναζήτησης τα αποτελέσματα θα είναι εντελώς διαφορετικά.

1.6 Σελιδοποίηση σχολίων

Στο αγαπημένο μου WordPress, καθώς και σε κάποια άλλα συστήματα διαχείρισης περιεχομένου, υπάρχει επιλογή για σελιδοποίηση σχολίων. Αυτό έχει ως αποτέλεσμα διπλό περιεχόμενο στη διεύθυνση URL του άρθρου, καθώς τα /comment-page-1/, /comment-page-2/, κ.λπ. προστίθενται στη διεύθυνση URL του άρθρου.

1.7 Εκτυπώσιμη έκδοση σελίδων

Εάν το σύστημα διαχείρισης περιεχομένου δημιουργήσει μια εκτυπώσιμη έκδοση των σελίδων και συνδέσετε προς αυτές από το άρθρο σας, η Google πιθανότατα θα τις βρει (εκτός και αν αποκλείστηκαν σκόπιμα, φυσικά). Τώρα απαντήστε ειλικρινά: ποια έκδοση θα προτιμούσατε να δείτε στα αποτελέσματα αναζήτησης Google; Η έκδοση με τις διαφημίσεις και το υποστηρικτικό σας περιεχόμενο ή αυτή με μόνο το άρθρο;

1.8 με και χωρίς WWW

Αυτός ο λόγος είναι τόσο παλιός όσο ο κόσμος, αλλά αν είναι διαθέσιμες και οι δύο εκδόσεις του WWW και χωρίς το WWW, οι μηχανές αναζήτησης κάθε τόσο (αν και όχι συχνά) συνεχίζουν να αντιλαμβάνονται το αντίστοιχο περιεχόμενο ως διπλότυπο. Ένας άλλος λόγος (όχι τόσο δημοφιλής, αλλά τον οποίο συνάντησα επίσης) είναι το HTTP και το διπλότυπο περιεχόμενο.

2 Εννοιολογική λύση: "κανονική" διεύθυνση URL

Όπως έχουμε ήδη μάθει, όταν πολλές διευθύνσεις URL παραπέμπουν στο ίδιο περιεχόμενο, προκύπτει ένα πρόβλημα, το οποίο όμως μπορεί να λυθεί. Δεν θα πρέπει να είναι δύσκολο για ένα άτομο που εργάζεται σε μια δημοσίευση να εξηγήσει ποια θα πρέπει να είναι η "σωστή" διεύθυνση URL για ένα συγκεκριμένο άρθρο, αλλά αν ρωτήσετε τρία άτομα από την ίδια εταιρεία, μπορεί να λάβετε εντελώς διαφορετικές απαντήσεις...

Αυτό το πρόβλημα μπορεί να λυθεί μόνο με τη χρήση διευθυνσιοδότησης, καθώς, όπως και να έχει, μπορεί να υπάρχει μόνο μία διεύθυνση URL. Μια τέτοια "σωστή" διεύθυνση URL για ένα συγκεκριμένο περιεχόμενο θεωρείται από τις μηχανές αναζήτησης ως κανονική.

Ειρωνική παρατήρηση
Κανονικός» είναι ένας όρος που προέρχεται από τη ρωμαιοκαθολική παράδοση, σύμφωνα με την οποία δημιουργήθηκε ένας κατάλογος ιερών βιβλίων και έγινε αποδεκτός ως αυθεντικό. Έγιναν γνωστά ως το κανονικό Ευαγγέλιο της Καινής Διαθήκης. Κατά ειρωνικό τρόπο, η Ρωμαιοκαθολική Εκκλησία χρειάστηκε σχεδόν 300 χρόνια και πολλές μάχες για να δημιουργήσει αυτόν τον κανονικό κατάλογο. Τελικά, συμφώνησαν σε τέσσερις εκδοχές της ίδιας ιστορίας...

3 Προσδιορισμός ζητημάτων διπλότυπου περιεχομένου

Μπορεί να μην γνωρίζετε τι προκάλεσε την εμφάνιση του διπλού περιεχομένου σας, είναι ο ιστότοπος ή το ίδιο το περιεχόμενο; Υπάρχουν διάφοροι τρόποι για να μάθετε.

3.1 Google Search Console

Το Google Search Console είναι ένα εξαιρετικό εργαλείο για τον εντοπισμό διπλού περιεχομένου. Μεταβείτε στο Search Console για τον ιστότοπό σας και, στη συνέχεια, Προβολή αναζήτησης -> Βελτιώσεις HTML και θα δείτε τα εξής:

Το να υπάρχουν σελίδες με διπλότυπους τίτλους ή περιγραφείς είναι σχεδόν πάντα κακό. Αφού κάνετε κλικ, θα βρεθούν διευθύνσεις URL με διπλότυπους τίτλους ή λαβές, οι οποίες θα σας βοηθήσουν να εντοπίσετε το πρόβλημα. Σε περίπτωση που έχετε ένα άρθρο σαν αυτό που αναφέραμε προηγουμένως (λέξη-κλειδί Χ) και εμφανίζεται σε δύο κατηγορίες, μπορεί να έχει διαφορετικούς τίτλους. Για παράδειγμα, «Λέξη-κλειδί X – Κατηγορία X – Παράδειγμα τοποθεσίας» και «Λέξη-κλειδί X – Κατηγορία Υ – Παράδειγμα τοποθεσίας». Η Google δεν θα θεωρήσει αυτές τις επικεφαλίδες ως διπλότυπες, αλλά μπορούν να βρεθούν με αναζήτηση.

3.2 Αναζήτηση για τίτλους ή αποσπάσματα

Υπάρχουν αρκετοί τελεστές αναζήτησης που είναι πολύ χρήσιμοι σε περιπτώσεις όπως αυτή που περιγράφηκε παραπάνω. Εάν θέλετε να βρείτε όλες τις διευθύνσεις URL του ιστότοπού σας που περιέχουν το άρθρο "λέξη-κλειδί X", πρέπει να εισαγάγετε την ακόλουθη φράση στην αναζήτηση Google:

site:example.com intitle:"Λέξη-κλειδί X"

Στη συνέχεια, η Google θα σας εμφανίσει όλες τις σελίδες που προσδιορίζονται στο example.com και περιέχουν την καθορισμένη λέξη-κλειδί. Όσο πιο συγκεκριμένος είναι ο τίτλος, τόσο πιο εύκολο θα είναι να εξαλείψετε το διπλό περιεχόμενο. Μπορείτε να χρησιμοποιήσετε αυτήν τη μέθοδο για να αναγνωρίσετε διπλό περιεχόμενο στο Διαδίκτυο. Εάν, για παράδειγμα, ο πλήρης τίτλος του άρθρου σας είναι "Λέξη-κλειδί X - Γιατί είναι ωραίο", θα χρησιμοποιούσατε τη φράση:

intitle:"Λέξη-κλειδί X - γιατί είναι ωραία"

Και η Google θα σας δώσει όλους τους ιστότοπους που εμπίπτουν σε αυτόν τον τίτλο. Μερικές φορές είναι λογικό να αναζητήσετε ακόμη και μόνο μία ή δύο ολόκληρες προτάσεις από το άρθρο σας, καθώς ορισμένα ξύστρα μπορεί να αλλάξουν τον τίτλο. Σε ορισμένες περιπτώσεις, μια τέτοια αναζήτηση μπορεί να έχει ως αποτέλεσμα την εμφάνιση της ακόλουθης ειδοποίησης στις τελικές σελίδες της αναζήτησης Google:

Αυτό είναι ένα σημάδι ότι η Google είναι ήδη απασχολημένη με την αφαίρεση διπλού περιεχομένου. Αλλά αυτό εξακολουθεί να μην είναι αρκετό, επομένως αξίζει να ακολουθήσετε τον σύνδεσμο και να δείτε όλα τα άλλα αποτελέσματα για να δείτε εάν τουλάχιστον μερικά από αυτά μπορούν να διορθωθούν.

4 Πρακτικές λύσεις σχετικά με διπλό περιεχόμενο

Αφού αποφασίσετε ποια διεύθυνση URL είναι κανονική για ένα συγκεκριμένο τμήμα του περιεχομένου σας, πρέπει να προχωρήσετε στη διαδικασία κανονικοποίησης ("ναι, ξέρω" δοκιμάστε να το πείτε τρεις φορές γρήγορα και δυνατά). Αυτό σημαίνει ότι πρέπει να ενημερώσουμε τις μηχανές αναζήτησης για την κανονική έκδοση της σελίδας και να τους επιτρέψουμε να τη βρουν όσο το δυνατόν γρηγορότερα. Υπάρχουν τέσσερις πιθανές λύσεις, με σειρά προτίμησης:

Μην δημιουργείτε διπλό περιεχόμενο
Ανακατεύθυνση διπλού περιεχομένου σε κανονική διεύθυνση URL
Προσθέστε το χαρακτηριστικό rel=canonical σε μια σελίδα με διπλό περιεχόμενο
Προσθέστε έναν σύνδεσμο HTML από μια σελίδα με διπλό περιεχόμενο στην κανονική έκδοση της σελίδας

4.1 Πώς να αποφύγετε το διπλότυπο περιεχόμενο

Μερικοί από τους παραπάνω λόγους για διπλό περιεχόμενο μπορούν να εξαλειφθούν εύκολα:

Οι διευθύνσεις URL σας έχουν αναγνωριστικά περιόδου σύνδεσης;Συχνά μπορείτε απλώς να τα απενεργοποιήσετε στις ρυθμίσεις συστήματος.
Έχετε εκτυπώσιμες εκδόσεις των σελίδων;Δεν χρειάζονται: απλά πρέπει να χρησιμοποιήσετε στυλ CSS για εκτύπωση.
Χρησιμοποιείτε σελιδοποίηση σχολίων στο WordPress;Απλώς πρέπει να απενεργοποιήσετε αυτήν τη δυνατότητα (στην ενότητα ρυθμίσεων του 99% των τοποθεσιών).
Η σειρά των παραμέτρων παραμένει ίδια;Πείτε στον προγραμματιστή σας να γράψει ένα σενάριο που θα διατάσσει πάντα τις παραμέτρους (συχνά ονομάζεται "εργοστάσιο URL").
Υπάρχουν προβλήματα με τους συνδέσμους παρακολούθησης;Στις περισσότερες περιπτώσεις, μπορείτε να αναπτύξετε παρακολούθηση hashtag αντί να χρησιμοποιείτε παραμέτρους.
Έχετε προβλήματα με "WWW και non-WWW";Επιλέξτε ένα και, στη συνέχεια, εφαρμόστε μια ανακατεύθυνση στην υπόλοιπη διεύθυνση. Μπορείτε επίσης να ορίσετε προτιμήσεις χρησιμοποιώντας τα Εργαλεία για Webmasters Google, αλλά πρέπει να είστε κάτοχος και των δύο εκδόσεων του ονόματος τομέα.

Ακόμα κι αν η επίλυση του προβλήματός σας δεν είναι εύκολη, η προσπάθεια μπορεί να αξίζει τον κόπο. Ο στόχος πρέπει να είναι η αποτροπή διπλού περιεχομένου, καθώς αυτή είναι μακράν η καλύτερη λύση.

4.2 301 ανακατεύθυνση διπλού περιεχομένου

Υπάρχουν φορές που απλά δεν είναι δυνατό να αποφευχθεί εντελώς το σύστημα από τη χρήση εσφαλμένων διευθύνσεων URL (για περιεχόμενο), αλλά αυτές μπορεί να είναι περιπτώσεις όπου μπορούν να χρησιμοποιηθούν ανακατευθύνσεις. Αν νομίζετε ότι αυτό δεν έχει νόημα (μπορώ να σας καταλάβω), απλώς θυμηθείτε να το θυμάστε όταν μιλάτε με τους προγραμματιστές. Καθώς εργάζεστε για την επίλυση προβλημάτων διπλού περιεχομένου, βεβαιωθείτε ότι έχετε ανακατευθύνει όλο το διπλότυπο περιεχόμενο από παλιές διευθύνσεις URL σε κανονικές διευθύνσεις URL.

4.3 Χρήση συνδέσμων

Μερικές φορές, ακόμα κι αν γνωρίζετε ότι η διεύθυνση URL είναι λάθος, δεν θέλετε ή δεν μπορείτε να απαλλαγείτε από την διπλότυπη έκδοση του άρθρου. Για να λύσουν αυτό το πρόβλημα, οι μηχανές αναζήτησης παρουσιάζουν ένα στοιχείο κανονικού συνδέσμου, που βρίσκεται στο τμήμα κεφαλίδας του ιστότοπού σας και έχει την εξής μορφή:

σύνδεσμος rel=”canonical” href=”http://example.com/wordpress/seo-plugin/

Το χαρακτηριστικό κανονικός σύνδεσμος href είναι το σημείο όπου εκχωρείτε τη σωστή κανονική διεύθυνση URL στο άρθρο σας. Όταν μια μηχανή αναζήτησης που υποστηρίζει κανονικούς συνδέσμους συναντά ένα τέτοιο στοιχείο, εκτελεί μια ανακατεύθυνση 301, δίνοντας έτσι ουσιαστικά όλη την αξία που κερδίζει η σελίδα στην κανονική της έκδοση.

Η αλήθεια είναι ότι θα είναι πιο γρήγορο να χρησιμοποιήσετε απευθείας μια ανακατεύθυνση 301 και επομένως, εάν έχετε επιλογή, πρέπει να της δώσετε προτίμηση.

Διπλότυπο Περιεχόμενομπορεί να χωριστεί σε τρεις μεγάλες κατηγορίες: ακριβές διπλότυπο, όπου δύο διευθύνσεις URL έχουν εντελώς ίδιο περιεχόμενο, περιεχόμενο με μικρές διαφορές(σειρά πρότασης, ελαφρώς διαφορετικές εικόνες κ.λπ.) και διπλότυπα μεταξύ τομέων, όπου υπάρχει ακριβές ή ελαφρώς τροποποιημένο αντίγραφο σε πολλούς τομείς.

Υπάρχουν δύο σχετικές έννοιες που δεν θεωρούνται το ίδιο πράγμα με το διπλό περιεχόμενο από την Google, αλλά συχνά συγχέουν τους εκδότες και τους άπειρους SEO:

λεπτό περιεχόμενο -Όπως αναφέρθηκε προηγουμένως, αυτές είναι σελίδες που έχουν πολύ λίγο περιεχόμενο. Ένα παράδειγμα είναι ένα σύνολο σελίδων χτισμένο σε μια λίστα διευθύνσεων οργανισμού που έχει 5.000 διευθύνσεις, αλλά κάθε σελίδα περιέχει μόνο μία διεύθυνση - λίγες μόνο γραμμές.
περικοπή περιεχομένου -Σελίδες που διαφέρουν ελαφρώς μεταξύ τους ανήκουν σε αυτήν την κατηγορία. Φανταστείτε έναν ιστότοπο που πουλά παπούτσια Nike Air Max που κυκλοφορούν σε μεγέθη 37, 37,5, 38, 38,5, 39, ... 46. Εάν ο ιστότοπος έχει ξεχωριστή σελίδα για κάθε μέγεθος παπουτσιού, τότε η διαφορά μεταξύ όλων αυτών των σελίδων θα είναι ασήμαντη. Η Google ονομάζει αυτό το εφέ σε λεπτές φέτες.

Στην Google δεν αρέσει το λεπτό περιεχόμενο ή η λεπτή κοπή. Οποιοδήποτε από αυτά τα εφέ μπορεί να ανιχνευθεί από τον αλγόριθμο Panda . Δεν είναι σαφές πώς ακριβώς το Bing διαφοροποιεί το διπλό περιεχόμενο, το λεπτό περιεχόμενο και τον τεμαχισμό περιεχομένου, αλλά είναι σαφές ότι οι εκδότες πρέπει να αποφεύγουν τη δημιουργία αυτού του τύπου σελίδων.

Διπλότυπο περιεχόμενο μπορεί να προκύψει για πολλούς λόγους, όπως η αδειοδότηση του περιεχομένου του ιστότοπού σας, ελαττώματα στην αρχιτεκτονική του ιστότοπου λόγω ενός συστήματος διαχείρισης περιεχομένου που δεν είναι βελτιστοποιημένο για μηχανές αναζήτησης ή λόγω της παρουσίας λογοκλοπής. Τα τελευταία πέντε χρόνια, οι αποστολείς ανεπιθύμητων μηνυμάτων που διψούν για περιεχόμενο άρχισαν να αφαιρούν περιεχόμενο από νόμιμες πηγές, να αναδιατάσσουν λέξεις μέσω μιας ποικιλίας περίπλοκων διαδικασιών και να τοποθετούν το κείμενο που προκύπτει στις σελίδες τους για να προσελκύουν μακροχρόνιες αναζητήσεις και να εμφανίζουν διαφημίσεις με βάση τα συμφραζόμενα, καθώς και για άλλες ανέντιμους σκοπούς.

Έτσι, σήμερα ζούμε σε έναν κόσμο «προβλημάτων διπλού περιεχομένου» και «κυρώσεων διπλού περιεχομένου». Ακολουθούν ορισμένοι ορισμοί που θα είναι χρήσιμοι για τη συζήτησή μας.

Μοναδικό περιεχόμενο-γραμμένο από άνθρωπο, εντελώς διαφορετικό από οποιονδήποτε άλλο συνδυασμό γραμμάτων, συμβόλων και λέξεων στον Παγκόσμιο Ιστό και δεν επηρεάζεται από αλγόριθμους επεξεργασίας κειμένου υπολογιστή (όπως εργαλεία spammer που χρησιμοποιούν αλυσίδες Markov).
Θραύσματα -Αυτά είναι μικρά κομμάτια περιεχομένου (όπως εισαγωγικά) που αντιγράφονται και επαναχρησιμοποιούνται ξανά και ξανά. Δεν αποτελούν σχεδόν ποτέ πρόβλημα για τις μηχανές αναζήτησης, ειδικά όταν περιλαμβάνονται σε ένα μεγαλύτερο έγγραφο με πολύ μοναδικό περιεχόμενο.
έρπητας ζωστήρας -Οι μηχανές αναζήτησης αναζητούν σχετικά μικρά τμήματα φράσεων (πέντε έως έξι λέξεις) σε άλλες σελίδες στον Παγκόσμιο Ιστό. Εάν δύο έγγραφα έχουν πάρα πολλά κοινά έρπητα ζωστήρα, τότε οι μηχανές αναζήτησης ενδέχεται να ερμηνεύσουν αυτά τα έγγραφα ως διπλό περιεχόμενο.
Διπλότυπα ζητήματα περιεχομένου -Αυτή η φράση συνήθως χρησιμεύει για να υποδεικνύει διπλό περιεχόμενο, για το οποίο ο ιστότοπος μπορεί να τιμωρηθεί. Ένα τέτοιο περιεχόμενο είναι απλώς ένα αντίγραφο μιας υπάρχουσας σελίδας, αναγκάζοντας τη μηχανή αναζήτησης να επιλέξει ποια έκδοση θα εμφανίσει στο ευρετήριο (αυτό είναι το λεγόμενο διπλό φίλτρο περιεχομένου).
Διπλότυπο φίλτρο περιεχομένου -μια κατάσταση όπου μια μηχανή αναζήτησης αφαιρεί παρόμοιο περιεχόμενο από τα αποτελέσματα αναζήτησης προκειμένου να παρέχει καλύτερα αποτελέσματα στον χρήστη.
Ποινή για διπλό περιεχόμενο -πρόστιμα (ποινές) χρησιμοποιούνται σπάνια και μόνο σε προφανείς καταστάσεις. Οι μηχανές αναζήτησης μπορεί να μειώσουν την κατάταξη ή να αποκλείσουν τις υπόλοιπες σελίδες του ιστότοπου ή ακόμα και να απαγορεύσουν ολόκληρο τον ιστότοπο.

Συνέπειες του Διπλότυπου Περιεχομένου

Αν υποθέσουμε ότι το διπλότυπο περιεχόμενό σας είναι αποτέλεσμα μιας αβλαβούς παράβλεψης εκ μέρους των προγραμματιστών σας, η μηχανή αναζήτησης πιθανότατα θα φιλτράρει όλες τις διπλότυπες σελίδες (εκτός από μία), επειδή θέλει να εμφανίσει μόνο μία έκδοση αυτού του περιεχομένου στις σελίδες αποτελεσμάτων αναζήτησης. Σε ορισμένες περιπτώσεις, η μηχανή αναζήτησης μπορεί να φιλτράρει τα αποτελέσματα προτού συμπεριληφθούν στο ευρετήριο και σε άλλες περιπτώσεις, μπορεί να επιτρέψει την ευρετηρίαση της σελίδας και να τη φιλτράρει κατά την προετοιμασία των αποτελεσμάτων αναζήτησης ως απόκριση σε ένα συγκεκριμένο ερώτημα. Σε αυτήν την τελευταία περίπτωση, η σελίδα μπορεί να φιλτραριστεί ως απάντηση σε ορισμένα συγκεκριμένα ερωτήματα και να μην φιλτραριστεί για άλλα.

Οι χρήστες θέλουν να βλέπουν ποικιλία στα αποτελέσματα (όχι τα ίδια αποτελέσματα ξανά και ξανά). Επομένως, οι μηχανές αναζήτησης προσπαθούν να φιλτράρουν το διπλό περιεχόμενο και αυτό έχει τις ακόλουθες συνέπειες:

Ένα ρομπότ μηχανής αναζήτησης έρχεται σε έναν ιστότοπο με συγκεκριμένο προϋπολογισμό προβολής, που εκφράζεται στον αριθμό των σελίδων που σκοπεύει να δει σε κάθε συγκεκριμένη συνεδρία. Κάθε φορά που προσγειώνεται σε μια διπλότυπη σελίδα που θα πρέπει απλώς να φιλτραριστεί από τα αποτελέσματα αναζήτησης, επιτρέπετε στο ρομπότ να σπαταλήσει μέρος του προϋπολογισμού ανίχνευσης. Αυτό σημαίνει ότι λιγότερες από τις «καλές» σελίδες σας θα προβληθούν και θα έχει ως αποτέλεσμα λιγότερες από τις σελίδες σας να περιλαμβάνονται στο ευρετήριο της μηχανής αναζήτησης.
Παρόλο που οι μηχανές αναζήτησης προσπαθούν να φιλτράρουν το διπλό περιεχόμενο, οι σύνδεσμοι σε σελίδες διπλού περιεχομένου εξακολουθούν να τους μεταδίδουν χυμό συνδέσμων. Επομένως, οι διπλότυπες σελίδες μπορούν να αποκτήσουν PageRank ή "link juice", και επειδή αυτό δεν τις βοηθά να ταξινομηθούν, αυτός ο πόρος σπαταλιέται.
Καμία από τις μηχανές αναζήτησης δεν έχει παράσχει σαφή εξήγηση για το πώς ο αλγόριθμός τους επιλέγει ποια έκδοση της σελίδας θα εμφανίσει. Με άλλα λόγια, αν εντοπίσει τρία αντίγραφα του ίδιου περιεχομένου, ποια από αυτά θα φιλτράρει; Ποιο θα δείξει; Εξαρτάται από το ερώτημα αναζήτησης; Ως αποτέλεσμα, η μηχανή αναζήτησης ενδέχεται να μην εμφανίζει την έκδοση που χρειάζεστε.

Αν και ορισμένοι ειδικοί βελτιστοποίησης ενδέχεται να διαφωνήσουν με ορισμένα από τα σημεία που παρουσιάζονται εδώ, η συνολική δομή είναι ουσιαστικά αδιαμφισβήτητη. Ωστόσο, υπάρχουν αρκετά προβλήματα με τα όρια αυτού του μοντέλου.

Για παράδειγμα, ο ιστότοπός σας έχει μια ομάδα σελίδων προϊόντων, καθώς και εκτυπώσιμες εκδόσεις αυτών των σελίδων. Η μηχανή αναζήτησης μπορεί να επιλέξει να εμφανίσει την εκτυπώσιμη έκδοση στα αποτελέσματά της. Αυτό συμβαίνει μερικές φορές και μπορεί να συμβεί ακόμα και όταν η σελίδα εκτύπωσης έχει λιγότερους συνδέσμους και χαμηλότερη κατάταξη από την κύρια σελίδα προϊόντος.

Για να διορθώσετε αυτήν την κατάσταση, πρέπει να εφαρμόσετε το χαρακτηριστικό link rel=”canonical” σε όλες τις διπλότυπες εκδόσεις της σελίδας για να υποδείξετε την κύρια έκδοση.

Η δεύτερη επιλογή μπορεί να προκύψει όταν κοινοποιείτε το περιεχόμενό σας (επιτρέπετε την αναδημοσίευση του περιεχομένου σας) σε τρίτους. Το πρόβλημα είναι ότι η μηχανή αναζήτησης μπορεί να πετάξει το πρωτότυπό σας από τα αποτελέσματα αναζήτησης και να προτιμήσει την έκδοση που χρησιμοποιείται από το άτομο που αναδημοσίευσε το άρθρο σας. Υπάρχουν τρεις πιθανές λύσεις σε αυτό το πρόβλημα:

Ζητήστε από το άτομο που αναδημοσίευσε το άρθρο σας να συνδεθεί πίσω στο αρχικό άρθρο στον ιστότοπό σας με το χαρακτηριστικό rel=”canonical”. Αυτό θα υποδείξει στις μηχανές αναζήτησης ότι το αντίγραφο της σελίδας σας είναι το πρωτότυπο και ότι τυχόν σύνδεσμοι που οδηγούν στην κοινοπρακτική σελίδα θα πιστωθούν στην αρχική σας σελίδα.
ζητήστε από τον συνεργάτη σας να κλείσει το αντίγραφό του με το χαρακτηριστικό noindex. Σε αυτήν την περίπτωση, το διπλό περιεχόμενο απλώς δεν θα ευρετηριαστεί από τη μηχανή αναζήτησης. Επιπλέον, τυχόν σύνδεσμοι σε αυτό το περιεχόμενο προς τον ιστότοπό σας θα συνεχίσουν να σας δίνουν εξουσιοδότηση.
ζητήστε από τον συνεργάτη σας να συνδεθεί πίσω στην αρχική σελίδα στον ιστότοπό σας. Οι μηχανές αναζήτησης συνήθως το ερμηνεύουν σωστά και επισημαίνουν την εκδοχή του περιεχομένου σας. Ωστόσο, θα πρέπει να σημειωθεί ότι υπήρξαν περιπτώσεις όπου η Google έχει καθορίσει εσφαλμένα την πατρότητα του περιεχομένου και έχει εκχωρήσει την απόδοση στον ιστότοπο που το αναδημοσίευσε, ειδικά εάν αυτός ο ιστότοπος έχει πολύ μεγαλύτερη εξουσία και εμπιστοσύνη από την πραγματική αρχική πηγή του περιεχομένου.

Πώς αναγνωρίζουν οι μηχανές αναζήτησης διπλό περιεχόμενο;

Θα παρουσιάσουμε τη διαδικασία αναζήτησης διπλού περιεχομένου στον Παγκόσμιο Ιστό για τη μηχανή Google με παραδείγματα. Στα παραδείγματα που παρουσιάζονται στο Σχ. 1-4, γίνονται τρεις υποθέσεις:

μια σελίδα με κείμενο είναι μια σελίδα που περιέχει διπλό περιεχόμενο (και όχι μόνο ένα απόσπασμά του, όπως φαίνεται στις εικόνες).
Όλες οι σελίδες με διπλό περιεχόμενο βρίσκονται σε διαφορετικούς τομείς.
Τα βήματα που φαίνονται παρακάτω έχουν απλοποιηθεί για να γίνει η διαδικασία όσο το δυνατόν πιο εύκολη και απλή. Αυτή σίγουρα δεν είναι μια ακριβής περιγραφή του τρόπου λειτουργίας της Google, αλλά καταλαβαίνει την ουσία.

Ρύζι. 1

Ρύζι. 2

Ρύζι. 3

Ρύζι. 4

Υπάρχουν πολλά γεγονότα σχετικά με το διπλό περιεχόμενο που αξίζουν ιδιαίτερης αναφοράς, επειδή μπορούν να μπερδέψουν έναν webmaster που είναι νέος στο θέμα του διπλού περιεχομένου. Ας εξετάσουμε αυτούς τους παράγοντες.

Διπλότυπη τοποθεσία περιεχομένου -αν όλο αυτό το περιεχόμενο βρίσκεται στον ιστότοπό μου, είναι διπλό; Ναι, επειδή μπορεί να προκύψει διπλότυπο περιεχόμενο τόσο σε έναν ιστότοπο όσο και σε διαφορετικούς ιστότοπους.
Ποσοστό διπλότυπου περιεχομένου -Ποιο ποσοστό μιας σελίδας πρέπει να αντιγραφεί για να πληροί τις προϋποθέσεις για φιλτράρισμα διπλότυπου περιεχομένου; Δυστυχώς, οι μηχανές αναζήτησης δεν αποκαλύπτουν ποτέ αυτές τις πληροφορίες γιατί θα έβλαπτε την ικανότητά τους να αποτρέψουν το ίδιο το πρόβλημα.
Μπορούμε σχεδόν με σιγουριά να πούμε ότι αυτό το ποσοστό αλλάζει συνεχώς για όλους τους κινητήρες και κατά τον εντοπισμό διπλού περιεχομένου, δεν γίνεται μόνο μια άμεση σύγκριση. Η ουσία είναι ότι οι σελίδες δεν χρειάζεται να είναι πανομοιότυπες για να θεωρούνται διπλότυπες.
Συσχέτιση μεταξύ κώδικα και κειμένου -τι γίνεται αν ο κώδικάς μας είναι πολύ μεγάλος, αλλά υπάρχουν λίγα μοναδικά στοιχεία HTML στη σελίδα; Θα σκεφτεί η Google ότι όλες οι σελίδες είναι διπλότυπα η μία της άλλης; Οχι. Οι μηχανές αναζήτησης δεν ενδιαφέρονται για τον κώδικά σας, ενδιαφέρονται για το περιεχόμενο των σελίδων σας. Το μέγεθος του κώδικα γίνεται πρόβλημα μόνο όταν γίνεται υπερβολικό.
Η αναλογία των στοιχείων πλοήγησης και του μοναδικού περιεχομένου -Όλες οι σελίδες στον ιστότοπό μου έχουν μεγάλη γραμμή πλοήγησης, πολλές κεφαλίδες και υποσέλιδα, αλλά πολύ λίγο περιεχόμενο. Θα θεωρήσει η Google όλες αυτές τις σελίδες ως διπλότυπες; Οχι. Η Google (και το Yahoo! και το Bing) εξετάζουν τα στοιχεία πλοήγησης προτού αξιολογήσει τις σελίδες για αντιγραφή. Είναι εξοικειωμένοι με τη διάταξη ιστότοπου και κατανοούν ότι είναι απολύτως φυσιολογικό να υπάρχουν συνεπείς δομές σε όλες τις σελίδες (ή σε πολλές από αυτές). Προσέχουν τα μοναδικά μέρη των σελίδων και αγνοούν σχεδόν εντελώς τα υπόλοιπα.
Περιεχόμενο με άδεια χρήσης -τι γίνεται αν θέλω να αποφύγω ζητήματα διπλού περιεχομένου, αλλά έχω περιεχόμενο από άλλες πηγές ιστού για τις οποίες έχω άδεια να εμφανίζω στους επισκέπτες μου; Χρησιμοποιήστε τον κωδικό meta name = "robots" content="noindex, follow" . Τοποθετήστε τον στην κεφαλίδα της σελίδας σας και οι μηχανές αναζήτησης θα καταλάβουν ότι αυτό το περιεχόμενο δεν είναι για αυτές. Αυτή είναι μια βέλτιστη πρακτική, καθώς οι χρήστες θα εξακολουθούν να μπορούν να επισκεφθείτε αυτήν τη σελίδα και συνδέστε τη, και οι σύνδεσμοι σε αυτήν τη σελίδα θα διατηρήσουν την αξία τους.

Μια άλλη επιλογή είναι να αποκτήσετε αποκλειστικά δικαιώματα κατοχής και δημοσίευσης αυτού του περιεχομένου.

Εντοπισμός και εξάλειψη παραβιάσεων πνευματικών δικαιωμάτων

Ένας από τους καλύτερους τρόπους παρακολούθησης διπλοτύπων στον ιστότοπό σας είναι να χρησιμοποιήσετε το CopyScape (copyscape.com), το οποίο σας επιτρέπει να βλέπετε αμέσως τις σελίδες στον Παγκόσμιο Ιστό που χρησιμοποιούν το περιεχόμενό σας. Μην ανησυχείτε εάν οι σελίδες αυτών των ιστότοπων βρίσκονται στο δευτερεύον ευρετήριο ή κατατάσσονται σημαντικά χαμηλότερα από τη δική σας - εάν κάποιος μεγάλος, έγκυρος, πλούσιος σε περιεχόμενο τομέας προσπαθούσε να καταπολεμήσει όλα τα αντίγραφα του υλικού του στον Παγκόσμιο Ιστό, θα χρειάζονται τουλάχιστον δύο άτομα πλήρους απασχόλησης. Ευτυχώς, οι μηχανές αναζήτησης εμπιστεύονται τέτοιους ιστότοπους και ως εκ τούτου τους αναγνωρίζουν ως πρωτότυπες πηγές.

Από την άλλη πλευρά, εάν έχετε έναν σχετικά νέο ιστότοπο ή έναν ιστότοπο με λίγους εισερχόμενους συνδέσμους και οι λογοκλοπές κατατάσσονται συνεχώς πάνω από εσάς (ή κάποιος ισχυρός ιστότοπος κλέβει τη δουλειά σας), τότε υπάρχουν μερικά πράγματα που μπορείτε να κάνετε. Μια επιλογή είναι να στείλετε ένα αίτημα στον εκδότη ζητώντας του να αφαιρέσει το περιεχόμενο που παραβιάζει. Σε ορισμένες περιπτώσεις, ο εκδότης απλώς αγνοούσε την παραβίαση πνευματικών δικαιωμάτων. Μια άλλη επιλογή είναι να γράψετε στον πάροχο φιλοξενίας. Οι εταιρείες φιλοξενίας μπορεί ενδεχομένως να είναι υπεύθυνες για τη φιλοξενία διπλού περιεχομένου, επομένως συχνά απαντούν γρήγορα σε τέτοια αιτήματα. Απλώς βεβαιωθείτε ότι είστε έτοιμοι να παρέχετε όσο το δυνατόν περισσότερη τεκμηρίωση για να αποδείξετε την πατρότητα του περιεχομένου.

Η επόμενη επιλογή είναι να υποβάλετε ένα αίτημα παραβίασης πνευματικών δικαιωμάτων (DMCA) στην Google, Yahoo! και Bing. Θα πρέπει επίσης να στείλετε το ίδιο αίτημα στην εταιρεία που φιλοξενεί τον ιστότοπο του παραβάτη.

Η δεύτερη επιλογή είναι να κινήσετε νομική ενέργεια κατά του παραβατικού ιστότοπου ή να απειλήσετε να το κάνετε. Εάν ο ιστότοπος που δημοσιεύει την εργασία σας ανήκει στη χώρα σας, τότε αυτή η επιλογή είναι ίσως το πιο έξυπνο πρώτο βήμα. Ίσως θελήσετε να ξεκινήσετε με πιο ανεπίσημη επικοινωνία και να ζητήσετε να αφαιρεθεί το περιεχόμενο πριν καν στείλετε μια επίσημη επιστολή από δικηγόρο, καθώς μπορεί να περάσουν μήνες πριν τεθεί σε ισχύ η ενέργεια DMCA της εταιρείας. Αν όμως δεν λάβετε απάντηση, τότε δεν έχετε λόγο να καθυστερήσετε πιο σοβαρές ενέργειες.

Μια πολύ αποτελεσματική και φθηνή επιλογή για αυτή τη διαδικασία είναι το DCMA.com.

Κατάσταση με πραγματικά πρόστιμο

Τα προηγούμενα παραδείγματα δείχνουν πώς λειτουργούν τα διπλότυπα φίλτρα περιεχομένου, αλλά αυτά δεν είναι πρόστιμα, αν και από πρακτική άποψη το αποτέλεσμα είναι το ίδιο με τα πρόστιμα - μείωση της κατάταξης των σελίδων σας. Ωστόσο, υπάρχουν επίσης περιπτώσεις όπου μπορεί να προκύψει πραγματικό πρόστιμο. Για παράδειγμα, οι ιστότοποι που συγκεντρώνουν περιεχόμενο κινδυνεύουν, ειδικά εάν ο ίδιος ο ιστότοπος προσθέτει ελάχιστο μοναδικό περιεχόμενο. Σε ένα τέτοιο σενάριο, ο ιστότοπος θα μπορούσε να επιβληθεί πρόστιμο.

Αυτό μπορεί να διορθωθεί μόνο με τη μείωση του αριθμού των διπλότυπων σελίδων που είναι διαθέσιμες στο spider της μηχανής αναζήτησης. Αυτό επιτυγχάνεται με την κατάργησή τους, την προσθήκη ενός κανονικού χαρακτηριστικού σε διπλότυπα, ενός χαρακτηριστικού noindex στις ίδιες τις σελίδες ή με την προσθήκη ενός σημαντικού όγκου μοναδικού περιεχομένου.

Ένα παράδειγμα περιεχομένου που μπορεί να φιλτράρεται συχνά είναι "λεπτός" ιστότοπος συνεργατών.Αυτό είναι συχνά το όνομα που δίνεται σε έναν ιστότοπο που προωθεί τις πωλήσεις προϊόντων άλλων για να κερδίσετε προμήθειες, αλλά δεν παρέχει νέες πληροφορίες. Ένας τέτοιος ιστότοπος θα μπορούσε να λάβει περιγραφές από τον κατασκευαστή του προϊόντος και απλώς να αναπαράγει αυτές τις περιγραφές μαζί με έναν σύνδεσμο προς μια θυγατρική, προκειμένου να κερδίσει χρήματα από "κλικ" ή αγορές.

Το πρόβλημα προκύπτει όταν ένας έμπορος έχει χιλιάδες συνεργάτες που χρησιμοποιούν το ίδιο περιεχόμενο - και οι μηχανικοί μηχανών αναζήτησης έχουν λάβει σχόλια από χρήστες ότι (από την άποψή τους) τέτοιοι ιστότοποι δεν προσθέτουν τίποτα σημαντικό στα ευρετήριά τους. Επομένως, οι μηχανές αναζήτησης προσπαθούν να φιλτράρουν τέτοιους ιστότοπους ή ακόμη και να τους αποκλείσουν από τα ευρετήριά τους. Πολλοί ιστότοποι χρησιμοποιούν μοντέλα συνεργατών, αλλά παρέχουν επίσης πλούσιο νέο περιεχόμενο, επομένως συνήθως δεν αντιμετωπίζουν προβλήματα. Οι μηχανές αναζήτησης αναλαμβάνουν δράση μόνο όταν υπάρχει αντιγραφή περιεχομένου και έλλειψη μοναδικού πολύτιμου υλικού.

Πώς να αποφύγετε το διπλότυπο περιεχόμενο στον ιστότοπο;

Όπως σημειώσαμε νωρίτερα, το διπλό περιεχόμενο μπορεί να δημιουργηθεί με πολλούς τρόπους. Η εσωτερική αντιγραφή υλικού απαιτεί τη χρήση συγκεκριμένων τακτικών για την επίτευξη των καλύτερων αποτελεσμάτων από την άποψη της βελτιστοποίησης. Σε πολλές περιπτώσεις, οι διπλότυπες σελίδες είναι σελίδες που δεν έχουν καμία αξία ούτε για τους χρήστες ούτε για τις μηχανές αναζήτησης. Εάν συμβαίνει αυτό, προσπαθήστε να διορθώσετε πλήρως το πρόβλημα. Τροποποιήστε την εφαρμογή σας έτσι ώστε μόνο μία διεύθυνση URL να συνδέεται σε κάθε σελίδα. Κάντε επίσης μια ανακατεύθυνση 301 για τις παλιές διευθύνσεις URL στις υπόλοιπες διευθύνσεις URL , για να βοηθήσετε τις μηχανές αναζήτησης να δουν τις αλλαγές που κάνατε όσο το δυνατόν γρηγορότερα και να διατηρήσουν τον «χυμό συνδέσμων» που είχαν οι διαγραμμένες σελίδες.

Εάν αυτό δεν είναι δυνατό, τότε υπάρχουν πολλές άλλες επιλογές. . Ακολουθεί μια περίληψη καθοδήγησης σχετικά με τις απλούστερες λύσεις για μια μεγάλη ποικιλία σεναρίων:

χρησιμοποιήστε το αρχείο robots.txt για να αποκλείσετε τις αράχνες των μηχανών αναζήτησης, ώστε να μην ανιχνεύονται σε διπλότυπες εκδόσεις των σελίδων του ιστότοπού σας.
χρησιμοποιήστε το στοιχείο rel="canonical" - αυτή είναι η δεύτερη λύση (από τις καλύτερες) για την εξάλειψη των διπλότυπων σελίδων.
χρήση ΚΩΔΙΚΑΣ να δώσει οδηγίες ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣοι μηχανές δεν ευρετηριάζουν διπλότυπες σελίδες.

Ωστόσο, έχετε υπόψη σας ότι εάν χρησιμοποιείτε ένα αρχείο robots.txt για να αποτρέψετε τις προβολές σελίδας, τότε η εφαρμογή του χαρακτηριστικού noindex ή nofollow στην ίδια τη σελίδα δεν έχει νόημα. Εφόσον η αράχνη δεν μπορεί να διαβάσει αυτήν τη σελίδα, δεν θα δει ποτέ τα χαρακτηριστικά noindex ή nofollow. Έχοντας αυτά τα εργαλεία κατά νου, ας δούμε ορισμένες συγκεκριμένες καταστάσεις διπλού περιεχομένου.

Σελίδες HTTPS -Εάν χρησιμοποιείτε SSL (μια κρυπτογραφημένη ανταλλαγή μεταξύ του προγράμματος περιήγησής σας και του διακομιστή web, που χρησιμοποιείται συχνά για ηλεκτρονικό εμπόριο), τότε ο ιστότοπός σας θα έχει σελίδες που ξεκινούν με HTTPS: (αντί για HTTP :). Το πρόβλημα προκύπτει όταν οι σύνδεσμοι στις σελίδες σας HTTPS παραπέμπουν σε άλλες σελίδες στον ιστότοπο χρησιμοποιώντας σχετικούς και όχι απόλυτους συνδέσμους (έτσι, για παράδειγμα, ο σύνδεσμος προς την αρχική σελίδα σας γίνεται https://www.YourDomain.com αντί για http:/ / www.YourDomain.com).

Εάν ο ιστότοπός σας έχει τέτοιο πρόβλημα, τότε για να το λύσετε μπορείτε να χρησιμοποιήσετε το στοιχείο rel="canonical" ή 301st redirects. Μια εναλλακτική λύση είναι να αλλάξετε τους συνδέσμους σε απόλυτους: http://www.YourDomain.com/content.html αντί για /contenthtml), κάτι που επίσης θα κάνει τη ζωή κάπως πιο δύσκολη για όσους κλέβουν το περιεχόμενό σας.

Συστήματα διαχείρισης περιεχομένου που δημιουργούν διπλό περιεχόμενο -Μερικές φορές ένας ιστότοπος έχει πολλές εκδόσεις πανομοιότυπων σελίδων. Αυτό συμβαίνει λόγω περιορισμών σε ορισμένα συστήματα διαχείρισης περιεχομένου που απευθύνονται στο ίδιο περιεχόμενο με περισσότερες από μία διευθύνσεις URL. Αυτό είναι συνήθως εντελώς περιττό διπλότυπο που δεν έχει αξία για τους χρήστες και η καλύτερη λύση είναι να αφαιρέσετε τις διπλότυπες σελίδες και να κάνετε μια ανακατεύθυνση 301 για τις σελίδες που αφαιρέθηκαν στις υπόλοιπες σελίδες. Εάν αυτό δεν έχει αποτέλεσμα, δοκιμάστε άλλες μεθόδους (που δίνονται στην αρχή αυτού του άρθρου).
Εκτυπώσιμες σελίδες ή πολλαπλές επιλογές ταξινόμησης -Πολλοί ιστότοποι προσφέρουν εκτυπώσιμες σελίδες που παρουσιάζουν το ίδιο περιεχόμενο στον χρήστη σε μορφή φιλική προς τον εκτυπωτή. Ορισμένοι ιστότοποι ηλεκτρονικού εμπορίου προσφέρουν λίστες των προϊόντων τους με πολλά πιθανά είδη (ανά μέγεθος, χρώμα, μάρκα και τιμή). Αυτές οι σελίδες έχουν αξία για τον χρήστη, αλλά δεν έχουν αξία για τις μηχανές αναζήτησης και επομένως θα τους εμφανίζονται ως διπλότυπο περιεχόμενο. Σε αυτήν την περίπτωση, θα χρειαστεί είτε να χρησιμοποιήσετε μία από τις επιλογές που δόθηκαν προηγουμένως σε αυτό το ιστολόγιο είτε να προσαρμόσετε το φύλλο CSS για εκτύπωση (όπως περιγράφεται στη δημοσίευση yoast.com/added-print-css-style-sheet/ στο Yoast) .
Διπλότυπο περιεχόμενο σε ιστολόγια και συστήματα αρχειοθέτησης -Τα ιστολόγια παρουσιάζουν μια ενδιαφέρουσα παραλλαγή στο πρόβλημα του διπλού περιεχομένου. Μια ανάρτηση ιστολογίου μπορεί να εμφανιστεί σε πολλές διαφορετικές σελίδες: στην αρχική σελίδα του ιστολογίου, στη σελίδα μόνιμου συνδέσμου της ανάρτησης, σε σελίδες αρχειοθέτησης και σε σελίδες κατηγορίας. Κάθε παρουσία μιας ανάρτησης είναι διπλότυπο των άλλων παρουσιών. Πολύ σπάνια οι εκδότες προσπαθούν να αντιμετωπίσουν το πρόβλημα της παρουσίας μιας ανάρτησης τόσο στην αρχική σελίδα του ιστολογίου όσο και στη σελίδα μόνιμου συνδέσμου. Και, προφανώς, οι μηχανές αναζήτησης αντιμετωπίζουν αρκετά καλά αυτό το πρόβλημα. Ωστόσο, μπορεί να έχει νόημα να εμφανίζονται μόνο αποσπάσματα αναρτήσεων σε σελίδες κατηγορίας και αρχειοθέτησης.
Διπλότυπο περιεχόμενο που δημιουργείται από χρήστες (επαναλαμβανόμενες αναρτήσεις κ.λπ.) -πολλοί ιστότοποι εφαρμόζουν δομές για τη λήψη περιεχομένου που δημιουργείται από χρήστες, όπως ιστολόγια, φόρουμ ή πίνακες μηνυμάτων. Αυτοί μπορεί να είναι εξαιρετικοί τρόποι για την ανάπτυξη μεγάλων ποσοτήτων περιεχομένου με πολύ χαμηλό κόστος. Το πρόβλημα είναι ότι ένας χρήστης μπορεί ταυτόχρονα να δημοσιεύσει το ίδιο περιεχόμενο στον ιστότοπό σας και σε πολλούς άλλους ιστότοπους, γεγονός που οδηγεί σε διπλότυπο περιεχόμενο. Αυτό είναι δύσκολο να ελεγχθεί, αλλά τα ακόλουθα μπορούν να ληφθούν υπόψη για τη μείωση του προβλήματος:

Πρέπει να έχετε μια σαφή πολιτική που να ειδοποιεί τους χρήστες ότι το περιεχόμενο που παρέχουν στον ιστότοπό σας πρέπει να είναι μοναδικό και δεν μπορεί να αναρτηθεί σε άλλους ιστότοπους. Φυσικά, αυτό είναι δύσκολο να επιτευχθεί, αλλά θα σας βοηθήσει να κατανοήσετε τις προσδοκίες σας.
εφαρμόστε το φόρουμ σας με μοναδικό τρόπο που απαιτεί διαφορετικό περιεχόμενο. Εκτός από τα τυπικά πεδία εισαγωγής δεδομένων, προσθέστε επίσης μερικά μοναδικά πεδία (διαφορετικά από άλλους ιστότοπους) που θα είναι χρήσιμα για να δουν οι επισκέπτες του ιστότοπού σας.

Περιεχόμενο (Αγγλικά: περιεχόμενο) - πληροφορίες, δηλαδή κείμενο, εικόνες, βίντεο, αρχεία που βρίσκονται στον ιστότοπο.

Θα πρέπει να είναι:

Δίνοντας την πιο ολοκληρωμένη και κατανοητή απάντηση, λύνοντας το πρόβλημα ενός ατόμου: είτε πρόκειται για κέφι, για τέρμα σε ένα δύσκολο δίλημμα ή για αγορά ποιοτικού προϊόντος.
Χωρίς τη χρήση κρυφών θραυσμάτων όπως:

το κείμενο έχει το ίδιο χρώμα με το φόντο,
το κείμενο κρύβεται από την εικόνα, που βρίσκεται πίσω από αυτό,
Το μέγεθος της γραμματοσειράς έχει οριστεί σε 0.

Δομημένα και ποικίλα σχεδιασμένα, δηλαδή εύκολα οπτικά αντιληπτά:

Οι κύριες ιδέες επισημαίνονται με χρώμα ή τόλμη, έτσι ώστε ο χρήστης να εστιάσει σε αυτές. Μην ξεχνάτε ότι οι ιστοσελίδες δεν διαβάζονται, αλλά ξαφρίζονται.
μέσω της δομής του άρθρου υλοποιείται,
οι προτάσεις συνδυάζονται σε παραγράφους με μια κενή γραμμή μεταξύ τους,
χρησιμοποιήθηκαν λίστες, εισαγωγικά, πίνακες,
Χρησιμοποιήθηκαν εικόνες, γραφήματα, βίντεο, ηχογραφήσεις. Οι εικόνες παίζουν μεγάλο ρόλο. Έτσι, ένας αναγνώστης αυτού του ιστολογίου ζήτησε να μεταφραστούν οι χαρακτήρες στο στιγμιότυπο οθόνης που έδειχνε τον επεξεργαστή του Blogger.

Μοναδικό και πρωτότυπο (δεν μπορεί να αποκατασταθεί από νεκρούς ιστότοπους ή να ληφθεί από πόρους κάτω από φίλτρα). Οι μηχανές αναζήτησης το παρακολουθούν στενά, αντιμετωπίζουν τα διπλότυπα εξαιρετικά ανεπιθύμητα και επιβάλλουν κυρώσεις για τη χρήση παρόμοιου υλικού. Φανταστείτε την κατάσταση: κάνετε ένα ερώτημα και βλέπετε την ίδια απάντηση στα αποτελέσματα αναζήτησης. Η μελέτη πολλών πηγών που καλύπτουν το θέμα με διαφορετικούς τρόπους θα μας επιτρέψει να σχηματίσουμε μια πιο ακριβή και ευρύτερη κατανόηση του ζητήματος. Μπορείτε να ελέγξετε τη μοναδικότητα του κειμένου εισάγοντας ένα απόσπασμά του σε εισαγωγικά () στη φόρμα αναζήτησης.

Η αντιγραφή περιεχομένου μπορεί να παρατηρηθεί όχι μόνο κατά την τοποθέτηση δεδομένων σε διαφορετικούς ιστότοπους, αλλά και κατά την επανάληψη πληροφοριών σε δύο ή περισσότερα από ένα έργα web. Ακολουθεί ένα πείραμα στο devvver.ru σχετικά με τα αρνητικά των εσωτερικών διπλότυπων και πώς μπορούν να επωφεληθούν από αυτό οι ανταγωνιστές.

Ας εξετάσουμε ποια εργαλεία έχουμε για την καταπολέμηση αυτής της ασθένειας.

Σύνδεσμοι στη σελίδα

Ο μόνοςΟ 100% τρόπος για να αποτρέψετε την ευρετηρίαση μιας σελίδας είναι να μην δημοσιεύετε συνδέσμους σε αυτήν και να μην την προσθέτετε στα πρόσθετα Yandex, Googleκαι τα λοιπά.

Αρχείο Robots.txt

Ένα αρχείο κειμένου robots.txt (όπως το ) είναι ένα εξαιρετικό εργαλείο για τη διαχείριση της ευρετηρίασης. Βοηθήστε την Yandex, την Google. Αλλά αν η Google βρει έναν σύνδεσμο προς μια κλειστή διεύθυνση URL στο robots.txt, θα την προσθέσει στα αποτελέσματα.

Εξαιτίας αυτού, πρέπει να εισέλθετε εδώ μόνο εκείνα τα έγγραφα ιστού στα οποία δεν είναι δυνατή η πρόσβαση με άλλο τρόπο, Για παράδειγμα, . Και φυσικά χάρτης ιστότοπουγια καλύτερη και ταχύτερη ευρετηρίαση δημοφιλών σελίδων.

Κεφαλίδα HTTP

Η διεύθυνση URL δεν θα ευρετηριαστεί εάν εμφανίζει 404 ή 301. Και για την Google, ακόμη και όταν υπάρχει η γραμμή

X-Robots-Tag: noindex

Μετα-ρομπότ ετικέτες

Αυτό κύριο εργαλείο, επειδή λειτουργεί το ίδιο τόσο για το Yandex όσο και για την Google. Στη σελίδα, η πρόσβαση στο περιεχόμενο της οποίας θα πρέπει να απαγορεύεται, αναφέρονται τα εξής:

Το χαρακτηριστικό rel="canonical".

Υποχρεούμαιτο χαρακτηριστικό rel="canonical" προτείνει το προτιμώμενο από πολλά έγγραφα ιστού με πολύ παρόμοιο περιεχόμενο, για παράδειγμα, http://site/2010/07/kontent..html?showComment. Η μηχανή αναζήτησης θα αγνοήσει το δεύτερο επειδή θα υπακούει στη γραμμή:

Yandex.Webmaster

media="print"

Δεν χρειάζεται να δημιουργήσετε ξεχωριστή εκτυπώσιμη έκδοση. Τα στυλ μπορούν να προσαρμοστούν χρησιμοποιώντας .

Κατάργηση διπλότυπων που βρίσκονται στο ευρετήριο κατά λάθος

Παρά τα μέτρα που έχουν ληφθεί, τα ρομπότ αναζήτησης ενδέχεται να ευρετηριάσουν την ανεπιθύμητη σελίδα. Με την υποβολή αιτήματος

Ελέγξτε όλα τα αποτελέσματα αναζήτησης, ειδικά αυτά με τα αποτελέσματα της Google που έχουν παραλειφθεί. Στην ιδανική περίπτωση, αυτή η επιγραφή δεν θα πρέπει να είναι:

Τα αποτελέσματα που παραλείφθηκαν πρέπει να αφαιρεθούν χειροκίνητα. Για το Yandex θα χρησιμοποιήσουμε τη φόρμα διαγραφής σελίδας και για το Google πρέπει να μεταβείτε στα "Εργαλεία για Webmasters" - "Βελτιστοποίηση" - "Διαγραφή διευθύνσεων URL" - "Δημιουργία νέου αιτήματος διαγραφής".

Συνιστούμε να διαβάσετε

Χρησιμοποιώντας το Windows Equalizer

Σήμερα θα δούμε: Οι αληθινοί γνώστες της μουσικής γνωρίζουν ότι για την ποιότητα...

Ποιο πρόγραμμα περιήγησης να επιλέξετε για έναν αδύναμο υπολογιστή

Αρχεία *.xlsx με παραδείγματα υπολογισμών τύπων και συναρτήσεων. Και επίσης δωρεάν...