Καταπολέμηση διπλότυπων σελίδων

Ο ιδιοκτήτης μπορεί να μην υποψιάζεται ότι ορισμένες σελίδες στον ιστότοπό του έχουν αντίγραφα - τις περισσότερες φορές αυτό συμβαίνει. Οι σελίδες ανοίγουν, όλα είναι εντάξει με το περιεχόμενό τους, αλλά αν προσέξετε απλά, θα παρατηρήσετε ότι με το ίδιο περιεχόμενο, οι διευθύνσεις είναι διαφορετικές. Τι σημαίνει? Για ζωντανούς χρήστες απολύτως τίποτα, αφού τους ενδιαφέρουν οι πληροφορίες στις σελίδες, αλλά άψυχα μηχανές αναζήτησηςαντιλαμβάνονται ένα τέτοιο φαινόμενο με εντελώς διαφορετικό τρόπο - για αυτούς είναι εντελώς διαφορετικές σελίδεςμε το ίδιο περιεχόμενο.

Είναι επιβλαβείς οι διπλότυπες σελίδες;Έτσι, εάν ένας απλός χρήστης δεν μπορεί καν να παρατηρήσει την παρουσία διπλότυπων στον ιστότοπό σας, τότε οι μηχανές αναζήτησης θα το προσδιορίσουν αμέσως. Τι είδους αντίδραση μπορείτε να περιμένετε από αυτούς; Εφόσον, στην πραγματικότητα, τα αντίγραφα θεωρούνται διαφορετικές σελίδες, το περιεχόμενο σε αυτά παύει να είναι μοναδικό. Και αυτό ήδη επηρεάζει αρνητικά την κατάταξη.

Επίσης, η παρουσία διπλότυπων θολώνει το SEO που προσπαθούσε να εστιάσει ο βελτιστοποιητής στη σελίδα προορισμού. Λόγω διπλότυπων, ενδέχεται να μην βρίσκεται στη σελίδα στην οποία ήθελαν να το μεταφέρουν. Δηλαδή η επίδραση του εσωτερική σύνδεσηκαι οι εξωτερικοί σύνδεσμοι μπορεί να μειωθούν πολλές φορές.

Στη συντριπτική πλειονότητα των περιπτώσεων, φταίνε τα διπλότυπα - λόγω εσφαλμένων ρυθμίσεων και της έλλειψης της κατάλληλης προσοχής του βελτιστοποιητή, δημιουργούνται καθαρά αντίγραφα. Πολλά CMS, όπως το Joomla, αμαρτάνουν με αυτό. Είναι δύσκολο να βρείτε μια καθολική συνταγή για να λύσετε το πρόβλημα, αλλά μπορείτε να δοκιμάσετε να χρησιμοποιήσετε ένα από τα πρόσθετα για την αφαίρεση αντιγράφων.

Η εμφάνιση ασαφών διπλότυπων, στα οποία το περιεχόμενο δεν είναι εντελώς πανομοιότυπο, συμβαίνει συνήθως με υπαιτιότητα του webmaster. Τέτοιες σελίδες βρίσκονται συχνά σε ιστότοπους ηλεκτρονικών καταστημάτων, όπου οι σελίδες με κάρτες προϊόντων διαφέρουν μόνο σε λίγες προτάσεις με περιγραφή και όλο το άλλο περιεχόμενο, που αποτελείται από εγκάρσια τμήματα και άλλα στοιχεία, είναι το ίδιο.

Πολλοί ειδικοί υποστηρίζουν ότι ένας μικρός αριθμός διπλότυπων δεν θα βλάψει τον ιστότοπο, αλλά εάν υπάρχουν περισσότερα από 40-50% από αυτά, τότε σοβαρές δυσκολίες μπορεί να περιμένουν τον πόρο κατά την προώθηση. Σε κάθε περίπτωση, ακόμα κι αν δεν υπάρχουν τόσα πολλά αντίγραφα, αξίζει να φροντίσετε για την εξάλειψή τους, οπότε είναι σίγουρο ότι θα απαλλαγείτε από προβλήματα με τα αντίγραφα.

Αναζήτηση για σελίδες αντιγραφήςΥπάρχουν διάφοροι τρόποι για να βρείτε διπλότυπες σελίδες, αλλά το πρώτο πράγμα που πρέπει να κάνετε είναι να μεταβείτε σε πολλές μηχανές αναζήτησης και να δείτε πώς βλέπουν τον ιστότοπό σας - απλά πρέπει να συγκρίνετε τον αριθμό των σελίδων στο ευρετήριο της καθεμίας. Είναι πολύ απλό να το κάνετε αυτό χωρίς να καταφύγετε σε πρόσθετα μέσα: στο Yandex ή στο Google, αρκεί να εισαγάγετε το host:yoursite.ru στη γραμμή αναζήτησης και να δείτε τον αριθμό των αποτελεσμάτων.




Εάν, μετά από έναν τόσο απλό έλεγχο, ο αριθμός θα είναι πολύ διαφορετικός, κατά 10-20 φορές, τότε με κάποιο βαθμό πιθανότητας αυτό μπορεί να υποδεικνύει το περιεχόμενο των διπλότυπων σε ένα από αυτά. Οι σελίδες αντιγραφής μπορεί να μην ευθύνονται για μια τέτοια διαφορά, αλλά παρόλα αυτά αυτό οδηγεί σε μια περαιτέρω πιο ενδελεχή αναζήτηση. Εάν ο ιστότοπος είναι μικρός, τότε μπορείτε να υπολογίσετε με μη αυτόματο τρόπο τον αριθμό των πραγματικών σελίδων και στη συνέχεια να συγκρίνετε με τους δείκτες από μηχανές αναζήτησης.

Μπορείτε να αναζητήσετε διπλότυπες σελίδες κατά διεύθυνση URL στα αποτελέσματα της μηχανής αναζήτησης. Εάν πρέπει να έχουν CNC, τότε σελίδες με διευθύνσεις URL με ασαφείς χαρακτήρες, όπως "index.php?s=0f6b2903d", θα αποκλείονται αμέσως από τη γενική λίστα.

Ένας άλλος τρόπος προσδιορισμού της παρουσίας διπλότυπων μέσω μηχανών αναζήτησης είναι η αναζήτηση σε θραύσματα κειμένου. Η διαδικασία για έναν τέτοιο έλεγχο είναι απλή: πρέπει να εισαγάγετε ένα τμήμα κειμένου 10-15 λέξεων από κάθε σελίδα στη γραμμή αναζήτησης και στη συνέχεια να αναλύσετε το αποτέλεσμα. Εάν υπάρχουν δύο ή περισσότερες σελίδες στα αποτελέσματα αναζήτησης, τότε υπάρχουν αντίγραφα, αλλά εάν υπάρχει μόνο ένα αποτέλεσμα, τότε αυτή η σελίδα δεν έχει διπλότυπα και δεν χρειάζεται να ανησυχείτε.

Είναι λογικό ότι εάν ο ιστότοπος αποτελείται από μεγάλο αριθμό σελίδων, τότε ένας τέτοιος έλεγχος μπορεί να μετατραπεί σε μια αδύνατη ρουτίνα για τον βελτιστοποιητή. Για να ελαχιστοποιήσετε το κόστος χρόνου, μπορείτε να χρησιμοποιήσετε ειδικά προγράμματα. Ένα τέτοιο εργαλείο, που πιθανότατα είναι γνωστό στους έμπειρους επαγγελματίες, είναι το πρόγραμμα Xenu`s Link Sleuth.


Για να ελέγξετε τον ιστότοπο, πρέπει να ανοίξετε νέο έργο, επιλέγοντας "Αρχείο" "Έλεγχος URL" από το μενού, εισάγετε τη διεύθυνση και κάντε κλικ στο "OK". Μετά από αυτό, το πρόγραμμα θα αρχίσει να επεξεργάζεται όλες τις διευθύνσεις URL του ιστότοπου. Μετά την ολοκλήρωση του ελέγχου, πρέπει να εξαγάγετε τα ληφθέντα δεδομένα σε οποιοδήποτε βολικός επεξεργαστήςκαι αρχίστε να ψάχνετε για διπλότυπα.

Εκτός από τις παραπάνω μεθόδους, η εργαλειοθήκη των πλαισίων Yandex.Webmaster και Google Webmaster Tools διαθέτει εργαλεία για τον έλεγχο της ευρετηρίασης σελίδων που μπορούν να χρησιμοποιηθούν για την αναζήτηση διπλότυπων.

Μέθοδοι επίλυσης προβλημάτωνΑφού βρεθούν όλα τα διπλότυπα, θα πρέπει να εξαλειφθούν. Αυτό μπορεί επίσης να γίνει με διάφορους τρόπους, αλλά κάθε συγκεκριμένη περίπτωση χρειάζεται τη δική της μέθοδο, είναι πιθανό να πρέπει να τα χρησιμοποιήσετε όλα.

  • Οι σελίδες αντιγραφής μπορούν να διαγραφούν με μη αυτόματο τρόπο, αλλά αυτή η μέθοδος είναι πιο κατάλληλη μόνο για εκείνα τα διπλότυπα που δημιουργήθηκαν με μη αυτόματο τρόπο λόγω της αδιακρισίας του webmaster.
  • Η ανακατεύθυνση 301 είναι ιδανική για τη συγκόλληση σελίδων αντιγραφής των οποίων οι διευθύνσεις URL διαφέρουν παρουσία και απουσία www.
  • Η λύση στο πρόβλημα με τα διπλότυπα που χρησιμοποιούν την κανονική ετικέτα μπορεί να εφαρμοστεί σε ασαφή αντίγραφα. Για παράδειγμα, για κατηγορίες προϊόντων σε ένα ηλεκτρονικό κατάστημα που έχουν διπλότυπα που διαφέρουν στην ταξινόμηση κατά διάφορες παραμέτρους. Επίσης το canonical είναι κατάλληλο για εκτυπώσιμες εκδόσεις σελίδων και σε άλλες παρόμοιες περιπτώσεις. Εφαρμόζεται πολύ απλά - για όλα τα αντίγραφα, καθορίζεται το χαρακτηριστικό rel="canonical", αλλά όχι για την κύρια σελίδα, η οποία είναι η πιο σχετική. Ο κώδικας θα πρέπει να μοιάζει κάπως έτσι: σύνδεσμος rel="canonical" href="http://yoursite.ru/stranica-kopiya"/ και να βρίσκεται εντός της ετικέτας κεφαλής.
  • Στην καταπολέμηση των διπλότυπων, η ρύθμιση του αρχείου robots.txt μπορεί να βοηθήσει. Η οδηγία Απαγόρευση θα σας επιτρέψει να αποκλείσετε την πρόσβαση σε διπλότυπα για ρομπότ αναζήτησης. Μπορείτε να διαβάσετε περισσότερα σχετικά με τη σύνταξη αυτού του αρχείου στη λίστα αλληλογραφίας μας.

Ο ιδιοκτήτης μπορεί να μην υποψιάζεται ότι ορισμένες σελίδες στον ιστότοπό του έχουν αντίγραφα - τις περισσότερες φορές αυτό συμβαίνει. Οι σελίδες ανοίγουν, το περιεχόμενό τους είναι εντάξει, αλλά αν προσέξετε απλώς τη διεύθυνση URL, θα παρατηρήσετε ότι με το ίδιο περιεχόμενο, οι διευθύνσεις είναι διαφορετικές. Τι σημαίνει? Για τους ζωντανούς χρήστες, απολύτως τίποτα, αφού ενδιαφέρονται για τις πληροφορίες στις σελίδες, αλλά οι άψυχες μηχανές αναζήτησης αντιλαμβάνονται αυτό το φαινόμενο με εντελώς διαφορετικό τρόπο - για αυτούς πρόκειται για εντελώς διαφορετικές σελίδες με το ίδιο περιεχόμενο.

Είναι επιβλαβείς οι διπλότυπες σελίδες;

Έτσι, εάν ένας απλός χρήστης δεν μπορεί καν να παρατηρήσει την παρουσία διπλότυπων στον ιστότοπό σας, τότε οι μηχανές αναζήτησης θα το προσδιορίσουν αμέσως. Τι είδους αντίδραση μπορείτε να περιμένετε από αυτούς; Εφόσον, στην πραγματικότητα, τα ρομπότ αναζήτησης βλέπουν τα αντίγραφα ως διαφορετικές σελίδες, το περιεχόμενο σε αυτά παύει να είναι μοναδικό. Και αυτό ήδη επηρεάζει αρνητικά την κατάταξη.

Επίσης, η παρουσία διπλότυπων θολώνει τον χυμό συνδέσμου που ο βελτιστοποιητής προσπαθούσε να εστιάσει στη σελίδα προορισμού. Λόγω διπλότυπων, ενδέχεται να μην βρίσκεται στη σελίδα στην οποία ήθελαν να το μεταφέρουν. Δηλαδή, η επίδραση της εσωτερικής σύνδεσης και των εξωτερικών συνδέσμων μπορεί να μειωθεί πολλές φορές.

Στη συντριπτική πλειονότητα των περιπτώσεων, το CMS ευθύνεται για την εμφάνιση διπλότυπων - λόγω εσφαλμένων ρυθμίσεων και της έλλειψης προσοχής του βελτιστοποιητή, δημιουργούνται καθαρά αντίγραφα. Πολλά CMS, όπως το Joomla, αμαρτάνουν με αυτό. Είναι δύσκολο να βρείτε μια καθολική συνταγή για να λύσετε το πρόβλημα, αλλά μπορείτε να δοκιμάσετε να χρησιμοποιήσετε ένα από τα πρόσθετα για την αφαίρεση αντιγράφων.

Η εμφάνιση ασαφών διπλότυπων, στα οποία το περιεχόμενο δεν είναι εντελώς πανομοιότυπο, συμβαίνει συνήθως με υπαιτιότητα του webmaster. Τέτοιες σελίδες βρίσκονται συχνά σε ιστότοπους ηλεκτρονικών καταστημάτων, όπου οι σελίδες με κάρτες προϊόντων διαφέρουν μόνο σε λίγες προτάσεις με περιγραφή και όλο το άλλο περιεχόμενο, που αποτελείται από εγκάρσια τμήματα και άλλα στοιχεία, είναι το ίδιο.

Πολλοί ειδικοί υποστηρίζουν ότι ένας μικρός αριθμός διπλότυπων δεν θα βλάψει τον ιστότοπο, αλλά εάν υπάρχουν περισσότερα από 40-50% από αυτά, τότε σοβαρές δυσκολίες μπορεί να περιμένουν τον πόρο κατά την προώθηση. Σε κάθε περίπτωση, ακόμα κι αν δεν υπάρχουν τόσα πολλά αντίγραφα, αξίζει να φροντίσετε για την εξάλειψή τους, οπότε είναι σίγουρο ότι θα απαλλαγείτε από προβλήματα με τα αντίγραφα.

Αναζήτηση για σελίδες αντιγραφής

Υπάρχουν διάφοροι τρόποι για να βρείτε διπλότυπες σελίδες, αλλά το πρώτο πράγμα που πρέπει να κάνετε είναι να μεταβείτε σε πολλές μηχανές αναζήτησης και να δείτε πώς βλέπουν τον ιστότοπό σας - απλά πρέπει να συγκρίνετε τον αριθμό των σελίδων στο ευρετήριο της καθεμίας. Είναι πολύ απλό να το κάνετε αυτό χωρίς να καταφύγετε σε πρόσθετα μέσα: στο Yandex ή στο Google, αρκεί να εισαγάγετε το host:yoursite.ru στη γραμμή αναζήτησης και να δείτε τον αριθμό των αποτελεσμάτων.

Εάν, μετά από έναν τόσο απλό έλεγχο, ο αριθμός θα είναι πολύ διαφορετικός, κατά 10-20 φορές, τότε με κάποιο βαθμό πιθανότητας αυτό μπορεί να υποδεικνύει το περιεχόμενο των διπλότυπων σε ένα από αυτά. Οι σελίδες αντιγραφής μπορεί να μην ευθύνονται για μια τέτοια διαφορά, αλλά παρόλα αυτά αυτό οδηγεί σε μια περαιτέρω πιο ενδελεχή αναζήτηση. Εάν ο ιστότοπος είναι μικρός, τότε μπορείτε να υπολογίσετε με μη αυτόματο τρόπο τον αριθμό των πραγματικών σελίδων και στη συνέχεια να συγκρίνετε με τους δείκτες από τις μηχανές αναζήτησης.

Μπορείτε να αναζητήσετε διπλότυπες σελίδες κατά διεύθυνση URL στα αποτελέσματα της μηχανής αναζήτησης. Εάν πρέπει να έχουν CNC, τότε σελίδες με διευθύνσεις URL με ασαφείς χαρακτήρες, όπως "index.php?s=0f6b2903d", θα αποκλείονται αμέσως από τη γενική λίστα.

Ένας άλλος τρόπος προσδιορισμού της παρουσίας διπλότυπων μέσω μηχανών αναζήτησης είναι η αναζήτηση σε θραύσματα κειμένου. Η διαδικασία για έναν τέτοιο έλεγχο είναι απλή: πρέπει να εισαγάγετε ένα τμήμα κειμένου 10-15 λέξεων από κάθε σελίδα στη γραμμή αναζήτησης και στη συνέχεια να αναλύσετε το αποτέλεσμα. Εάν υπάρχουν δύο ή περισσότερες σελίδες στα αποτελέσματα αναζήτησης, τότε υπάρχουν αντίγραφα, αλλά εάν υπάρχει μόνο ένα αποτέλεσμα, τότε αυτή η σελίδα δεν έχει διπλότυπα και δεν χρειάζεται να ανησυχείτε.

Είναι λογικό ότι εάν ο ιστότοπος αποτελείται από μεγάλο αριθμό σελίδων, τότε ένας τέτοιος έλεγχος μπορεί να μετατραπεί σε μια αδύνατη ρουτίνα για τον βελτιστοποιητή. Για να ελαχιστοποιήσετε το κόστος χρόνου, μπορείτε να χρησιμοποιήσετε ειδικά προγράμματα. Ένα τέτοιο εργαλείο, που πιθανότατα είναι γνωστό στους έμπειρους επαγγελματίες, είναι το πρόγραμμα Xenu`s Link Sleuth.

Για να ελέγξετε τον ιστότοπο, πρέπει να ανοίξετε ένα νέο έργο επιλέγοντας "Αρχείο" "Έλεγχος URL" από το μενού, πληκτρολογήστε τη διεύθυνση και κάντε κλικ στο "OK". Μετά από αυτό, το πρόγραμμα θα αρχίσει να επεξεργάζεται όλες τις διευθύνσεις URL του ιστότοπου. Στο τέλος του ελέγχου, πρέπει να εξαγάγετε τα ληφθέντα δεδομένα σε οποιοδήποτε βολικό πρόγραμμα επεξεργασίας και να ξεκινήσετε την αναζήτηση για διπλότυπα.

Εκτός από τις παραπάνω μεθόδους, η εργαλειοθήκη των πλαισίων Yandex.Webmaster και Google Webmaster Tools διαθέτει εργαλεία για τον έλεγχο της ευρετηρίασης σελίδων που μπορούν να χρησιμοποιηθούν για την αναζήτηση διπλότυπων.

Μέθοδοι επίλυσης προβλημάτων

Αφού βρεθούν όλα τα διπλότυπα, θα πρέπει να εξαλειφθούν. Αυτό μπορεί επίσης να γίνει με διάφορους τρόπους, αλλά κάθε συγκεκριμένη περίπτωση χρειάζεται τη δική της μέθοδο, είναι πιθανό να πρέπει να τα χρησιμοποιήσετε όλα.

Οι σελίδες αντιγραφής μπορούν να διαγραφούν με μη αυτόματο τρόπο, αλλά αυτή η μέθοδος είναι πιο κατάλληλη μόνο για εκείνα τα διπλότυπα που δημιουργήθηκαν με μη αυτόματο τρόπο λόγω της αδιακρισίας του webmaster.

Η ανακατεύθυνση 301 είναι ιδανική για τη συγκόλληση σελίδων αντιγραφής των οποίων οι διευθύνσεις URL διαφέρουν παρουσία και απουσία www.

Η λύση στο πρόβλημα με τα διπλότυπα που χρησιμοποιούν την κανονική ετικέτα μπορεί να εφαρμοστεί σε ασαφή αντίγραφα. Για παράδειγμα, για κατηγορίες προϊόντων σε ένα ηλεκτρονικό κατάστημα που έχουν διπλότυπα που διαφέρουν στην ταξινόμηση κατά διάφορες παραμέτρους. Επίσης το canonical είναι κατάλληλο για εκτυπώσιμες εκδόσεις σελίδων και σε άλλες παρόμοιες περιπτώσεις. Εφαρμόζεται πολύ απλά - για όλα τα αντίγραφα, καθορίζεται το χαρακτηριστικό rel="canonical", αλλά όχι για την κύρια σελίδα, η οποία είναι η πιο σχετική. Ο κώδικας θα πρέπει να μοιάζει κάπως έτσι: σύνδεσμος rel="canonical" href="http://yoursite.ru/stranica-kopiya"/ και να βρίσκεται εντός της ετικέτας κεφαλής.

Στην καταπολέμηση των διπλότυπων, η ρύθμιση του αρχείου robots.txt μπορεί να βοηθήσει. Η οδηγία Απαγόρευση θα σας επιτρέψει να αποκλείσετε την πρόσβαση σε διπλότυπα για ρομπότ αναζήτησης. Μπορείτε να διαβάσετε περισσότερα σχετικά με τη σύνταξη αυτού του αρχείου στο τεύχος #64 της λίστας αλληλογραφίας μας.

συμπεράσματα

Εάν οι χρήστες αντιλαμβάνονται τα διπλότυπα ως μία σελίδα με διαφορετικές διευθύνσεις, τότε για τις αράχνες αυτές είναι διαφορετικές σελίδες με διπλό περιεχόμενο. Οι σελίδες αντιγραφής είναι μια από τις πιο συνηθισμένες παγίδες που δεν μπορούν να ξεπεράσουν οι αρχάριοι. Η παρουσία τους σε μεγάλους αριθμούς στο site που προωθείται είναι απαράδεκτη, καθώς δημιουργούν σοβαρά εμπόδια στην είσοδο στην TOP.

Αφορμή για τη συγγραφή αυτού του άρθρου ήταν άλλη μια κλήση από λογιστή με πανικό πριν την υποβολή δηλώσεων ΦΠΑ. Το τελευταίο τρίμηνο, πέρασα πολύ χρόνο για να καθαρίσω διπλότυπους αντισυμβαλλομένους. Και πάλι είναι τα ίδια και νέα. Οπου?

Αποφάσισε να αφιερώσει χρόνο για να αντιμετωπίσει την αιτία, όχι το αποτέλεσμα. Η κατάσταση με αφορά κυρίως διαμορφωμένες αυτόματες μεταφορτώσεις μέσω σχεδίων ανταλλαγής από πρόγραμμα ελέγχου(στην περίπτωσή μου, UT 10.3) στο λογιστήριο της επιχείρησης (στην περίπτωσή μου, 2.0).

Πριν από μερικά χρόνια, εγκαταστάθηκαν αυτές οι διαμορφώσεις και διαμορφώθηκε η αυτόματη ανταλλαγή μεταξύ τους. Αντιμέτωπος με το πρόβλημα της ιδιαιτερότητας της διατήρησης καταλόγου αντισυμβαλλομένων από το τμήμα πωλήσεων, το οποίο άρχισε να δημιουργεί διπλότυπους αντισυμβαλλομένους (με τον ίδιο ΑΦΜ / KPP / Όνομα) για τον ένα ή τον άλλο λόγο (διέσπασαν τον ίδιο αντισυμβαλλόμενο σε διαφορετικές ομάδες). Το λογιστήριο εξέφρασε το "phi" του και αποφάσισε - δεν έχει σημασία για εμάς τι έχουν εκεί, συνδυάστε τις κάρτες κατά τη φόρτωση σε μία. Έπρεπε να επέμβω στη διαδικασία μεταφοράς αντικειμένων με κανόνες ανταλλαγής. Καταργήσαμε την αναζήτηση με εσωτερικό αναγνωριστικό για αντισυμβαλλόμενους και αφήσαμε την αναζήτηση κατά TIN + KPP + Όνομα. Ωστόσο, ακόμη και εδώ οι παγίδες τους εμφανίστηκαν με τη μορφή λάτρεις της μετονομασίας των ονομάτων των αντισυμβαλλομένων (ως αποτέλεσμα, δημιουργούνται αντίγραφα στην BP από τους ίδιους τους κανόνες). Μαζευτήκαμε όλοι, συζητήσαμε, αποφασίσαμε, πεισθήκαμε ότι τα διπλά είναι απαράδεκτα στο UT, τα αφαιρέσαμε, επιστρέψαμε στους τυπικούς κανόνες.

Αλλά μετά το «χτένισμα» των διπλότυπων στο UT και στο BP, τα εσωτερικά αναγνωριστικά πολλών αντισυμβαλλομένων ήταν διαφορετικά. Και δεδομένου ότι οι τυπικοί κανόνες ανταλλαγής αναζητούν αντικείμενα αποκλειστικά από το εσωτερικό αναγνωριστικό, ένα νέο αντίστοιχο του αντισυμβαλλομένου έφτασε με το επόμενο τμήμα των εγγράφων στο BP (αν αυτά τα αναγνωριστικά διέφεραν). Αλλά η καθολική ανταλλαγή δεδομένων XML δεν θα ήταν καθολική εάν αυτό το πρόβλημα δεν μπορούσε να παρακαμφθεί. Επειδή Είναι αδύνατο να αλλάξετε το αναγνωριστικό ενός υπάρχοντος αντικειμένου με τυπικά μέσα, τότε μπορείτε να ξεπεράσετε αυτήν την κατάσταση χρησιμοποιώντας έναν ειδικό μητρώο πληροφοριών "Αντιστοιχία αντικειμένων για ανταλλαγή", ο οποίος είναι διαθέσιμος σε όλες τις τυπικές διαμορφώσεις από το 1C.

Προκειμένου να αποφευχθούν νέα διπλότυπα, ο αλγόριθμος για τον καθαρισμό των διπλότυπων έγινε ως εξής:

1. Στο BP, χρησιμοποιώντας την επεξεργασία "Αναζήτηση και αντικατάσταση διπλών στοιχείων" (είναι χαρακτηριστικό, μπορεί να ληφθεί από τη διαμόρφωση Trade Management ή στον δίσκο ITS ή να επιλέξετε την καταλληλότερη από τις πολλές παραλλαγές στο ίδιο το Infostart ) Βρίσκω ένα αντίγραφο, προσδιορίζω το σωστό στοιχείο, κάνω κλικ στην εκτέλεση αντικατάστασης.

2. Παίρνω το εσωτερικό αναγνωριστικό του μοναδικού (μετά την αντικατάσταση) αντικειμένου του διπλού μας (σκιτσάρισα μια ειδικά απλή επεξεργασία για αυτό, έτσι ώστε το εσωτερικό αναγνωριστικό να αντιγράφεται αυτόματα στο πρόχειρο).

3. Ανοίγω το μητρώο "Αντιστοιχία αντικειμένων για ανταλλαγή" στο UT, κάνω επιλογή χρησιμοποιώντας τον δικό μου σύνδεσμο.

Διπλότυπα σελίδων ιστότοπου, ο αντίκτυπός τους σε βελτιστοποίηση μηχανών αναζήτησης. Εγχειρίδιο και αυτοματοποιημένους τρόπουςεντοπισμός και εξάλειψη διπλότυπων σελίδων.

Η επιρροή των διπλότυπων στην προώθηση ιστοσελίδων

Η παρουσία διπλότυπων επηρεάζει αρνητικά την κατάταξη του ιστότοπου. Όπως αναφέρθηκε παραπάνω, οι μηχανές αναζήτησης βλέπουν την αρχική σελίδα και το αντίγραφό της ως δύο ξεχωριστές σελίδες. Το περιεχόμενο που αναπαράγεται σε άλλη σελίδα δεν είναι πλέον μοναδικό. Επιπλέον, το βάρος του συνδέσμου της διπλότυπης σελίδας χάνεται, καθώς ο σύνδεσμος μπορεί να μεταφερθεί όχι στη σελίδα προορισμού, αλλά στο αντίγραφό της. Αυτό ισχύει τόσο για εσωτερικούς όσο και για εξωτερικούς συνδέσμους.

Σύμφωνα με ορισμένους webmasters, ένας μικρός αριθμός διπλότυπων σελίδων γενικά δεν θα προκαλέσει σοβαρή βλάβη στον ιστότοπο, αλλά εάν ο αριθμός τους πλησιάσει το 40-50% του συνολικού όγκου του ιστότοπου, είναι αναπόφευκτες σοβαρές δυσκολίες στην προώθηση.

Λόγοι για διπλότυπα

Τις περισσότερες φορές, τα διπλότυπα εμφανίζονται ως αποτέλεσμα λανθασμένων ρυθμίσεων μεμονωμένων CMS. Τα εσωτερικά σενάρια του κινητήρα αρχίζουν να λειτουργούν λανθασμένα και δημιουργούν αντίγραφα των σελίδων του ιστότοπου.

Το φαινόμενο των ασαφών διπλότυπων είναι επίσης γνωστό - σελίδες των οποίων το περιεχόμενο είναι μόνο εν μέρει πανομοιότυπο. Τέτοια διπλότυπα συμβαίνουν, τις περισσότερες φορές, με υπαιτιότητα του ίδιου του webmaster. Αυτό το φαινόμενο είναι χαρακτηριστικό για τα ηλεκτρονικά καταστήματα, όπου οι σελίδες καρτών προϊόντων δημιουργούνται σύμφωνα με το ίδιο πρότυπο και τελικά διαφέρουν μεταξύ τους μόνο κατά λίγες γραμμές κειμένου.

Μέθοδοι εύρεσης διπλότυπων σελίδων

Υπάρχουν διάφοροι τρόποι ανίχνευσης διπλότυπων σελίδων. Μπορείτε να απευθυνθείτε σε μηχανές αναζήτησης: για αυτό, στο Google ή στο Yandex, θα πρέπει να εισαγάγετε μια εντολή όπως "site:sitename.ru" στη γραμμή αναζήτησης, όπου το sitename.ru είναι ο τομέας του ιστότοπού σας. Η μηχανή αναζήτησης θα δώσει όλες τις ευρετηριασμένες σελίδες του ιστότοπου και η αποστολή σας θα είναι να εντοπίσετε διπλότυπα.

Υπάρχει ένας άλλος εξίσου απλός τρόπος: αναζήτηση σε θραύσματα κειμένου. Για να κάνετε αναζήτηση με αυτόν τον τρόπο, πρέπει να προσθέσετε ένα μικρό κομμάτι κειμένου από τον ιστότοπό σας, 10-15 χαρακτήρες, στη γραμμή αναζήτησης. Εάν υπάρχουν δύο ή περισσότερες σελίδες του ιστότοπού σας στα αποτελέσματα αναζήτησης για το κείμενο που αναζητήσατε, δεν θα είναι δύσκολο να εντοπιστούν διπλότυπα.

Ωστόσο, αυτές οι μέθοδοι είναι κατάλληλες για ιστότοπους που αποτελούνται από μικρό αριθμό σελίδων. Εάν ο ιστότοπος έχει αρκετές εκατοντάδες ή και χιλιάδες σελίδες, τότε η μη αυτόματη αναζήτηση για διπλότυπα και η βελτιστοποίηση του ιστότοπου στο σύνολό του καθίστανται αδύνατες εργασίες. Για τέτοιους σκοπούς, εκεί ειδικά προγράμματα, για παράδειγμα, ένα από τα πιο κοινά είναι το Xenu`s Link Sleuth.

Επιπλέον, υπάρχουν ειδικά εργαλεία για τον έλεγχο της κατάστασης ευρετηρίασης στους πίνακες Google Webmaster Tools και Yandex.Webmaster. Είναι επίσης μοντέρνα στη χρήση τους για τον εντοπισμό διπλότυπων.

Μέθοδοι για την εξάλειψη των διπλότυπων σελίδων

Εξάλειψη όχι επιθυμητές σελίδεςμπορεί επίσης να γίνει με διάφορους τρόπους. Για κάθε συγκεκριμένη περίπτωση, μια διαφορετική μέθοδος είναι κατάλληλη, αλλά τις περισσότερες φορές, κατά τη βελτιστοποίηση ενός ιστότοπου, χρησιμοποιούνται σε συνδυασμό:

  • διαγραφή διπλότυπων με μη αυτόματο τρόπο - κατάλληλο εάν όλα τα περιττά εντοπίστηκαν χειροκίνητα.
  • κόλληση σελίδων με χρήση ανακατεύθυνσης 301 - κατάλληλο εάν τα διπλότυπα διαφέρουν μόνο στην απουσία και την παρουσία του "www" στη διεύθυνση URL.
  • η χρήση της ετικέτας "κανονική" είναι κατάλληλη σε περίπτωση ασαφών διπλότυπων (για παράδειγμα, η προαναφερθείσα κατάσταση με κάρτες προϊόντων σε ένα ηλεκτρονικό κατάστημα) και εφαρμόζεται με την εισαγωγή ενός κωδικού όπως "link rel="canonical" href=" http://sitename.ru/ stranica-kopiya"/" εντός του μπλοκ κεφαλιού των διπλών σελίδων.
  • σωστή ρύθμιση του αρχείου robots.txt - χρησιμοποιώντας την οδηγία "Disallow", μπορείτε να απαγορεύσετε διπλότυπες σελίδες για ευρετηρίαση από τις μηχανές αναζήτησης.

συμπέρασμα

Η εμφάνιση διπλότυπων σελίδων μπορεί να αποτελέσει σοβαρό εμπόδιο στη βελτιστοποίηση του ιστότοπου και την άνοδό του στις κορυφαίες θέσεις, επομένως αυτό το πρόβλημαπρέπει να αντιμετωπιστεί σε πρώιμο στάδιο.

Διπλότυπες σελίδες σε ιστότοπους ή ιστολόγιααπό πού προέρχονται και τι προβλήματα μπορούν να δημιουργήσουν.
Αυτό θα μιλήσουμε σε αυτήν την ανάρτηση, θα προσπαθήσουμε να αντιμετωπίσουμε αυτό το φαινόμενο και να βρούμε τρόπους να ελαχιστοποιήσουμε εκείνα τα πιθανά προβλήματα που μπορεί να μας φέρουν οι διπλότυπες σελίδες στον ιστότοπο.

Ας συνεχίσουμε λοιπόν.

Τι είναι οι διπλότυπες σελίδες;

Διπλότυπες σελίδες σε οποιονδήποτε πόρο ιστούσημαίνει πρόσβαση στις ίδιες πληροφορίες σε διαφορετικές διευθύνσεις. Τέτοιες σελίδες ονομάζονται επίσης εσωτερικά διπλότυπα του ιστότοπου.

Εάν τα κείμενα στη σελίδα είναι εντελώς πανομοιότυπα, τότε τέτοια διπλότυπα ονομάζονται πλήρη ή καθαρά. Με μερικό αγώνα Τα διπλότυπα ονομάζονται ελλιπή ή ασαφή.

Ελλιπείς λήψεις- αυτές είναι σελίδες κατηγοριών, σελίδες λίστας προϊόντων και παρόμοιες σελίδες που περιέχουν ανακοινώσεις υλικού ιστότοπου.

Διπλότυπα πλήρους σελίδας- πρόκειται για εκδόσεις εκτύπωσης, εκδόσεις σελίδων με διαφορετικές επεκτάσεις, σελίδες αρχείων, αναζήτηση στον ιστότοπο, σελίδες με σχόλια και ούτω καθεξής.

Πηγές διπλότυπων σελίδων.

Στο αυτή τη στιγμήΟι περισσότερες διπλότυπες σελίδες δημιουργούνται όταν χρησιμοποιώντας σύγχρονο CMS- συστήματα διαχείρισης περιεχομένου, ονομάζονται επίσης μηχανές τοποθεσίας.

Αυτό και WordPress και Joomla και DLEκαι άλλα δημοφιλή CMS. Αυτό το φαινόμενο καταπονεί σοβαρά τους βελτιστοποιητές και τους webmasters και τους δημιουργεί επιπλέον προβλήματα.

Σε ηλεκτρονικά καταστήματαενδέχεται να εμφανίζονται διπλότυπα κατά την εμφάνιση προϊόντων ταξινομημένων κατά διάφορες λεπτομέρειες (κατασκευαστής προϊόντος, σκοπός προϊόντος, ημερομηνία παραγωγής, τιμή κ.λπ.).

Πρέπει επίσης να θυμόμαστε το περιβόητο πρόθεμα WWWκαι αποφασίστε εάν θα το χρησιμοποιήσετε στο όνομα τομέα κατά τη δημιουργία, την ανάπτυξη, την προώθηση και την προώθηση του ιστότοπου.

Όπως μπορείτε να δείτε, οι πηγές των διπλότυπων μπορεί να είναι διαφορετικές, έχω αναφέρει μόνο τις κύριες, αλλά είναι όλες γνωστές στους ειδικούς.

Διπλότυπες σελίδες, αρνητικές.

Παρά το γεγονός ότι πολλοί δεν δίνουν μεγάλη προσοχή στην εμφάνιση των διπλότυπων, αυτό το φαινόμενο μπορεί να δημιουργήσει σοβαρά προβλήματα. προβλήματα προώθησης ιστότοπου.

Η μηχανή αναζήτησης μπορεί να εξετάσει διπλότυπα όπως ανεπιθύμητακαι, ως αποτέλεσμα, μειώνει σοβαρά τη θέση τόσο αυτών των σελίδων όσο και του ιστότοπου συνολικά.

Κατά την προώθηση ενός ιστότοπου με συνδέσμους, ενδέχεται να προκύψει η ακόλουθη κατάσταση. Σε κάποιο σημείο, η μηχανή αναζήτησης θα θεωρήσει ως το πιο αντίστοιχη διπλότυπη σελίδα, και όχι αυτή που προωθείτε με συνδέσμους και όλοι οι κόποι και τα κόστη σας θα είναι μάταια.

Υπάρχουν όμως άνθρωποι που προσπαθούν χρησιμοποιήστε διπλά για να αυξήσετε το βάροςστις επιθυμητές σελίδες, την κύρια, για παράδειγμα, ή οποιαδήποτε άλλη.

Μέθοδοι αντιμετώπισης διπλότυπων σελίδων

Πώς να αποφύγετε τα διπλότυπα ή πώς να ακυρώσετε αρνητικά σημείαόταν εμφανίζονται;
Και γενικά, αξίζει κάπως να παλέψεις ή να τα δώσεις όλα στο έλεος των μηχανών αναζήτησης. Ας το καταλάβουν μόνοι τους, αφού είναι τόσο έξυπνοι.

Χρήση robots.txt

Robots.txtείναι ένα αρχείο που βρίσκεται στον ριζικό κατάλογο του ιστότοπού μας και περιέχει οδηγίες για ρομπότ αναζήτησης.

Σε αυτές τις οδηγίες, καθορίζουμε ποιες σελίδες στον ιστότοπό μας θα ευρετηριαστούν και ποιες όχι. Μπορούμε επίσης να καθορίσουμε το όνομα του κύριου τομέα του ιστότοπου και το αρχείο που περιέχει τον χάρτη ιστότοπου.

Για να απενεργοποιήσετε την ευρετηρίαση σελίδων Χρησιμοποιείται η οδηγία απαγόρευσης. Είναι αυτό που χρησιμοποιείται από τους webmasters για να κλείσουν διπλότυπες σελίδες από την ευρετηρίαση, και όχι μόνο διπλότυπα, αλλά και οποιεσδήποτε άλλες πληροφορίες που δεν σχετίζονται άμεσα με το περιεχόμενο των σελίδων. Για παράδειγμα:

Disallow: /search/ - κλείστε τις σελίδες αναζήτησης ιστότοπου
Απαγόρευση: /*? - κλείστε τις σελίδες που περιέχουν το ερωτηματικό "?"
Απαγόρευση: /20* - κλείσιμο σελίδων αρχειοθέτησης

Χρησιμοποιώντας το αρχείο .htaccess

αρχείο .htaccess(χωρίς επέκταση) βρίσκεται επίσης στον ριζικό κατάλογο του ιστότοπου. Για να καταπολεμήσετε τα διπλότυπα σε αυτό το αρχείο, ρυθμίστε τη χρήση του 301 ανακατευθύνσεις.
Αυτή η μέθοδος βοηθά να διατηρούνται καλά οι δείκτες ιστότοπου. αλλαγή του CMS του ιστότοπου ή αλλαγή της δομής του.Το αποτέλεσμα είναι μια σωστή ανακατεύθυνση χωρίς απώλεια μάζας συνδέσμου. Σε αυτήν την περίπτωση, το βάρος της σελίδας στην παλιά διεύθυνση θα μεταφερθεί στη σελίδα στη νέα διεύθυνση.
Οι ανακατευθύνσεις 301 χρησιμοποιούνται επίσης κατά τον προσδιορισμό του κύριου τομέα ενός ιστότοπου - με WWW ή χωρίς WWW.

Χρησιμοποιώντας την ετικέτα REL = "CANNONICAL"

Χρησιμοποιώντας αυτήν την ετικέτα, ο webmaster υποδεικνύει στη μηχανή αναζήτησης την πηγή, δηλαδή τη σελίδα που πρέπει να ευρετηριαστεί και να λάβει μέρος στην κατάταξη των μηχανών αναζήτησης. Η σελίδα ονομάζεται κανονική. Η καταχώρηση HTML θα μοιάζει με αυτό:

Όταν χρησιμοποιείτε CMS WordPress, αυτό μπορεί να γίνει στις ρυθμίσεις ενός τόσο χρήσιμου plugin ως All in One Seo Pack.

Πρόσθετα μέτρα κατά των αντιγράφων για το CMS WordPress

Έχοντας εφαρμόσει όλες τις παραπάνω μεθόδους αντιμετώπισης διπλότυπων σελίδων στο blog μου, είχα πάντα την αίσθηση ότι δεν έκανα ό,τι ήταν δυνατό. Επομένως, αφού έψαξα στο Διαδίκτυο, μετά από διαβούλευση με επαγγελματίες, αποφάσισα να κάνω κάτι άλλο. Τώρα θα το περιγράψω.

Αποφάσισα να εξαλείψω τα διπλότυπα που δημιουργούνται στο ιστολόγιο, όταν χρησιμοποιώντας άγκυρες,Μίλησα για αυτά στο άρθρο "HTML Anchors". Στα ιστολόγια WordPress, δημιουργούνται άγκυρες όταν εφαρμόζεται η ετικέτα. "#περισσότερα" και όταν χρησιμοποιείτε σχόλια. Η σκοπιμότητα της χρήσης τους είναι μάλλον αμφιλεγόμενη, αλλά προφανώς παράγουν διπλότυπα.
Τώρα πώς μπορώ να διορθώσω αυτό το πρόβλημα.

Ας αντιμετωπίσουμε πρώτα την ετικέτα #περισσότερα.

Βρέθηκε ένα αρχείο όπου έχει σχηματιστεί. Μάλλον μου είπαν.
Αυτό είναι ../wp-includes/post-template.php
Στη συνέχεια βρήκα το απόσπασμα προγράμματος:

ID)\" class= \"more-link\">$more_link_text", $more_link_text);

Το τμήμα που σημειώνεται με κόκκινο έχει αφαιρεθεί.

#more-($post->ID)\" class=

Και κατέληξα σε μια γραμμή όπως αυτή.

$output .= apply_filters('the_content_more_link', ' $more_link_text", $more_link_text);

Κατάργηση αγκυρώσεων σχολίων #comment

Τώρα ας περάσουμε στα σχόλια. Το κατάλαβα ήδη μόνος μου.
Αποφάσισα και για το φάκελο ../wp-includes/comment-template.php
Βρίσκοντας το σωστό κομμάτι κώδικα

επιστρέψτε application_filters('get_comment_link', $link . "#σχόλιο-" . $comment->comment_ID, $comment, $args);)

Ομοίως, αφαιρέθηκε το κομμάτι που σημειώθηκε με κόκκινο χρώμα. Πολύ προσεκτικά, προσεκτικά, μέχρι κάθε σημείο.

. "#σχόλιο-" . $comment->comment_ID

Καταλήγουμε στην ακόλουθη γραμμή κώδικα.

επιστροφή apply_filters('get_comment_link', $link, $comment, $args);
}

Φυσικά, τα έκανε όλα αυτά, έχοντας προηγουμένως αντιγράψει τα υποδεικνυόμενα αρχεία προγράμματος στον υπολογιστή του, έτσι ώστε σε περίπτωση αποτυχίας να είναι εύκολο να επαναφέρετε την κατάσταση στις αλλαγές.

Ως αποτέλεσμα αυτών των αλλαγών, όταν κάνω κλικ στο κείμενο "Διαβάστε το υπόλοιπο της καταχώρησης ...", λαμβάνω μια σελίδα με την κανονική διεύθυνση και χωρίς την προσθήκη στην ουρά διεύθυνση με τη μορφή "#περισσότερα-. ...». Επίσης, όταν κάνω κλικ στα σχόλια, λαμβάνω μια κανονική κανονική διεύθυνση χωρίς το πρόθεμα με τη μορφή «#comment-…».

Έτσι, ο αριθμός των διπλότυπων σελίδων στον ιστότοπο μειώθηκε κάπως. Αλλά δεν μπορώ να πω τι άλλο θα σχηματίσει το WordPress μας εκεί. Θα συνεχίσουμε να παρακολουθούμε το θέμα.

Και εν κατακλείδι, φέρνω στην προσοχή σας ένα πολύ καλό και κατατοπιστικό βίντεο για αυτό το θέμα. συνιστώ ανεπιφύλακτα να παρακολουθήσετε.

Με υγεία και επιτυχία. Θα σε δω την επόμενη φορά.

Χρήσιμα Υλικά: