Όλοι ξέρουν ότι δεν μπορώ να ζήσω χωρίς το Joomla, αλλά κατά τη γνώμη μου, καλό φόρουμσε εξαρτήματα, αρ. Γι' αυτό δουλεύω με μηχανές φόρουμ. Ένα από τα νέα που άρχισα να χρησιμοποιώ πρόσφατα είναι η έναρξη μιας νέας κατηγορίας SMF, ελπίζω με χρήσιμο υλικό. Ξεκινάμε μικρά, καλά, ως αρχάριοι πολύ χρήσιμο.
Τα πρώτα βήματα μέσα βελτιστοποίηση μηχανών αναζήτησης Απλές ΜηχανέςΦόρουμ: κατάργηση πνευματικών δικαιωμάτων και εξωτερικοί σύνδεσμοι
Θα κάνω μια κράτηση αμέσως ότι δουλεύω μόνο με το smf 2 και αυτό το άρθρο θα αναφέρεται συγκεκριμένα σε αυτήν την έκδοση του δωρεάν μηχανισμού φόρουμ.
Και έτσι, οι τακτικοί αναγνώστες γνωρίζουν πόσο δεν μου αρέσει να βάζω "10" εξωτερικούς συνδέσμους στους επίσημους ιστότοπους των κινητήρων, συμπεριλαμβανομένων εκείνων του φόρουμ. Αυτός είναι ο λόγος για τον οποίο, πρώτα απ 'όλα, αφαιρούμε τα πνευματικά δικαιώματα και έως και 4, προσοχή 4 εξωτερικούς συνδέσμους της φόρμας " SMF 2.0.2 | Απλές Μηχανές | SMF © 2011 | XHTML" ! Για να το κάνετε αυτό, συνδεθείτε στον ιστότοπο μέσω φόρουμ FTP/Θέματα/ όνομα του θέματός σας/ και επεξεργαστείτε το αρχείο index.template.php. Φυσικά, στο κάτω μέρος βρίσκεται ο κωδικός (περίπου η γραμμή 330), ο οποίος εμφανίζει εξωτερικούς συνδέσμους που δεν μας αρέσουν τόσο πολύ. Επομένως, αφαιρούμε: "
Ας ξεκινήσουμε αμέσως με τον κύριο κώδικα σεναρίου:
#!/usr/bin/perl
# which-forum.pl σενάριο
# (γ) 2010 Alexandr A Alexeev, http://website/
χρήση αυστηρή?
# σχολιασμένες γραμμές - για αυστηρότητα
# εάν η εργασία είναι η συλλογή στατιστικών στοιχείων κινητήρα, αφήστε το ως έχει
# εάν κάνετε μια λίστα με φόρουμ - απορρίψτε το σχόλιο
τα $δεδομένα μου ;
$data .= $_ ενώ (<>
)
;
# ελέγξτε πόσα τροφοδοτήθηκαν από phpBB χωρίς σύνδεσμο υποσέλιδου Αυτό και άλλα σενάρια που αναφέρονται στην ανάρτηση βρίσκονται σε αυτό το αρχείο. Γραφή which-forum.plεξετάζει τον κώδικα της σελίδας html για την παρουσία υπογραφών μηχανών φόρουμ σε αυτόν. Χρησιμοποιήσαμε παρόμοια τεχνική κατά τον ορισμό του WordPress και του Joomla, αλλά υπάρχουν μερικές διαφορές. Πρώτον, το ίδιο το σενάριο δεν φορτώνει τον κώδικα της σελίδας, αλλά τον διαβάζει από το stdin ή ένα αρχείο που μεταβιβάζεται ως όρισμα. Αυτό μας επιτρέπει να κατεβάσουμε τη σελίδα μία φορά, για παράδειγμα, χρησιμοποιώντας το wget, και στη συνέχεια να την εκτελέσουμε μέσω πολλών αναλυτών, εάν έχουμε περισσότερους από έναν. Δεύτερον, σε αυτό το σενάριο, η παρουσία υπογραφής είναι 100% σημάδι του κινητήρα. Την προηγούμενη φορά, η παρουσία της υπογραφής έδωσε μόνο βάρος στον αντίστοιχο κινητήρα και «κέρδισε» τον κινητήρα με το μεγαλύτερο βάρος. Αποφάσισα ότι σε αυτήν την περίπτωση, μια τέτοια προσέγγιση θα περιέπλεκε άσκοπα τον κώδικα. Για να δοκιμάσω το σενάριο, έκανα μια μικρή έρευνα. Συνέταξα μια λίστα με πολλές χιλιάδες φόρουμ και έτρεξα καθένα από αυτά μέσω του σεναρίου μου, προσδιορίζοντας έτσι το ποσοστό των ενεργοποιήσεων προγραμμάτων και τη δημοτικότητα των διαφόρων μηχανών. Για να λάβω τη λίστα των φόρουμ, χρησιμοποίησα τον αναλυτή μου Google. μηχανή αναζήτησηςαποστολή αιτημάτων όπως site:forum.*.ru και ούτω καθεξής. Μπορείτε να βρείτε τον πλήρη κώδικα δημιουργίας ερωτημάτων στο αρχείο gen-forumsearch-urls.pl. Εκτός από τη ζώνη .ru, χρησιμοποιήθηκαν επίσης τα .su .ua .kz και .by. Ήταν δύσκολο να διεξαχθεί μια τέτοια μελέτη την προηγούμενη φορά, καθώς οι ιστότοποι WordPress και Joomla δεν έχουν τέτοιες υπογραφές στη διεύθυνση URL. Κατάλογοι όπως ο cmsmagazine.ru/catalogue/ δεν παρέχουν επαρκές μέγεθος δείγματος. Τι είναι 600 ιστότοποι στο Drupal; Πρέπει να ομολογήσω ότι τα αποτελέσματα του πειράματος με απογοήτευσαν. Από τις 12.590 τοποθεσίες που μελετήθηκαν, μόνο 7.083 κινητήρες αναγνωρίστηκαν με επιτυχία, δηλαδή μόνο στο 56% των περιπτώσεων. Ίσως δεν έλαβα υπόψη μου κάποιον κινητήρα; Το Bitrix στάθηκε στα μισά φόρουμ; Ή θα έπρεπε να είχα περάσει περισσότερο χρόνο ψάχνοντας για υπογραφές; Γενικά, εδώ χρειάζεται περισσότερη έρευνα. Μεταξύ του 56% των κινητήρων που εντοπίστηκαν με επιτυχία, οι IPB (31%), phpBB (26,6%) και vBulletin (26,5%) ήταν οι πιο δημοφιλείς, όπως αναμενόταν. Ακολουθούν στενά το SMF (5,8%) και το DLEForum (5,3%). Το αγαπημένο μου punBB ήταν μόνο στην 6η θέση (1,64%). Δεν θα συμβούλευα να εμπιστευτείτε σθεναρά αυτά τα στοιχεία (λένε ότι κάθε τρίτο φόρουμ στο Runet λειτουργεί σε IPB), αλλά, φυσικά, μπορούν να εξαχθούν ορισμένα συμπεράσματα. Για παράδειγμα, εάν σκοπεύετε να δημιουργήσετε έναν ιστότοπο σε μια μηχανή φόρουμ και σκοπεύετε να τροποποιήσετε το φόρουμ, ας πούμε, να πληρώσετε στους χρήστες 0,01 $ για κάθε μήνυμα με αυτόματη ανάληψη χρημάτων μία φορά την εβδομάδα, τότε θα πρέπει να επιλέξετε μία από τις τρεις πιο δημοφιλείς μηχανές . Όσο πιο δημοφιλές είναι το φόρουμ, τόσο πιο πιθανό είναι να βρεθεί ένας προγραμματιστής που να το γνωρίζει καλά. Εάν δεν αναμένονται σημαντικές αλλαγές στον κινητήρα, τότε μπορεί να έχει νόημα να επιλέξετε έναν λιγότερο δημοφιλή κινητήρα, όπως SMF ή punBB. Αυτό θα μειώσει τον αριθμό επιθέσεις χάκερστο φόρουμ σας και τον αριθμό των ανεπιθύμητων μηνυμάτων που αποστέλλονται αυτόματα σε αυτό. Τα σενάρια για αναζήτηση / καθορισμό φόρουμ μπορούν επίσης να βρουν περισσότερα από ένα πρακτική χρήση. Το πρώτο πράγμα που μου ήρθε στο μυαλό προσωπικά ήταν να ταξινομήσω τα φόρουμ που προσδιορίστηκαν κατά TCI και να τοποθετήσω αναρτήσεις με συνδέσμους σε έναν από τους ιστότοπούς τους στα πρώτα εκατό. Ωστόσο, εκατό σύνδεσμοι dofollow του φόρουμ δεν επηρέασαν με κανέναν τρόπο το TIC (2 ενημερώσεις έχουν περάσει), επομένως είναι καλύτερα να μην χάνετε χρόνο εδώ εκτός και αν σας ενδιαφέρουν οι μεταβάσεις. Είναι σαφές ότι η ονομαστική χρήση σεναρίων απέχει πολύ από τη μοναδική. Νομίζω ότι μπορείτε εύκολα να καταλάβετε πώς αλλιώς μπορείτε να τα χρησιμοποιήσετε. Διοργανώθηκε από την Botmaster Labs, δεν έχει προγραμματιστεί. Δεν υπάρχει χρόνος, το βίντεο χρειάζεται για τον διαγωνισμό, ως μια νέα τάση, αν και είναι πιο εύκολο να εξηγήσω τα πάντα με καλά στιγμιότυπα οθόνης (το IMHO μου) και δεν θέλω πραγματικά να τραβήξω τίποτα. Έχουν απομείνει πολύ λίγα κερδοφόρα θέματα, το ανόητο spam δεν κυριαρχεί πλέον καθόλου, εδώ πρέπει να σκεφτείτε και κανείς δεν θα πυροβολήσει το θέμα, αν μόνο οι απαρχαιωμένοι προσπαθήσουν να το βάλουν σε ένα όμορφο περιτύλιγμα και λίγο πούδρα. :) Αλλά αυτό δεν αφορά εμάς. Γενικά, αυτά τα 3 «όχι», νομίζω, ουσιαστικά έγιναν εμπόδια συμμετοχής στον διαγωνισμό για τους περισσότερους πιθανούς συμμετέχοντες. Είναι όπως με την επισκευή ενός αυτοκινήτου από τα τρία: φθηνό, υψηλής ποιότητας, γρήγορο - στο σέρβις μπορούν να εκπληρώσουν μόνο 2 προϋποθέσεις ταυτόχρονα. κάτσε και διάλεξε τι είναι πιο κοντά σου. :) Το ίδιο συμβαίνει και με τον διαγωνισμό: έχω χρόνο, μπορώ να κάνω βίντεο, αλλά δεν υπάρχει θέμα, ή μπορώ να κάνω βίντεο, έχω θέμα, αλλά δεν έχω καθόλου χρόνο, ή υπάρχει ελεύθερος χρόνος και υπάρχει ένα μικρό θέμα, αλλά το βίντεο τρομάζει. Αλλά καλό είναι να πληρούνται 2 προϋποθέσεις ταυτόχρονα. Εντάξει, ας αφήσουμε τους στίχους. Θα συνεχίσω στον εαυτό μου. Δεν το σχεδίαζα, οπότε θα συμμετάσχω στον διαγωνισμό, επέλεξα μάλιστα ποιο άρθρο θα ψηφίσω. Πείτε αυτό που σας αρέσει, αλλά ο Doz γνωρίζει πολύ καλά το λογισμικό και ξέρει πώς να το χρησιμοποιεί πολύ λογικά. Σήμερα όμως έμαθα ότι εμφανίστηκε ίντριγκα στον διαγωνισμό. Αποδεικνύεται ότι δεν θα μπορώ να ψηφίσω, αλλά μόνο οι αρχάριοι που αγόρασαν το λογισμικό το 2011 και ο διαγωνισμός έχει σχεδιαστεί για αυτούς μπορούν να το κάνουν. Ήμουν λίγο έκπληκτος, αλλά ο ιδιοκτήτης είναι ένας κύριος. Ο διαγωνισμός είναι μια διαφημιστική καμπάνια και ο Αλέξανδρος ξέρει καλύτερα πώς να τον διεξάγει. Σε γενικές γραμμές, αποφάσισα τότε να δημοσιεύσω ένα άρθρο, είναι κάπως πιο εύκολο να γράψω όταν είναι σαφές για ποιον, στην πραγματικότητα, είναι αδύνατο να γίνει αυτό για ολόκληρο το συλλογικό αγρόκτημα. Τροφοδοτείται από php-Fusion Στην έκδοση 7.07 του Chrumer, το πρόγραμμα έχει εκπαιδευτεί με αρκετούς νέους κινητήρες: forumi.biz, forumb.biz, 1forum.biz, 7forum.biz, κ.λπ. phpBB-fr.com, θέμα Solaris phpBB Και η διαδικασία εκμάθησης νέων πραγμάτων συνεχίζεται συνεχώς. Τροφοδοτείται από SMF 1.1.2 Τροφοδοτείται από SMF 1.1.3 Τροφοδοτείται από SMF 1.1 RC2 Τροφοδοτείται από SMF 1.1.4 Τροφοδοτείται από SMF 1.1.8 Τροφοδοτείται από SMF 1.1.7 "2006-2008, Simple Machines LLC" Και δεν είναι μόνο αυτό. Όταν συλλέγουμε εκδόσεις κινητήρων, βρίσκουμε την προεξοχή "2001-2006, Lewis Media" στο υποσέλιδο σε ορισμένα φόρουμ SMF. Ελέγχουμε αυτό το αίτημα, μας ικανοποιεί επίσης πλήρως. Βρίσκουμε ένα παρόμοιο ερώτημα: "2001-2005, Lewis Media". Εκτελώντας περαιτέρω τα υποσέλιδα, βρίσκουμε το ακόλουθο αίτημα: "SMFone design by A.M.A, ported to SMF 1.1". Ελέγξτε το - υπέροχο. Και ούτω καθεξής. Μισή ώρα εργασίας και έχετε μια υπέροχη βάση δεδομένων με ερωτήματα στον κινητήρα, και για αυτά τα ερωτήματα η Google θα απαγορεύσει πολύ λιγότερο συχνά από ό,τι αν χρησιμοποιείτε τελεστές σε αυτά. Και ταυτόχρονα, η βάση δεδομένων σας θα είναι πολύ πιο καθαρή από ό,τι αν χρησιμοποιείτε ερωτήματα όπως "index.php?topic=", γιατί εδώ η Google θα δώσει όχι μόνο τα φόρουμ που χρειαζόμαστε, αλλά και πολλούς πόρους όπου ήταν δυνατό αφήστε έναν σύνδεσμο στο θέμα του φόρουμ. Μπορείς να διαφωνήσεις, λένε, τι φταίει αυτό; Άλλοι άφησαν έναν σύνδεσμο, για να μπορούμε. Αλλά! Οι σύνδεσμοι μπορούν να αφεθούν όχι μόνο από το Hrumer, αλλά και από άλλα προγράμματα. Επιπλέον, μπορούν να ενισχυθούν ειδικά για την υποβολή σχολίων σε έναν συγκεκριμένο πόρο, το λεγόμενο εξαιρετικά εξειδικευμένο λογισμικό, καθώς και τέτοιοι σύνδεσμοι θα μπορούσαν να αφεθούν με το χέρι. Και πάλι, επαναλαμβάνω, δεν είναι η ποσότητα των σκουπιδιών που μας ενδιαφέρει, αλλά η ποιότητα, θα συλλέξουμε τη βάση με τα σωστά αιτήματα ούτως ή άλλως. Συν αυτή τη μέθοδοεπίσης στο γεγονός ότι πρακτικά δεν θα χρειαστεί να κάνετε ρυθμίσεις κόσκινο-φίλτρο
伟哥 - βιάγκρα 吉他 - κιθάρα 其他 - ξεκούραση 保险公司 - ασφάλιση Τοποθετήστε αυτούς τους κωδικούς στο αρχείο Words για να τους αντικαταστήσετε: %E4%BC%9F%E5%93%A5 %E5%90%89%E4%BB%96 %E5%85%B6%E4%BB%96 %E4%BF%9D%E9%99%A9%E5%85%AC%E5%8F%B8 Εάν προωθείτε έναν ιστότοπο για ασφάλιση, τότε δημοσιεύοντας έναν σύνδεσμο στο προφίλ σας σε ένα θεματικό (!) ακόμη και ένα κινέζικο φόρουμ που βρίσκεται κατόπιν αιτήματος " φόρουμ SMF" 保险公司θα είναι πολύ καλό.
εκτύπωση "phpbb \n"
εάν ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?phpbb\.com\/?"[^>]*>phpBB/iή
# $data =~ /viewforum\.php\?[^""]*f=\d+/i ή
$data =~ /phpBB\-SEO/i ή
$δεδομένα =~ /)
;
εκτύπωση "ipb \n"
εάν ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?invision(?:board|power)\.com\/?[^"]*"[^>]*> [^<]*IP\.Board/i
ή
$δεδομένα =~ /]+href="[^"]*http:\/\/(?:www\.)?invisionboard\.com\/?"[^>]*>Invision Power Board/iή
$δεδομένα =~ /
$δεδομένα =~ /index\.php\?[^""]*showforum=\d+/i)
;
εκτύπωση "vbulletin \n"
εάν ($data =~ /Με την υποστήριξη:?[^<]+vBulletin[^<]+(?:Version)?/i
ή
$δεδομένα =~ /)
;
εκτύπωση "smf \n"
εάν ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?simplemachines\.org\/?"[^>]*>Με την υποστήριξη του SMF/iή
$δεδομένα =~ /index\.php\?[^""]*board=\d+\.0/i)
;
εκτύπωση "punbb \n"
εάν ($data =~ /]+href="[^"]*http:\/\/(?:(?:www\.)?punbb\.org|punbb\.informer\.com)\/?"[^>]*> PunBB/i) ; #ή
# $data =~ /viewforum\.php\?[^""]*id=\d+/i);
εκτύπωση "fluxbb \n"
# if($data =~ /viewtopic\.php\?id=\d+/i ή
εάν ($data =~ /]+href="http:\/\/(?:www\.)fluxbb\.org\/?"[^>]*>FluxBB/i)
;
εκτύπωση "exbb \n"
εάν ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?exbb\.org\/?"[^>]*>ExBB/i) ; # ή
# $data =~ /forums\.php\?[^""]*forum=\d+/i);
εκτύπωση "yabb \n"
εάν ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?yabbforum\.com\/?"[^>]*>YaBB/iή
$data =~ /YaBB\.pl\?[^""]*num=\d+/i ) ;
εκτύπωση "dleforum \n"
εάν ($data =~ /\(Με την υποστήριξη του φόρουμ DLE\)<\/title>/Εγώή
$δεδομένα =~ /]+href="[^"]+(?:http:\/\/(?:www\.)?dle\-files\.ru|act=copyright)[^"]*">Φόρουμ DLE<\/a>/Εγώ)
;
εκτύπωση "εικονικός πίνακας \n"
εάν ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?ikonboard\.com\/?[^"]*"[^>]*>Ikonboard/iή
$δεδομένα =~ /\n"
εάν ($data =~ /\n"
# if($data =~ /forums\.php\?fid=\d+/i ή
# $data =~ /topic\.php\?fid=\d+/i ή
εάν ($data =~ /]+href="http:\/\/(?:www\.)?flashbb\.net\/?"[^>]*>FlashBB/i)
;
εκτύπωση "stokesit \n"
# if($data =~ /forum\.php\?f=\d+/i ή
εάν ($data =~ /]+href="http:\/\/(?:www\.)?stokesit\.com\.au\/?"[^>]*>[^\/]*Stokes IT/i)
;
εκτύπωση «βάθρο \n"
# if($data =~ /topic\.php\?t=\d+/i ή
εάν ($data =~ /]+href=[""]?http:\/\/(?:www\.)?sopebox\.com\/?[""]?[^>]*>Podium/i)
;
εκτύπωση "usebb \n"
# if($data =~ /forum\.php\?id=\d+/i ή
εάν ($data =~ /]+href="http:\/\/(?:www\.)?usebb\.net\/?"[^>]*>UseBB/i)
;
εκτύπωση "wrforum \n"
# if($data =~ /index\.php\?fid=\d+/i ή
εάν ($data =~ /]+href="http:\/\/(?:www\.)?wr\-script\.ru\/?"[^>]*>WR\-Forum/i)
;
εκτύπωση "yetanotherforumnet \n"
εάν ($data =~ /Ένα άλλο Φόρουμ\.net/i ή
$δεδομένα =~ /default\.aspx\?g=posts&t=\d+/i)
;
site:talk.*.ru
site:board.*.ru
site:smf.*.ru
site:phpbb.*.ru
....
Η μακρά εισαγωγή τελείωσε, τώρα στο θέμα.
Τι χρειάζεται ένας αρχάριος όταν έχει αποκτήσει έναν τέτοιο σούπερ-θεριστή, που είναι το σύμπλεγμα Xrumer + Hrefer; Αυτό είναι σωστό, μάθετε πώς να το δουλέψετε και απορρίψτε την ψευδαίσθηση ότι ξεκινώντας να στέλνετε ανεπιθύμητα φύλλα, μπορείτε να κερδίσετε χρήματα. Αν νομίζετε ότι ναι, δωρίστε αμέσως τα χρήματά σας σε φιλανθρωπικούς σκοπούς. Πρέπει να μάθετε πώς να χρησιμοποιείτε τα εργαλεία του συγκροτήματος, κατά προτίμηση να το ακονίζετε μόνοι σας. Ο χρόνος να «πάρουμε περισσότερα - να ρίξουμε περισσότερα» έχει τελειώσει. Η ποσότητα δίνει τη θέση της στην ποιότητα. Έτσι θα συλλέξουμε τη βάση για τον εαυτό μας, μην μάθετε πώς να το κάνετε - θα πέσετε πίσω από το τρένο. Φυσικά, η Khrefer θα μας βοηθήσει σε αυτό. Εάν σκοπεύετε να προωθήσετε τους πόρους σας στο Google, τότε πρέπει επίσης να αναζητήσουμε ιστότοπους χορηγών μέσω της Google. Νομίζω ότι αυτό είναι κατανοητό και λογικό. Όμως η Google, ως ερωμένη του χάλκινου βουνού, δεν χαρίζει τον πλούτο της σε όλους. Χρειάζεται μια προσέγγιση. Θα ήθελα να πω αμέσως ότι μην ελπίζετε ότι σύμφωνα με τα σημάδια που θα βρείτε στο κοινό, θα μπορέσετε να μαζέψετε κάτι. Γι' αυτό είναι διαθέσιμα στο κοινό γιατί δεν έχουν αξία. Δεν θα αναπτύξω περαιτέρω το θέμα. Είναι καλύτερα να σας πούμε πώς να το συναρμολογήσετε σωστά, ώστε να δείτε το αποτέλεσμα, τα υπόλοιπα θα ολοκληρώσετε μόνοι σας, το κύριο πράγμα είναι να κατανοήσετε την αρχή. Είναι απαραίτητο να συλλέγουμε σύμφωνα με το σωστό σύμφωνα με τα σημάδια συγκεκριμένων κινητήρων που χρειαζόμαστε και όχι με τα σημάδια των φόρουμ γενικά. Αυτό κύριο λάθοςαρχάριοι - μην επικεντρωθείτε σε ένα συγκεκριμένο, αλλά προσπαθήστε να καλύψετε τα πάντα ως σύνολο. Και όμως, αν θέλετε να αναλύσετε μια περισσότερο ή λιγότερο κανονική βάση, αρνηθείτε να χρησιμοποιήσετε τελεστές σε ερωτήματα. Χωρίς "inurl:", "site:", "title" κ.λπ. Η Google θα απαγορεύσει αμέσως όσους αναζητούν σαν εσάς. Επομένως, μελετάμε προσεκτικά τους κινητήρες με τους οποίους επί του παρόντοςΟ Hrumer εργάζεται:
Γενικά, πρέπει να προετοιμάσουμε τα σωστά ερωτήματα για ανάλυση από τον Khrefer. Ας πάρουμε το φόρουμ dizhok ως παράδειγμα. Φόρουμ SMF. Και θα αρχίσουμε να το αποσυναρμολογούμε σε μέρη για ανάλυση. Η αγαπημένη μας Google θα μας βοηθήσει σε αυτό. Εισαγωγή ερωτήματος Google Φόρουμ SMF- πολλά σκουπίδια στο τεύχος, γυρίστε πίσω σε κάποια 13η σελίδα και επιλέξτε οποιοδήποτε σύνδεσμο. Συνάντησα αυτό: http://www.volcannohost.com/forum/index.php?topic=11.0 . Ας το ανοίξουμε και ας το εξερευνήσουμε. Πρέπει να βρούμε κάτι χαρακτηριστικό στη σελίδα που μπορεί να εφαρμοστεί στην αναζήτηση άλλων σελίδων σε αυτήν τη μηχανή. Στο υποσέλιδο παρατηρούμε την παρακάτω επιγραφή Τροφοδοτείται από SMF 1.1.14, το παραθέτουμε και το εισάγουμε στο Google, μας δείχνει ότι για αυτό το αίτημα γνωρίζει περίπου 59 εκατομμύρια επιλογές. Ξεφυλλίζουμε τους συνδέσμους, προσθέτουμε μερικές ακόμη επιλογές σε αυτήν τη λέξη-κλειδί, για παράδειγμα, Λεύκα "Powered by SMF 1.1.14".ή Τροφοδοτείται από SMF 1.1.14 viagra. Είμαστε πεπεισμένοι ότι το αίτημα είναι σικ, στην έκδοση μόνο φόρουμ και σχεδόν καθόλου σκουπίδια για εσάς.
Άλλωστε δεν μας ενδιαφέρει η ποσότητα, αλλά η ποιότητα, όπως είπα παραπάνω. Προχώρα. Από το ίδιο φόρουμ παίρνουμε μια άλλη φράση από το υποσέλιδο: , επίσης παραθέστε το και τροφοδοτήστε το στο Google. Σε απάντηση, αποκαλύπτει ότι γνωρίζει περισσότερα από 13 εκατομμύρια αποτελέσματα. Και πάλι, ξεπερνάμε την έξοδο, προσθέτουμε επιπλέον λέξεις και ελέγχουμε την έξοδο μαζί τους. Φροντίζουμε το αίτημα να είναι εξαιρετικό και επίσης να μην υπάρχουν σχεδόν σκουπίδια. Γενικά, υπάρχουν ήδη 2 σιδερένια αιτήματα. Προτείνω το πρώτο φόρουμ να μείνει μόνο του προς το παρόν και να συνεχίσει να συλλέγει αιτήματα από άλλα φόρουμ. Ευτυχώς, η Google είναι ανοιχτή κατόπιν αιτήματος 2006-2008 Simple Machines LLC. Παίρνουμε από το θέμα, για παράδειγμα, αυτά τα φόρουμ: http://www.snowlinks.ru/forum/index.php?topic=1062.0 και http://litputnik.ru/forum/index.php?action=printpage; topic=380.0 στα υποσέλιδα παίρνουμε τα ακόλουθα αιτήματα από αυτούς: "Powered by SMF 1.1.7" and "Powered by SMF 1.1.10" (Σας συμβουλεύω πάντα να οδηγείτε αιτήματα για Khrefer σε εισαγωγικά, γιατί χρειαζόμαστε ποιότητα πρώτα από όλα). Νομίζω ότι είναι ξεκάθαρο τι κάνουμε, στο τέλος θα έχουμε μια συγκεκριμένη βάση δεδομένων ερωτημάτων για αναζήτηση φόρουμ στη μηχανή SMF (επιλέχθηκε ως παράδειγμα, με τους υπόλοιπους κινητήρες είναι παρόμοια).
Θα μοιάζει κάπως έτσι:
Πιστεύω ότι είναι πολύ σημαντικό να μάθετε πώς να χρησιμοποιείτε σωστά το Chrefer στο αρχικό στάδιο, γιατί έχοντας μάθει αυτό, μπορείτε πάντα να βρείτε μια χρήση για το Chrumer, ανεξάρτητα από το πώς αλλάζει η κατάσταση. Οι άμυνες γίνονται πιο περίπλοκες και αν σε ορισμένους τύπους κινητήρων έχουν ενισχύσει την προστασία και δεν μπορούν να την αντιμετωπίσουν σε αυτή τη στιγμή Hrumer, δεν έχει νόημα να ξοδεύουμε πόρους για τη συλλογή αυτών των συνδέσμων και στη συνέχεια να δουλεύουμε πάνω τους ως Hrumer, είναι καλύτερα να εστιάσουμε σε αυτό που δίνει το αποτέλεσμα. Ταυτόχρονα, εάν η ομάδα του Botmaster Labs έχει διδάξει στον Chrumer κάτι νέο, μπορείτε να αναλύσετε γρήγορα έναν νέο ασθενή και να προετοιμάσετε τη βάση του Chrumer όσο ο ασθενής είναι ακόμα ζεστός. Ο χρόνος είναι χρήμα, ο πόρος μπορεί να μην είναι πλέον σχετικός όταν αγοράζετε τη βάση. συλλέγονται από κάποιον. Επιπλέον, η σωστή συλλογή βάσεων για τον εαυτό σας επεκτείνει πολύ τη «λευκή» χρήση του Khrumer. Και εδώ ακριβώς κινούνται όλα, είτε το θέλουμε είτε όχι, αλλά η διαδικασία της λεύκανσης ή του γκριζαρίσματος συνεχίζεται. Μαύρα σεντόνια για όλα όσα μπορείτε να πάτε στο παρελθόν.
Όλες οι άλλες, ήδη τεχνικές πτυχές της συνεργασίας με το Hrefer μπορούν να προβληθούν στη βοήθεια και δεν έχει νόημα να σταθούμε σε αυτές, όλοι οι στόχοι-πόντους-δευτερόλεπτα ορίζονται εμπειρικά για κάθε αυτοκίνητο ξεχωριστά.
Ως μπόνους, θα δημοσιεύσω εδώ ένα πρότυπο για την ανάλυση της κινεζικής μηχανής αναζήτησης Baidu, τις προάλλες με ρώτησαν γι 'αυτό, οπότε το έκανα ενδιάμεσα, συγγνώμη για το λογοπαίγνιο. :)
Όνομα κεντρικού υπολογιστή=http://www.baidu.com
Ερώτημα=s?wd=
LinksMask=
Σύνολο σελίδων=100
Επόμενη Σελίδα=
ΕπόμενηΣελίδα2=
CaptchaURL=
CaptchaImage=
CaptchaField=
Προσπάθησα να τα αναλύσω, δεν υπήρχε απαγόρευση, η Khrefer συνέλεξε πόρους γρήγορα, όλα τα αιτήματα για ανάλυση ήταν παρόμοια με εκείνα της Google, αλλά υπήρχαν πολλοί κινεζικοί πόροι και με υψηλό PR, και επιπλέον, υπήρχαν πολλά μέρη όπου οι Ευρωπαίοι δεν είχαν πατήσει το πόδι τους. Είναι καλύτερα να κάνετε ανάλυση με κινεζικά αιτήματα. Το Google Translate θα σας βοηθήσει με αυτό, πληκτρολογήστε μια λίστα με λέξεις-κλειδιά στα ρωσικά και μεταφράστε τη στα κινέζικα. Η αλήθεια στο λόγια«Τα λόγια του Chrefer δεν μπορούν να συνδυαστούν στα κινέζικα, πρέπει να επανακωδικοποιηθούν.
Αντί για κινέζικα:
Εν κατακλείδι, θα ήθελα να πω ότι ποτέ δεν κατάλαβα τους ανθρώπους που παραπονέθηκαν ότι οι Khrefers ήταν κακοί ή δεν αναλύουν, πάντα ήθελα να το πω αυτό, απλά δεν ξέρετε πώς να τα μαγειρέψετε. Κανένας αναλυτής δεν είναι καλύτερος από έναν παραπομπή, απλά πρέπει να είναι σωστός. Το Hrefer είναι ένα αυτοκίνητο: καλό, συμπαγές, κατασκευασμένο στα γερμανικά, αλλά ένα άτομο το ελέγχει και όλα εξαρτώνται από το πόσο έξυπνα οδηγείται, δεν μπορείτε να αναγκάσετε το αυτοκίνητο να πάει δεξιά και αριστερά ταυτόχρονα.
Ξεχωριστό θέμα είναι ο καθαρισμός των βάσεων, εγώ μια φορά πριν 3 χρόνια για τον προηγούμενο διαγωνισμό. Από εκεί και πέρα, όλα εξακολουθούν να είναι σχετικά, αλλά τώρα μπορείτε να αρνηθείτε να ελέγξετε για 200 ΟΚ, πραγματικά δεν μου άρεσε αυτή η διαδικασία, τα σφάλματα ήταν πολύ μεγάλα, πολλά περιττά φιλτραρίστηκαν. Τώρα αυτό μπορεί να γίνει σχεδόν αυτόματα κατά τη διάρκεια της εργασίας του Chrumer, αν και αυτή η διαδικασία δεν είναι ένα πλήρες ανάλογο του ελέγχου για "200 OK". Σε γενικές γραμμές, στο σημείο: όχι πολύ καιρό πριν, εμφανίστηκε μια θαυμάσια ευκαιρία στο Khrumer - να κλέψουμε πληροφορίες από πόρους τη στιγμή της εκτέλεσης του έργου. Μοιάζει με αυτό. Οδηγείτε σε ένα πρότυπο που θα υποβληθεί σε επεξεργασία κατά τη διάρκεια της εργασίας και οι πληροφορίες που συλλέγονται σύμφωνα με το πρότυπο θα εισαχθούν στο αρχείο xgrabbed.txt στο φάκελο "Αρχεία". Μπορείτε να χρησιμοποιήσετε αυτή τη λειτουργία για οτιδήποτε, η πτήση της φαντασίας είναι τεράστια. Χρησιμοποιώ αυτή τη λειτουργία μία φορά την εβδομάδα για να αφαιρέσω συνδέσμους από τη "ληγμένη" βάση εργασίας. Δεν είναι μυστικό ότι τα φόρουμ σβήνουν καθημερινά για να καθαρίσουν τη βάση από τέτοιους πόρους και το εργαλείο "Αυτόματη αρπαγή" θα μας βοηθήσει σε αυτήν την περίπτωση.
Εξάλλου, πρέπει να παραδεχτείτε, πληκτρολογώντας συχνά, για παράδειγμα, http://www.laptopace.com/index.php, βλέπουμε ότι αυτός ο τομέας είναι ήδη, για παράδειγμα, goudyadya, αλλά δεν υπάρχει φόρουμ εκεί. Έτσι, για να πετάξουμε αυτή τη σκωρία από τη βάση, θα ληστέψουμε. :) Ανοίγουμε τον πηγαίο κώδικα της σελίδας και βλέπουμε αυτήν την καταχώρηση εκεί:
Τώρα όλοι οι «νεκροί» από το goudaddi θα μας είναι γνωστοί ονομαστικά.
Ακολουθεί μια μικρή επιλογή για το εργαλείο "Αυτόματη αρπαγή", εάν θέλετε να καθαρίσετε τη βάση δεδομένων από διαφορετικούς τομείς που έχουν λήξει: