Всички знаят, че просто не мога да живея без Joomla, но според мен, добър форумв компоненти, бр. Затова работя с форумни двигатели. Една от новите, които едва наскоро започнах да използвам, е Стартиране на нова SMF категория, надявам се с полезен материал. Започваме с малки, добре, като начинаещи много полезни.
Първи стъпки в Оптимизация за търсачки Прости машиниФорум: премахнете авторските права и външните връзки
Веднага ще направя резервация, че работя само с smf 2 и тази статия ще се отнася конкретно за тази версия на безплатния двигател на форума.
И така, редовните читатели знаят колко не обичам да поставям "10" външни връзки към официалните сайтове на двигатели, включително форумни. Ето защо, на първо място, премахваме авторските права и цели 4, внимание 4 външни връзки на формата " SMF 2.0.2 | Прости машини | SMF © 2011 | XHTML" ! За да направите това, свържете се със сайта чрез FTP форум/Теми/ името на вашата тема/ и редактирайте файла index.template.php. Естествено, най-отдолу е кодът (около ред 330), който показва външни връзки, които не харесваме толкова много. Затова премахваме: "
Нека започнем веднага с основния код на скрипта:
#!/usr/bin/perl
# скрипт which-forum.pl
# (c) 2010 г. Александър Алексеев, http://website/
използвайте строг;
# коментирани реда - за строгост
# ако задачата е да се съберат статистически данни за двигателя, оставете я както е
# ако правите списък с форуми - разкоментирайте
моите $данни;
$data .= $_ докато (<>
)
;
# проверете колко са били Осъществено от phpBB без връзка в долния колонтитул Този и други скриптове, споменати в публикацията, могат да бъдат намерени в този архив. Скрипт който-форум.plпроверява кода на html страницата за наличие на сигнатури на двигателя на форума в него. Използвахме подобна техника, когато дефинирахме WordPress и Joomla, но има няколко разлики. Първо, самият скрипт не зарежда кода на страницата, а го чете от stdin или файл, подаден като аргумент. Това ни позволява да изтеглим страницата веднъж, например с помощта на wget, и след това да я прекараме през няколко парсера, ако имаме повече от един. Второ, в този скрипт наличието на подпис е 100% знак на двигателя. Последният път присъствието на подписа придаде тежест само на съответния двигател и „спечели“ двигателя с най-голямо тегло. Реших, че в този случай подобен подход само ще усложни ненужно кода. За да тествам сценария, направих малко проучване. Съставих списък от няколко хиляди форума и прекарах всеки от тях през моя скрипт, като по този начин определих процента на активиране на програмата и популярността на различните двигатели. За да получа списъка с форуми, използвах моя анализатор на Google. търсачкаизпращайте заявки като сайт: форум.*.ru и така нататък. Можете да намерите пълния код на генератора на заявки във файла gen-forumsearch-urls.pl. В допълнение към зоната .ru бяха използвани и .su .ua .kz и .by. Последният път беше трудно да се проведе подобно проучване, тъй като сайтовете на WordPress и Joomla нямат такива подписи в URL адреса. Каталози като cmsmagazine.ru/catalogue/ не осигуряват достатъчен размер на извадката. Какво е 600 сайта на Drupal? Трябва да призная, че резултатите от експеримента ме разочароваха. От изследваните 12 590 обекта само 7 083 двигателя са идентифицирани успешно, тоест само в 56% от случаите. Може би не съм взел предвид някой двигател? Битрикс стоеше ли на половината форуми? Или трябваше да прекарам повече време в търсене на подписи? Като цяло тук са необходими повече изследвания. Сред 56% от успешно идентифицираните машини IPB (31%), phpBB (26,6%) и vBulletin (26,5%) бяха най-популярните, както се очакваше. Те са плътно следвани от SMF (5,8%) и DLEForum (5,3%). Моят любим punBB беше едва на 6-то място (1,64%). Не бих посъветвал силно да се доверявате на тези цифри (те казват, че всеки трети форум в Runet работи на IPB), но някои изводи, разбира се, могат да бъдат направени. Например, ако възнамерявате да направите сайт на форумна машина и планирате да модифицирате форума, да речем, да плащате на потребителите 0,01 $ за всяко съобщение с автоматично теглене на средства веднъж седмично, тогава трябва да изберете една от трите най-популярни машини . Колкото по-популярен е форумът, толкова по-вероятно е да се намери програмист, който е добре запознат с него. Ако не се очакват значителни промени в двигателя, тогава може да има смисъл да изберете по-малко популярен двигател, като SMF или punBB. Това ще намали броя хакерски атакикъм вашия форум и количеството спам, автоматично изпратен в него. Скриптовете за търсене/дефиниране на форуми също могат да намерят повече от един практическа употреба. Първото нещо, което ми хрумна лично, беше да сортирам идентифицираните форуми по TIC и да поставя публикации с връзки към един от техните сайтове в първите сто. Въпреки това, стотина форумни dofollow връзки не повлияха по никакъв начин на TCI (преминаха 2 актуализации), така че е по-добре да не губите време тук, освен ако не се интересувате от преходи. Ясно е, че посоченото използване на скриптове далеч не е единственото. Мисля, че лесно можете да разберете как иначе можете да ги използвате. Организирано от Botmaster Labs, не е планирано. Няма време, видеото е необходимо за конкурса, като новомодна тенденция, въпреки че е по-лесно да се обясни всичко с добри екранни снимки (моето IMHO) и наистина не искам да снимам нищо. Останаха много малко печеливши теми, тъпият спам вече изобщо не управлява, тук трябва да помислите и никой няма да застреля темата, ако само остарелите се опитат да я облекат в красива опаковка и да напудрят малко. :) Но тук не става въпрос за нас. Като цяло, тези 3 "не", според мен, основно се превърнаха в бариери за участие в състезанието за повечето потенциални участници. Това е като с ремонта на кола от три: евтино, качествено, бързо - в сервиза могат да изпълнят само 2 условия едновременно. седнете и изберете това, което е по-близо до вас. :) Същото е и със състезанието: имам време, мога да направя клип, но няма тема, или мога да направя клип, имам тема, но изобщо нямам време, или има свободно време и има малка тема, но видеото плаши. Но е добре, ако са изпълнени 2 условия едновременно. Добре, нека оставим текста. Ще продължа към себе си. Не планирах, затова ще участвам в състезанието, дори избрах за коя статия ще гласувам. Кажете каквото искате, но Doz познава софтуера много добре и знае как да го използва много разумно. Но днес научих, че в състезанието се е появила интрига. Оказва се, че аз няма да мога да гласувам, но само начинаещи, които са закупили софтуера през 2011 г. и конкурсът е предназначен за тях. Бях малко изненадан, но собственикът е джентълмен. Състезанието е рекламна кампания и Александър знае по-добре как да я проведе. Като цяло тогава реших да публикувам статия, малко по-лесно е да се пише, когато е ясно за кого всъщност е невъзможно да се направи това за цялата колективна ферма. Осъществено от php-Fusion Във версия 7.07 на Chrumer програмата е обучена с няколко нови двигателя: forumi.biz, forumb.biz, 1forum.biz, 7forum.biz и др. phpBB-fr.com, Solaris phpBB тема И процесът на научаване на нови неща продължава непрекъснато. Осъществено от SMF 1.1.2 Осъществено от SMF 1.1.3 Осъществено от SMF 1.1 RC2 Осъществено от SMF 1.1.4 Осъществено от SMF 1.1.8 Осъществено от SMF 1.1.7 "2006-2008, Simple Machines LLC" И това не е всичко. Когато събираме версии на двигатели, намираме надписа "2001-2006, Lewis Media" в долния колонтитул на някои SMF форуми. Проверяваме тази заявка, тя също ни удовлетворява напълно. Откриваме подобна заявка: „2001-2005, Lewis Media“. Преминавайки долните колонтитули по-нататък, намираме следната заявка: „SMFone дизайн от A.M.A, пренесен към SMF 1.1“. Вижте го - страхотно. И така нататък. Половин час работа и имате прекрасна база данни от заявки на двигателя и за тези заявки Google ще забранява много по-рядко, отколкото ако използвате оператори в тях. И в същото време вашата база данни ще бъде много по-чиста, отколкото ако използвате заявки като "index.php?topic=", защото тук Google ще даде не само форумите, от които се нуждаем, но и много оставени ресурси, където е възможно оставете линк към темата във форума. Можете да спорите, казват те, какво лошо има в това? Други оставиха връзка, за да можем. Но! Връзки могат да се оставят не само от Hrumer, но и от други програми. освен това те могат да бъдат специално заострени за оставяне на коментари в определен ресурс, така нареченият високоспециализиран софтуер, плюс такива връзки могат да бъдат оставяни на ръка. Пак повтарям, за нас не е важно количеството боклуци, а качеството, така или иначе ще съберем базата с правилните заявки. Плюс този методсъщо и във факта, че на практика няма да е необходимо да конфигурирате сито-филтър
伟哥 - виагра 吉他 - китара 其他 - почивка 保险公司 - застраховка Поставете тези кодове във файла на Words, за да ги замените: %E4%BC%9F%E5%93%A5 %E5%90%89%E4%BB%96 %E5%85%B6%E4%BB%96 %E4%BF%9D%E9%99%A9%E5%85%AC%E5%8F%B8 Ако популяризирате застрахователен сайт, след това като публикувате връзка в профила си на тематичен (!) дори китайски форум, намерен при поискване " форум SMF" 保险公司ще бъде много добре.
печат "phpbb \н"
if ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?phpbb\.com\/?"[^>]*>phpBB/iили
# $data =~ /viewforum\.php\?[^""]*f=\d+/i или
$data =~ /phpBB\-SEO/i или
$данни =~ /)
;
печат "ipb \н"
if ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?invision(?:board|power)\.com\/?[^"]*"[^>]*> [^<]*IP\.Board/i
или
$данни =~ /]+href="[^"]*http:\/\/(?:www\.)?invisionboard\.com\/?"[^>]*>Invision Power Board/iили
$данни =~ /
$данни =~ /index\.php\?[^""]*showforum=\d+/i)
;
отпечатайте "vbulletin \н"
if ($data =~ /Осъществено от:?[^<]+vBulletin[^<]+(?:Version)?/i
или
$данни =~ /)
;
печат "smf \н"
if ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?simplemachines\.org\/?"[^>]*>Осъществено от SMF/iили
$данни =~ /index\.php\?[^""]*board=\d+\.0/i)
;
печат "punbb \н"
if ($data =~ /]+href="[^"]*http:\/\/(?:(?:www\.)?punbb\.org|punbb\.informer\.com)\/?"[^>]*> PunBB/i) ; #или
# $data =~ /viewforum\.php\?[^""]*id=\d+/i);
отпечатайте "fluxbb \н"
# if($data =~ /viewtopic\.php\?id=\d+/i или
if ($data =~ /]+href="http:\/\/(?:www\.)fluxbb\.org\/?"[^>]*>FluxBB/i)
;
печат "exbb \н"
if ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?exbb\.org\/?"[^>]*>ExBB/i) ; # или
# $data =~ /forums\.php\?[^""]*forum=\d+/i);
печат "yabb \н"
if ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?yabbforum\.com\/?"[^>]*>YaBB/iили
$data =~ /YaBB\.pl\?[^""]*num=\d+/i ) ;
печат "dleforum \н"
if ($data =~ /\(Осъществено от DLE форум\)<\/title>/iили
$данни =~ /]+href="[^"]+(?:http:\/\/(?:www\.)?dle\-files\.ru|act=copyright)[^"]*">DLE форум<\/a>/i)
;
печат "iconboard \н"
if ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?ikonboard\.com\/?[^"]*"[^>]*>Ikonboard/iили
$данни =~ /\н"
if ($data =~ /\н"
# if($data =~ /forums\.php\?fid=\d+/i или
# $data =~ /topic\.php\?fid=\d+/i или
if ($data =~ /]+href="http:\/\/(?:www\.)?flashbb\.net\/?"[^>]*>FlashBB/i)
;
печат "stokesit \н"
# if($data =~ /forum\.php\?f=\d+/i или
if ($data =~ /]+href="http:\/\/(?:www\.)?stokesit\.com\.au\/?"[^>]*>[^\/]*Stokes IT/i)
;
печат "подиум \н"
# if($data =~ /topic\.php\?t=\d+/i или
if ($data =~ /]+href=[""]?http:\/\/(?:www\.)?sopebox\.com\/?[""]?[^>]*>Подиум/i)
;
печат "usebb \н"
# if($data =~ /forum\.php\?id=\d+/i или
if ($data =~ /]+href="http:\/\/(?:www\.)?usebb\.net\/?"[^>]*>UseBB/i)
;
печат "wrforum \н"
# if($data =~ /index\.php\?fid=\d+/i или
if ($data =~ /]+href="http:\/\/(?:www\.)?wr\-script\.ru\/?"[^>]*>WR\-Forum/i)
;
печат "yetanotherforumnet \н"
ако ($data =~ /Още един форум\.net/i или
$данни =~ /по подразбиране\.aspx\?g=posts&t=\d+/i)
;
сайт: talk.*.ru
сайт: борд.*.ru
сайт: smf.*.ru
сайт:phpbb.*.ru
....
Дългото въведение приключи, сега към точката.
От какво се нуждае начинаещ, когато е придобил такъв суперкомбайн, какъвто е комплексът Xrumer + Hrefer? Точно така, научете се как да работите върху него и изхвърлете илюзията, че като започнете да спамите листове, можете да спечелите пари. Ако мислите така, дарете парите си за благотворителност веднага. Трябва да се научите как да използвате инструментите на комплекса, за предпочитане да го заточите за себе си. Времето на "вземете повече - хвърлете повече" свърши. Количеството отстъпва на качеството. Така че ние ще съберем основата за себе си, не се научавайте как да го направите - ще изостанете от влака. Разбира се, Khrefer ще ни помогне с това. Ако планирате да популяризирате ресурсите си в Google, тогава ние също трябва да потърсим донорски сайтове чрез Google. Мисля, че това е разбираемо и логично. Но Google, като господарка на медната планина, не раздава богатството си на всеки. Има нужда от подход. Бих искал да кажа веднага, че не се надявайте, че според знаците, които намирате в обществото, ще можете да съберете нещо. Ето защо те са публично достъпни, защото са безполезни. Няма да развивам повече темата. По-добре е да ви кажа как да го сглобите правилно, така че да видите резултата, останалото ще финализирате сами, основното е да разберете принципа. Необходимо е да се събира според правилния според признаците на конкретни двигатели, от които се нуждаем, а не според знаците на форумите като цяло. то основна грешканачинаещи - не се концентрирайте върху конкретна, а се опитайте да обхванете всичко като цяло. И все пак, ако искате да анализирате повече или по-малко нормална база, откажете да използвате оператори в заявки. Без "inurl:", "site:", "title" и т.н. Google незабавно ще забрани търсачи като вас. Затова внимателно проучваме двигателите, с които този моментХрумер работи:
Като цяло трябва да подготвим правилните заявки за анализиране от Khrefer. Да вземем за пример форум dizhok. SMF форуми. И ще започнем да го разглобяваме на части за анализ. Нашият любим Google ще ни помогне с това. Въвеждане на Google заявка SMF форуми- много боклук в изданието, превъртете на някоя 13-та страница и изберете произволен линк. Попаднах на този: http://www.volcanohost.com/forum/index.php?topic=11.0. Нека го отворим и изследваме. Трябва да намерим нещо характерно на страницата, което може да се приложи при търсенето на други страници на тази машина. В долния колонтитул забелязваме следния надпис Осъществено от SMF 1.1.14, ние го цитираме и го въвеждаме в Google, той ни показва, че за тази заявка знае около 59 милиона опции. Преглеждаме връзките, добавяме още няколко опции към тази ключова дума, например "Осъществено от SMF 1.1.14" тополаили Осъществено от SMF 1.1.14 виагра. Убедени сме, че искането е шик, в издаването само на форуми и почти без боклук за вас.
Освен това нас не ни интересува количеството, а качеството, както казах по-горе. Продължа напред. От същия форум вземаме още една фраза от долния колонтитул: , също го цитирайте и го подавайте на Google. В отговор той разкрива, че знае повече от 13 милиона резултата. Отново преглеждаме изхода, добавяме допълнителни думи и проверяваме изхода с тях. Уверяваме се, че заявката е отлична и също така почти няма боклук. Като цяло вече има 2 заявки за желязо. Предлагам засега да оставим първия форум и да продължим да събираме заявки от други форуми. За щастие Google е отворен при поискване 2006-2008 Simple Machines LLC. Ние вземаме от изданието например тези форуми: http://www.snowlinks.ru/forum/index.php?topic=1062.0 и http://litputnik.ru/forum/index.php?action=printpage; topic=380.0 в долните колонтитули вземаме следните заявки от тях: „Осъществено от SMF 1.1.7“ и „Осъществено от SMF 1.1.10“ (винаги ви съветвам да изпращате заявки за Khrefer в кавички, защото първо се нуждаем от качество всичко). Мисля, че е ясно какво правим, в крайна сметка ще имаме определена база данни от заявки за търсене във форуми на SMF двигателя (избран е като пример, с останалите двигатели е подобно).
Ще изглежда нещо подобно:
Мисля, че е много важно да научите как правилно да използвате Chrefer в началния етап, защото след като научите това, винаги можете да намерите приложение за Chrumer, независимо как се променя ситуацията. Защитите стават все по-сложни и ако на някои видове двигатели са засилили защитата и не могат да се справят с нея в този момент Khrumer, няма смисъл да харчите ресурси за събиране на тези връзки и след това да работите върху тях с Khrumer, по-добре е да се съсредоточите върху това, което дава резултата. И в същото време, ако екипът на Botmaster Labs е научил Chrumer на нещо ново, можете бързо да дисектирате нов пациент и да подготвите основата на Chrumer, докато пациентът е все още топъл. Времето е пари, ресурсът може вече да не е подходящ, когато закупите основата. събрани от някого. В допълнение, правилното събиране на бази за себе си значително разширява "бялото" използване на Khrumer. И точно тук се движи всичко, искаме или не, но тече процесът на побеляване или посивяване. Черни листове за всичко, което можете да отидете в миналото.
Всички други, вече технически аспекти на работата с Hrefer могат да се видят в помощта и няма смисъл да се спираме на тях, всички цели-точки-секунди се задават емпирично за всяка кола поотделно.
Като бонус ще публикувам тук шаблон за разбор на китайската търсачка Baidu, онзи ден ме попитаха за това, така че го направих междувременно, извинете за играта на думи. :)
Име на хост=http://www.baidu.com
Заявка=s?wd=
LinksMask=
Общо страници=100
Следваща страница=
Следваща страница2=
CaptchaURL=
CaptchaImage=
CaptchaField=
Опитах се да ги тествам за анализиране, нямаше забрана, Khrefer събра ресурси бързо, всички заявки за анализиране бяха подобни на тези на Google, но имаше море от китайски ресурси и с висок PR, а освен това и европейски не беше стъпвал на много места. По-добре е да анализирате с китайски заявки. Google Translate ще ви помогне с това, въведете списък с ключови думи на руски и го преведете на китайски. Истината в думи„Думите на Крефер не могат да бъдат събрани на китайски, те трябва да бъдат прекодирани.
Вместо китайски:
В заключение бих искал да кажа, че никога не съм разбирал хората, които се оплакват, че Khrefers са лоши или не анализират, винаги съм искал да кажа това, просто не знаете как да ги готвите. Нито един анализатор не е по-добър от референт, просто трябва да е правилен. Хрефер е кола: добра, солидна, немска, но човек я управлява и всичко зависи от това колко разумно се кара, не можеш да караш колата да върви наляво и надясно едновременно.
Отделна тема е почистването на бази, аз веднъж преди 3 години за предишния конкурс. Всичко все още е уместно от повече там, но сега можете да откажете да проверите за 200 OK, наистина не ми хареса този процес, грешките бяха много големи, много излишни бяха филтрирани. Сега това може да се направи почти автоматично по време на работа на Chrumer, въпреки че този процес не е пълен аналог на проверката за "200 OK". Като цяло, до точката: не толкова отдавна в Khrumer се появи прекрасна възможност - да ограбите информация от ресурси по време на изпълнение на проекта. Изглежда така. Вкарвате шаблон, който ще бъде обработен по време на работа, а информацията, събрана според шаблона, ще бъде въведена във файла xgrabbed.txt в папката Logs. Можете да използвате тази функция за всичко, полетът на фантазията е огромен. Използвам тази функция веднъж седмично, за да премахвам връзки от "изтеклата" работна база. Не е тайна, че форумите умират всеки ден, за да почистят базата от такива ресурси и инструментът "Autograbbing" ще ни помогне в този случай.
В края на краищата, трябва да признаете, че често като въвеждате например http://www.laptopace.com/index.php, виждаме, че този домейн вече е например goudya, но там няма форум. Така че, за да изхвърлим тази шлака от базата, ние ще ограбим. :) Отваряме изходния код на страницата и виждаме този запис там:
Сега всички "мъртви" от Goudaddi ще ни бъдат известни по име.
Ето малка селекция за инструмента "Autograbbing", ако искате да почистите базата данни от различни "изтекли" домейни: