مبارزه با صفحات تکراری

مالک ممکن است حتی مشکوک نباشد که برخی از صفحات در سایت او کپی دارند - اغلب این مورد است. صفحات باز می شوند، همه چیز با محتوای آنها خوب است، اما اگر فقط به صفحه توجه کنید، متوجه می شوید که آدرس ها برای یک محتوا متفاوت است. چه مفهومی داره؟ برای کاربران زنده، مطلقاً هیچ، زیرا آنها به اطلاعات موجود در صفحات علاقه مند هستند، اما بی روح موتورهای جستجوچنین پدیده ای را به روشی کاملاً متفاوت درک کنید - برای آنها کاملاً چنین است صفحات مختلفبا همین محتوا

آیا صفحات تکراری مضر هستند؟بنابراین، اگر یک کاربر معمولی حتی نتواند متوجه وجود موارد تکراری در سایت شما شود، موتورهای جستجو بلافاصله این موضوع را تعیین می کنند. چه واکنشی باید از آنها انتظار داشت؟ از آنجایی که نسخه ها اساساً به عنوان صفحات مختلف دیده می شوند، محتوای موجود در آنها منحصر به فرد نیست. و این در حال حاضر تأثیر منفی بر رتبه بندی دارد.

همچنین، وجود موارد تکراری، تصویری را که بهینه‌ساز سعی کرده روی صفحه فرود فوکوس کند، محو می‌کند. به دلیل موارد تکراری، ممکن است در صفحه ای کاملاً متفاوت با آنچه که می خواستند آن را به آن منتقل کنند، قرار گیرد. یعنی اثر لینک سازی داخلیو لینک های خارجی را می توان چندین برابر کاهش داد.

در اکثریت قریب به اتفاق موارد، موارد تکراری مقصر هستند - به دلیل تنظیمات نادرست و عدم توجه مناسب توسط بهینه ساز، کپی های واضح ایجاد می شود. این مشکل در بسیاری از CMS ها، به عنوان مثال جوملا است. پیدا کردن یک دستور العمل جهانی برای حل مشکل دشوار است، اما می توانید از یکی از افزونه ها برای حذف کپی ها استفاده کنید.

بروز موارد تکراری نامشخص که در آن محتوا کاملاً یکسان نیست، معمولاً به دلیل تقصیر مدیر وب سایت است. چنین صفحاتی اغلب در سایت‌های فروشگاه آنلاین یافت می‌شوند، جایی که صفحات دارای کارت‌های محصول تنها در چند جمله با توضیحات متفاوت هستند و بقیه محتوا، متشکل از بلوک‌های انتها به انتها و عناصر دیگر، یکسان است.

بسیاری از کارشناسان استدلال می کنند که تعداد کمی از موارد تکراری به سایت آسیب نمی رساند، اما اگر بیش از 40-50٪ وجود داشته باشد، ممکن است منبع در طول تبلیغ با مشکلات جدی روبرو شود. در هر صورت، حتی اگر نسخه های زیادی وجود نداشته باشد، ارزش دارد که از حذف آنها مراقبت کنید، بنابراین تضمین می کنید که از شر مشکلات تکراری خلاص شوید.

پیدا کردن صفحات کپیراه های مختلفی برای یافتن صفحات تکراری وجود دارد، اما ابتدا باید با چندین موتور جستجو تماس بگیرید و ببینید که سایت شما را چگونه می بینند - فقط باید تعداد صفحات را در فهرست هر کدام با هم مقایسه کنید. انجام این کار بسیار ساده است، بدون استفاده از ابزار اضافی: در Yandex یا Google، فقط host:yoursite.ru را در نوار جستجو وارد کنید و به تعداد نتایج نگاه کنید.




اگر پس از یک بررسی ساده، مقدار آن 10-20 برابر تفاوت زیادی داشته باشد، این ممکن است با درجاتی از احتمال، محتوای تکراری را در یکی از آنها نشان دهد. صفحات کپی ممکن است مقصر این تفاوت نباشند، اما با این وجود باعث جستجوی بیشتر و دقیق تر می شود. اگر سایت کوچک است، می توانید به صورت دستی تعداد صفحات واقعی را بشمارید و سپس با شاخص های موجود مقایسه کنید موتورهای جستجو.

می توانید صفحات تکراری را با URL در نتایج موتور جستجو جستجو کنید. اگر باید CNC داشته باشند، صفحاتی با URLهای حاوی کاراکترهای نامفهوم، مانند "index.php?s=0f6b2903d" بلافاصله از لیست عمومی خارج می شوند.

روش دیگر برای تعیین وجود موارد تکراری با استفاده از موتورهای جستجو، جستجو در قطعات متن است. روش انجام چنین بررسی ساده است: شما باید یک قطعه متن از 10-15 کلمه از هر صفحه را در نوار جستجو وارد کنید و سپس نتیجه را تجزیه و تحلیل کنید. اگر دو یا چند صفحه در نتایج جستجو وجود دارد، کپی وجود دارد، اما اگر تنها یک نتیجه وجود داشته باشد، این صفحه تکراری ندارد و لازم نیست نگران باشید.

منطقی است که اگر سایت از تعداد زیادی صفحه تشکیل شده باشد، چنین بررسی می تواند به یک کار غیر ممکن برای بهینه ساز تبدیل شود. برای به حداقل رساندن هزینه های زمانی، می توانید از برنامه های ویژه استفاده کنید. یکی از این ابزارها که احتمالاً برای متخصصان با تجربه آشنا است، برنامه Xenu`s Link Sleuth است.


برای بررسی سایت باید باز کنید پروژه جدیداز منوی File گزینه Check URL را انتخاب کرده و آدرس را وارد کرده و روی OK کلیک کنید. پس از این، برنامه شروع به پردازش تمام URL های سایت می کند. پس از تکمیل تأیید، باید داده های دریافتی را به هر کدام صادر کنید ویرایشگر راحتو شروع به جستجوی موارد تکراری کنید.

علاوه بر روش‌های بالا، پنل‌های Yandex.Webmaster و Google Webmaster Tools دارای ابزارهایی برای بررسی فهرست‌بندی صفحه هستند که می‌توان از آنها برای جستجوی موارد تکراری استفاده کرد.

روش های حل مسئلهپس از یافتن همه موارد تکراری، باید حذف شوند. این کار را نیز می توان به چند روش انجام داد، اما هر مورد خاص روش خاص خود را می طلبد و ممکن است مجبور شوید از همه آنها استفاده کنید.

  • صفحات کپی را می توان به صورت دستی حذف کرد، اما این روش به احتمال زیاد فقط برای آن دسته از موارد تکراری مناسب است که به دلیل بی دقتی مدیر وب به صورت دستی ایجاد شده اند.
  • ریدایرکت 301 برای ادغام صفحات کپی که URL آنها در حضور و عدم حضور www متفاوت است عالی است.
  • راه حل مشکل تکراری با استفاده از تگ canonical می تواند برای کپی های نامشخص استفاده شود. به عنوان مثال، برای دسته بندی محصولات در یک فروشگاه آنلاین که دارای موارد تکراری است که در مرتب سازی بر اساس پارامترهای مختلف متفاوت است. Canonical همچنین برای نسخه های چاپی صفحات و سایر موارد مشابه مناسب است. به سادگی اعمال می شود - ویژگی rel=”canonical” برای همه کپی ها مشخص شده است، اما نه برای صفحه اصلی، که مرتبط ترین است. کد باید چیزی شبیه به این باشد: پیوند rel="canonical" href="http://yoursite.ru/stranica-kopiya"/، و در تگ head قرار گیرد.
  • راه اندازی فایل robots.txt می تواند در مبارزه با موارد تکراری کمک کند. دستورالعمل Disallow دسترسی به موارد تکراری را برای روبات های جستجو مسدود می کند. در خبرنامه ما می توانید در مورد نحو این فایل بیشتر بخوانید.

مالک ممکن است حتی مشکوک نباشد که برخی از صفحات در سایت او کپی دارند - اغلب این مورد است. صفحات باز می شوند، همه چیز با محتوای آنها خوب است، اما اگر فقط به URL توجه کنید، متوجه می شوید که آدرس ها برای یک محتوا متفاوت است. چه مفهومی داره؟ برای کاربران زنده، مطلقاً هیچ چیز، زیرا آنها به اطلاعات موجود در صفحات علاقه مند هستند، اما موتورهای جستجوی بی روح این پدیده را کاملاً متفاوت درک می کنند - برای آنها این صفحات کاملاً متفاوت با محتوای یکسان هستند.

آیا صفحات تکراری مضر هستند؟

بنابراین، اگر یک کاربر معمولی حتی نتواند متوجه وجود موارد تکراری در سایت شما شود، موتورهای جستجو بلافاصله این موضوع را تعیین می کنند. چه واکنشی باید از آنها انتظار داشت؟ از آنجایی که روبات های جستجو اساساً کپی ها را به عنوان صفحات مختلف می بینند، محتوای موجود در آنها منحصر به فرد نیست. و این در حال حاضر تأثیر منفی بر رتبه بندی دارد.

همچنین، وجود موارد تکراری، آب پیوندی را که بهینه‌ساز سعی کرده روی صفحه فرود متمرکز کند، محو می‌کند. به دلیل موارد تکراری، ممکن است در صفحه ای کاملاً متفاوت با آنچه که می خواستند آن را به آن منتقل کنند، قرار گیرد. یعنی می توان تاثیر لینک سازی داخلی و لینک های خارجی را تا حد زیادی کاهش داد.

در اکثریت قریب به اتفاق موارد، CMS مقصر بروز موارد تکراری است - به دلیل تنظیمات نادرست و عدم توجه مناسب توسط بهینه ساز، کپی های واضح ایجاد می شود. این مشکل در بسیاری از CMS ها، به عنوان مثال جوملا است. پیدا کردن یک دستور العمل جهانی برای حل مشکل دشوار است، اما می توانید از یکی از افزونه ها برای حذف کپی ها استفاده کنید.

بروز موارد تکراری نامشخص که در آن محتوا کاملاً یکسان نیست، معمولاً به دلیل تقصیر مدیر وب سایت است. چنین صفحاتی اغلب در سایت‌های فروشگاه آنلاین یافت می‌شوند، جایی که صفحات دارای کارت‌های محصول تنها در چند جمله با توضیحات متفاوت هستند و بقیه محتوا، متشکل از بلوک‌های انتها به انتها و عناصر دیگر، یکسان است.

بسیاری از کارشناسان استدلال می کنند که تعداد کمی از موارد تکراری به سایت آسیب نمی رساند، اما اگر بیش از 40-50٪ وجود داشته باشد، ممکن است منبع در طول تبلیغ با مشکلات جدی روبرو شود. در هر صورت، حتی اگر نسخه های زیادی وجود نداشته باشد، ارزش دارد که از حذف آنها مراقبت کنید، بنابراین تضمین می کنید که از شر مشکلات تکراری خلاص شوید.

پیدا کردن صفحات کپی

راه های مختلفی برای یافتن صفحات تکراری وجود دارد، اما ابتدا باید با چندین موتور جستجو تماس بگیرید و ببینید که سایت شما را چگونه می بینند - فقط باید تعداد صفحات را در فهرست هر کدام با هم مقایسه کنید. انجام این کار بسیار ساده است، بدون استفاده از ابزار اضافی: در Yandex یا Google، فقط host:yoursite.ru را در نوار جستجو وارد کنید و به تعداد نتایج نگاه کنید.

اگر پس از یک بررسی ساده، مقدار آن 10-20 برابر تفاوت زیادی داشته باشد، این ممکن است با درجاتی از احتمال، محتوای تکراری را در یکی از آنها نشان دهد. صفحات کپی ممکن است مقصر این تفاوت نباشند، اما با این وجود باعث جستجوی بیشتر و دقیق تر می شود. اگر سایت کوچک است، می توانید به صورت دستی تعداد صفحات واقعی را بشمارید و سپس آنها را با شاخص های موتورهای جستجو مقایسه کنید.

می توانید صفحات تکراری را با URL در نتایج موتور جستجو جستجو کنید. اگر باید CNC داشته باشند، صفحاتی با URLهای حاوی کاراکترهای نامفهوم، مانند "index.php?s=0f6b2903d" بلافاصله از لیست عمومی خارج می شوند.

روش دیگر برای تعیین وجود موارد تکراری با استفاده از موتورهای جستجو، جستجو در قطعات متن است. روش انجام چنین بررسی ساده است: شما باید یک قطعه متن از 10-15 کلمه از هر صفحه را در نوار جستجو وارد کنید و سپس نتیجه را تجزیه و تحلیل کنید. اگر دو یا چند صفحه در نتایج جستجو وجود دارد، کپی وجود دارد، اما اگر تنها یک نتیجه وجود داشته باشد، این صفحه تکراری ندارد و لازم نیست نگران باشید.

منطقی است که اگر سایت از تعداد زیادی صفحه تشکیل شده باشد، چنین بررسی می تواند به یک کار غیر ممکن برای بهینه ساز تبدیل شود. برای به حداقل رساندن هزینه های زمانی، می توانید از برنامه های ویژه استفاده کنید. یکی از این ابزارها که احتمالاً برای متخصصان با تجربه آشنا است، برنامه Xenu`s Link Sleuth است.

برای بررسی سایت، باید با انتخاب «Check URL» از منوی «File»، پروژه جدیدی را باز کنید، آدرس را وارد کرده و روی «OK» کلیک کنید. پس از این، برنامه شروع به پردازش تمام URL های سایت می کند. در پایان بررسی، باید داده های دریافتی را به هر ویرایشگر مناسب صادر کنید و شروع به جستجوی تکراری کنید.

علاوه بر روش‌های بالا، پنل‌های Yandex.Webmaster و Google Webmaster Tools دارای ابزارهایی برای بررسی فهرست‌بندی صفحه هستند که می‌توان از آنها برای جستجوی موارد تکراری استفاده کرد.

روش های حل مسئله

پس از یافتن همه موارد تکراری، باید حذف شوند. این کار را نیز می توان به چند روش انجام داد، اما هر مورد خاص روش خاص خود را می طلبد و ممکن است مجبور شوید از همه آنها استفاده کنید.

صفحات کپی را می توان به صورت دستی حذف کرد، اما این روش به احتمال زیاد فقط برای آن دسته از موارد تکراری مناسب است که به دلیل بی دقتی مدیر وب به صورت دستی ایجاد شده اند.

ریدایرکت 301 برای ادغام صفحات کپی که URL آنها در حضور و عدم حضور www متفاوت است عالی است.

راه حل مشکل تکراری با استفاده از تگ canonical می تواند برای کپی های نامشخص استفاده شود. به عنوان مثال، برای دسته بندی محصولات در یک فروشگاه آنلاین که دارای موارد تکراری است که در مرتب سازی بر اساس پارامترهای مختلف متفاوت است. Canonical همچنین برای نسخه های چاپی صفحات و سایر موارد مشابه مناسب است. به سادگی اعمال می شود - ویژگی rel=”canonical” برای همه کپی ها مشخص شده است، اما نه برای صفحه اصلی، که مرتبط ترین است. کد باید چیزی شبیه به این باشد: پیوند rel="canonical" href="http://yoursite.ru/stranica-kopiya"/، و در تگ head قرار گیرد.

راه اندازی فایل robots.txt می تواند در مبارزه با موارد تکراری کمک کند. دستورالعمل Disallow دسترسی به موارد تکراری را برای روبات های جستجو مسدود می کند. اطلاعات بیشتر در مورد نحو این فایل را می توانید در شماره 64 خبرنامه ما مطالعه کنید.

نتیجه گیری

اگر کاربران تکراری را به عنوان یک صفحه با آدرس های مختلف درک کنند، برای عنکبوت ها این صفحات مختلف با محتوای تکراری هستند. صفحات کپی یکی از رایج ترین دام هایی است که مبتدیان نمی توانند از آن دور شوند. حضور آنها در مقادیر زیاد در یک سایت تبلیغ شده غیرقابل قبول است، زیرا آنها موانع جدی برای رسیدن به TOP ایجاد می کنند.

دلیل نوشتن این مقاله تماس دیگری از یک حسابدار در وحشت قبل از ارائه گزارش مالیات بر ارزش افزوده بود. سه ماهه گذشته زمان زیادی را صرف تمیز کردن موارد تکراری طرف مقابل کردم. و باز هم همان و جدید هستند. جایی که؟

تصمیم گرفتم وقت بگذارم و با علت کار کنم نه معلول. این وضعیت عمدتاً زمانی مرتبط است که آپلودهای خودکار از طریق برنامه های تبادل از پیکربندی شوند برنامه کنترل(در مورد من UT 10.3) به بخش حسابداری شرکت (در مورد من 2.0).

چندین سال پیش این تنظیمات نصب شد و تبادل خودکار بین آنها پیکربندی شد. ما با مشکل اصالت نگهداری دایرکتوری طرف مقابل توسط بخش فروش مواجه بودیم که به دلایلی شروع به ایجاد طرف مقابل های تکراری (با همان INN/KPP/Name) کرد (آنها یک طرف مقابل را به گروه های مختلف پراکنده کردند. ). بخش حسابداری "fi" خود را بیان کرد و تصمیم گرفت - برای ما مهم نیست که آنها چه دارند، هنگام بارگیری کارت ها را در یک کارت ترکیب کنید. من مجبور شدم در فرآیند انتقال اشیا با استفاده از قوانین مبادله مداخله کنم. برای طرف مقابل، جستجو را بر اساس شناسه داخلی حذف کردیم و جستجو را با INN+KPP+Name ترک کردیم. با این حال، حتی در اینجا، مشکلاتی به شکل افرادی ظاهر شد که دوست دارند نام طرفین را تغییر دهند (در نتیجه، موارد تکراری در BP توسط خود قوانین ایجاد می شود). همه دور هم جمع شدیم، بحث کردیم، تصمیم گرفتیم، متقاعد شدیم که تکرارها در UT غیرقابل قبول هستند، آنها را حذف کردیم و به قوانین استاندارد بازگشتیم.

فقط پس از "شانه کردن" موارد تکراری در UT و BP، شناسه داخلی بسیاری از پیمانکاران متفاوت بود. و از آنجایی که قوانین مبادله استاندارد اشیاء را منحصراً با شناسه داخلی جستجو می کنند، سپس با بخش بعدی اسناد یک نسخه تکراری جدید از طرف مقابل وارد BP شد (اگر این شناسه ها متفاوت بودند). اما اگر هیچ راهی برای حل این مشکل وجود نداشت، تبادل اطلاعات XML جهانی جهانی نخواهد بود. زیرا از آنجایی که تغییر شناسه یک شی موجود با استفاده از وسایل استاندارد غیرممکن است، می توانید با استفاده از یک ثبت اطلاعات ویژه "مطابقات اشیاء برای تبادل" که در تمام تنظیمات استاندارد از 1C موجود است، از این وضعیت عبور کنید.

برای جلوگیری از تکرارهای جدید، الگوریتم حذف تکراری به شرح زیر است:

1. در BP، با استفاده از پردازش «جستجو و جایگزینی عناصر تکراری» (استاندارد است، می‌توان آن را از پیکربندی مدیریت تجارت یا روی دیسک ITS برداشت، یا می‌توانید مناسب‌ترین مورد را از میان بسیاری از تغییرات در Infostart انتخاب کنید. خود) یک تکراری پیدا می کنم، عنصر صحیح را تعیین می کنم، روی اجرای جایگزین کلیک می کنم.

2. من شناسه داخلی تنها (پس از جایگزینی) شی دوبل خود را دریافت می کنم (من یک پردازش ساده مخصوصاً برای این کار ترسیم کردم، به طوری که شناسه داخلی به طور خودکار در کلیپ بورد کپی می شود).

3. من ثبت نام "انطباق اشیاء برای تبادل" را در UT باز می کنم و با استفاده از پیوند خودم انتخاب می کنم.

تکراری شدن صفحات سایت، تاثیر آنها بر بهینه سازی موتور جستجو. دستی و روش های خودکارشناسایی و حذف صفحات تکراری

تاثیر موارد تکراری در ارتقاء وب سایت

وجود موارد تکراری بر رتبه سایت تاثیر منفی می گذارد. همانطور که در بالا گفته شد، موتورهای جستجو صفحه اصلی و نسخه تکراری آن را به صورت دو صفحه مجزا می بینند. محتوای کپی شده در صفحه دیگری منحصر به فرد نیست. علاوه بر این، وزن پیوند صفحه تکراری از بین می رود، زیرا پیوند می تواند نه به صفحه هدف، بلکه به نسخه تکراری آن منتقل شود. این هم برای پیوندهای داخلی و هم برای پیوندهای خارجی صدق می کند.

به گفته برخی از مدیران سایت، تعداد کمی از صفحات تکراری به طور کلی آسیب جدی به سایت وارد نمی کند، اما اگر تعداد آنها نزدیک به 40 تا 50 درصد از حجم کل سایت باشد، مشکلات جدی در تبلیغ اجتناب ناپذیر است.

دلایل تکراری بودن

اغلب، موارد تکراری در نتیجه تنظیمات نادرست CMS های فردی ظاهر می شوند. اسکریپت های داخلی موتور به اشتباه شروع به کار می کنند و کپی هایی از صفحات سایت تولید می کنند.

پدیده تکرارهای فازی نیز شناخته شده است - صفحاتی که محتوای آنها فقط تا حدی یکسان است. چنین موارد تکراری اغلب به دلیل تقصیر خود مدیر وب سایت ایجاد می شود. این پدیده برای فروشگاه های آنلاین معمول است، جایی که صفحات کارت محصول بر اساس یک قالب ساخته می شوند و در نهایت تنها با چند خط متن با یکدیگر تفاوت دارند.

روش های یافتن صفحات تکراری

روش های مختلفی برای شناسایی صفحات تکراری وجود دارد. می توانید به موتورهای جستجو مراجعه کنید: برای انجام این کار در Google یا Yandex، دستوری مانند "site:sitename.ru" را در نوار جستجو وارد کنید، جایی که sitename.ru دامنه سایت شما است. موتور جستجو تمام صفحات فهرست شده سایت را برمی گرداند و وظیفه شما شناسایی موارد تکراری خواهد بود.

یک راه به همان اندازه ساده دیگر وجود دارد: جستجو بر اساس قطعات متن. برای جستجو در این روش، باید یک متن کوچک از وب سایت خود، 10-15 کاراکتر، به نوار جستجو اضافه کنید. اگر نتایج جستجو برای متن جستجو شده شامل دو یا چند صفحه از سایت شما باشد، تشخیص موارد تکراری کار دشواری نخواهد بود.

اما این روش ها برای سایت هایی که از تعداد صفحات کمی تشکیل شده اند مناسب هستند. اگر سایت چند صد یا حتی هزاران صفحه داشته باشد، جستجوی دستی برای موارد تکراری و بهینه سازی سایت به طور کلی به کارهای غیر ممکن تبدیل می شود. برای چنین اهدافی وجود دارد برنامه های ویژهبه عنوان مثال، یکی از رایج ترین آنها Xenu`s Link Sleuth است.

علاوه بر این، ابزارهای ویژه ای برای بررسی وضعیت نمایه سازی در پنل های Google Webmaster Tools و Yandex.Webmaster وجود دارد. آنها همچنین می توانند برای شناسایی موارد تکراری استفاده شوند.

روش های حذف صفحات تکراری

حذف نه صفحات مورد نیازهمچنین می تواند به روش های مختلفی انجام شود. هر مورد خاص روش خاص خود را دارد، اما اغلب، هنگام بهینه سازی یک وب سایت، از آنها به صورت ترکیبی استفاده می شود:

  • حذف موارد تکراری به صورت دستی - مناسب اگر همه موارد غیر ضروری نیز به صورت دستی شناسایی شوند.
  • ادغام صفحات با استفاده از ریدایرکت 301 - مناسب اگر موارد تکراری تنها در نبود و وجود "www" در URL متفاوت باشد.
  • با استفاده از تگ "کانونیکال" - مناسب در صورت تکرار نامشخص (به عنوان مثال، وضعیت ذکر شده در بالا با کارت های محصول در یک فروشگاه آنلاین) و با وارد کردن کدی مانند "link rel="canonical" href="http:/ پیاده سازی می شود. /sitename.ru/ stranica-kopiya"/" در بلوک سر صفحات تکراری.
  • پیکربندی صحیح فایل robots.txt - با استفاده از دستورالعمل "Disallow"، می توانید صفحات تکراری را از فهرست شدن توسط موتورهای جستجو منع کنید.

نتیجه

بروز صفحات تکراری می تواند مانعی جدی برای بهینه سازی سایت و رساندن آن به جایگاه برتر شود. این مشکلباید در مرحله اولیه وقوع آن رسیدگی شود.

صفحات تکراری در وب سایت ها یا وبلاگ ها، از کجا می آیند و چه مشکلاتی می توانند ایجاد کنند.
این دقیقاً همان چیزی است که در این پست در مورد آن صحبت خواهیم کرد، ما سعی خواهیم کرد این پدیده را درک کنیم و راه هایی برای به حداقل رساندن مشکلات احتمالی که صفحات تکراری در سایت می توانند برای ما به ارمغان بیاورند پیدا کنیم.

پس بیایید ادامه دهیم.

صفحات تکراری چیست؟

صفحات تکراری در هر منبع وبیعنی دسترسی به اطلاعات یکسان در آدرس های مختلف. به چنین صفحاتی، سایت های تکراری داخلی نیز گفته می شود.

اگر متون موجود در صفحه کاملاً یکسان باشند، به چنین موارد تکراری کامل یا واضح می گویند. اگر تطابق جزئی وجود داشته باشد برداشت ها ناقص یا نامشخص نامیده می شوند.

برداشت های ناقص– اینها صفحات دسته بندی، صفحات فهرست محصولات و صفحات مشابه حاوی اعلان مطالب سایت هستند.

صفحات تکراری را کامل کنید- اینها نسخه های قابل چاپ، نسخه های صفحات با پسوندهای مختلف، صفحات آرشیو، جستجوهای وب سایت، صفحات دارای نظرات و غیره هستند.

منابع صفحات تکراری

بر این لحظهاکثر صفحات تکراری زمانی ایجاد می شوند با استفاده از CMS مدرن– سیستم های مدیریت محتوا که موتورهای وب سایت نیز نامیده می شوند.

این و وردپرس و جوملا و DLEو دیگر CMS های محبوب این پدیده به طور جدی بهینه سازان و مدیران وب سایت ها را تحت فشار قرار می دهد و باعث ایجاد مشکلات اضافی برای آنها می شود.

در فروشگاه های آنلاینموارد تکراری ممکن است هنگام نمایش محصولات مرتب شده بر اساس جزئیات مختلف ظاهر شوند (تولید کننده محصول، هدف محصول، تاریخ تولید، قیمت و غیره).

ما همچنین باید بدنام را به یاد داشته باشیم پیشوند WWWو تصمیم بگیرید که آیا از آن در نام دامنه هنگام ایجاد، توسعه، ترویج و تبلیغ سایت استفاده کنید یا خیر.

همانطور که می بینید، منابع تکراری می تواند متفاوت باشد، من فقط موارد اصلی را لیست کرده ام، اما همه آنها برای متخصصان شناخته شده هستند.

صفحات تکراری منفی هستند.

با وجود اینکه بسیاری از افراد توجه زیادی به ظاهر تکراری نمی کنند، این پدیده می تواند ایجاد جدی کند مشکلات در ارتقاء وب سایت.

موتور جستجو ممکن است در نظر بگیرد موارد تکراری مانند هرزنامه هستندو در نتیجه موقعیت این صفحات و سایت را به طور جدی کاهش دهید.

هنگام تبلیغ یک سایت با لینک، ممکن است وضعیت زیر ایجاد شود. در برخی موارد، موتور جستجو بیشترین موارد را در نظر می گیرد صفحه تکراری مربوطهو نه اونی که با لینک ها تبلیغ می کنید و همه زحمات و هزینه های شما بیهوده خواهد بود.

اما افرادی هستند که تلاش می کنند برای افزایش وزن از موارد تکراری استفاده کنیدبه صفحات ضروری، به عنوان مثال، صفحه اصلی یا هر صفحه دیگری.

روش های مقابله با صفحات تکراری

چگونه از تکراری جلوگیری کنیم یا چگونه آنها را حذف کنیم نکات منفیوقتی ظاهر می شوند؟
و به طور کلی، آیا ارزش دارد که به نوعی با آن مبارزه کنید یا همه چیز را در اختیار موتورهای جستجو بگذارید. بگذارید خودشان بفهمند، چون خیلی باهوش هستند.

با استفاده از robots.txt

Robots.txt– این فایلی است که در دایرکتوری ریشه سایت ما قرار دارد و حاوی دستورالعمل هایی برای روبات های جستجوگر است.

در این دستورالعمل ها، ما مشخص می کنیم که چه صفحاتی در سایت خود را ایندکس کنیم و کدام را نه. همچنین می توانیم نام دامنه اصلی سایت و فایل حاوی نقشه سایت را مشخص کنیم.

برای جلوگیری از ایندکس شدن صفحه دستورالعمل Disallow استفاده می شود. این همان چیزی است که وب‌مسترها برای جلوگیری از فهرست‌بندی صفحات تکراری و نه تنها موارد تکراری، بلکه هر اطلاعات دیگری که مستقیماً با محتوای صفحات مرتبط نیست، استفاده می‌کنند. مثلا:

غیر مجاز: /search/ - بستن صفحات جستجو در سایت
غیر مجاز: /*؟ - صفحات حاوی علامت سوال "؟" را ببندید.
غیر مجاز: /20* - صفحات آرشیو را ببندید

با استفاده از فایل htaccess

File.htaccess(بدون پسوند) نیز در دایرکتوری ریشه سایت قرار دارد. برای مبارزه با موارد تکراری، این فایل برای استفاده پیکربندی شده است 301 تغییر مسیر.
این روش به خوبی به حفظ عملکرد سایت کمک می کند تغییر CMS سایت یا تغییر ساختار آن.نتیجه تغییر مسیر صحیح بدون از دست دادن جرم پیوند است. در این صورت وزن صفحه در آدرس قدیمی به صفحه در آدرس جدید منتقل می شود.
ریدایرکت های 301 همچنین هنگام تعیین دامنه اصلی یک سایت - با WWW یا بدون WWW استفاده می شود.

با استفاده از تگ REL = "CANNONICAL"

با استفاده از این تگ، مدیر وب سایت منبع اصلی را به موتور جستجو نشان می دهد، یعنی صفحه ای که باید ایندکس شود و در رتبه بندی موتورهای جستجو شرکت کند. صفحه معمولاً متعارف نامیده می شود. ورودی کد HTML به شکل زیر خواهد بود:

هنگام استفاده از CMS WordPress، این را می توان در تنظیمات چنین مفید انجام داد افزونه ای مانند All in One Seo Pack.

اقدامات ضد تکراری اضافی برای CMS WordPress

با استفاده از تمام روش‌های بالا برای برخورد با صفحات تکراری در وبلاگم، همیشه این احساس را داشتم که هر کاری که ممکن بود انجام نداده‌ام. بنابراین، پس از گشت و گذار در اینترنت و مشورت با متخصصان، تصمیم گرفتم کار دیگری انجام دهم. الان توضیحش میدم

تصمیم گرفتم موارد تکراری که در وبلاگ ایجاد می شود را حذف کنم با استفاده از لنگرهامن در مقاله "HTML Anchors" در مورد آنها صحبت کردم. در وبلاگ‌هایی که CMS WordPress را اجرا می‌کنند، زمانی که تگ اعمال می‌شود، لنگرها ایجاد می‌شوند "#بیشتر" و هنگام استفاده از نظرات. مصلحت استفاده از آنها کاملاً بحث برانگیز است ، اما آنها به وضوح موارد تکراری تولید می کنند.
حالا چطور این مشکل را برطرف کردم.

بیایید ابتدا با برچسب #بیشتر مقابله کنیم.

من فایلی را که در آن تولید شده است پیدا کردم. یا بهتر بگویم به من گفتند.
این است../wp-includes/post-template.php
سپس یک قطعه برنامه پیدا کردم:

ID)\» class= \»more-link\»>$more_link_text"، $more_link_text);

قطعه ای که با رنگ قرمز مشخص شده بود حذف شد

#more-($post->ID)\» class=

و من با یک خط مانند این پایان یافتم.

$output .= application_filters('the_content_more_link', ' $more_link_text"، $more_link_text);

حذف لنگرهای نظر #کامنت

حالا بریم سراغ نظرات. من خودم قبلاً به آن فکر کردم.
من هم در مورد پرونده تصمیم گرفتم ../wp-includes/comment-template.php
پیدا کردن کد برنامه مورد نیاز

apply_filters('get_comment_link', $link . '#اظهار نظر-' . $comment->comment_ID، $comment، $args))

به همین ترتیب، قطعه ای که با رنگ قرمز مشخص شده بود حذف شد. بسیار مرتب، دقیق، تا هر نقطه.

. '#اظهار نظر-' . $comment->comment_ID

در نهایت به خط کد برنامه زیر می رسیم.

apply_filters('get_comment_link', $link, $comment, $args) را برگردانید.
}

طبیعتاً همه این کارها را پس از کپی کردن فایل های برنامه مشخص شده در رایانه انجام دادم تا در صورت خرابی به راحتی بتوانم وضعیت قبل از تغییرات را بازیابی کنم.

در نتیجه این تغییرات، وقتی روی متن "Read the rest of entry..." کلیک می کنم، صفحه ای با آدرس کانونی و بدون افزودن دنباله ای به آدرس به شکل "#بیشتر- دریافت می کنم. ..”. همچنین، وقتی روی یک نظر کلیک می کنم، یک آدرس معمولی معمولی بدون پیشوند به شکل "#comment-..." دریافت می کنم.

بدین ترتیب تعداد صفحات تکراری سایت اندکی کاهش یافته است. اما اکنون نمی توانم بگویم که وردپرس ما چه چیز دیگری تشکیل می دهد. ما مشکل را بیشتر رصد خواهیم کرد.

و در خاتمه یک ویدیوی بسیار خوب و آموزشی در این زمینه به شما عزیزان می رسانم. تماشای آن را به شدت توصیه می کنم.

سلامتی و موفقیت برای همه. تا دفعه بعد.

مواد مفید: