گزارش سالانه وباسپم گوگل که سال 2022 را پوشش میدهد، تمام راههایی را که سیستم ضد هر،مه SpamBrain آنها در گرفتن اشکال مختلف هر،مه ماهرتر شده است، نشان میدهد. در حالی که این گزارش عمدتاً در مورد گزارش میزان هر،مه بیشتری در مقایسه با سال قبل است، نکات مربوط به نحوه عملکرد SpamBrain به همان اندازه مهم به نظر می رسید.
Google SpamBrain Platform
SpamBrain نامی است که گوگل به سیستم یادگیری ماشینی خود داده است که گوگل آن را پلتفرمی می نامد که از طریق آن الگوریتم هایی را راه اندازی می کند که اشکال مختلف محتوای ناخواسته را شناسایی می کند.
یادگیری ماشینی شکلی از هوش مصنوعی است که از داده ها برای یادگیری مهارت روزافزون در کاری که برای تکمیل آن طراحی شده است استفاده می کند.
اطلاعات زیادی در مورد SpamBrain وجود ندارد، به جز این که یک پلتفرم یادگیری ماشینی است و در طرحهای Google برای جلوگیری از رتبهبندی هر،مهها «مرکزی» است.
گزارش وب اسپم گوگل به این نکته در مورد SpamBrain اشاره می کند:
ما همچنین SpamBrain را به،وان یک پلتفرم قوی و همهکاره بهبود دادیم و راهحلهای متعددی را برای بهبود پوشش انواع مختلف سوءاستفاده ارائه کردیم.»
بهبود SpamBrain
گزارش Webspam اشاره کرد که بهبود سیستم منجر به جذب 500٪ سایت های هر،مه بیشتر از سال قبل شده است.
آموزش اضافی منجر به افزایش ده برابری در توانایی SpamBrain برای شناسایی وب سایت های هک شده شد.
پیوند تشخیص هر،مه
این گزارش خاطرنشان کرد که آموزش ویژه هر،مه لینک منجر به جذب پنجاه برابر بیشتر سایتهایی شد که در مقایسه با سال قبل هر،مه ایجاد میکنند و توانایی SpamBrain در یادگیری را به ،وان کلید موفقیت آن ذکر کرد.
“به لطف قابلیت یادگیری SpamBrain، ما 50 برابر بیشتر سایت های هر،مه لینک را در مقایسه با به روز رس، هر،مه لینک قبلی شناسایی کردیم.”
نمایه سازی دروازه بان
یک واقعیت جالب در مورد SpamBrain این است که چگونه هر،مه ها را در زمان ،یدن شناسایی می کند.
اگر یک صفحه ،یده شده به ،وان هر،مه تشخیص داده شود، بلافاصله مسدود می شود و از ورود آن به فهرست جستجوی Google جلوگیری می کند و باعث صرفه جویی در منابع از هدر رفتن در ،یدن صفحات وب ناخواسته می شود.
مسدود ، هر،مه در زمان ،یدن، قابلیتی است که در سال 2021 اعلام شد، که اشاره کرد که نمایه سازی نه تنها هنگام ،یدن هر،مه مسدود می شود، بلکه زم، که سعی می کند از طریق کنسول جستجو و نقشه های سایت وارد شود، مسدود می شود.
آنها در سال 2021 نوشتند:
ما سیستمهایی داریم که میتوانند هنگام ،یدن در صفحات یا محتوای دیگر، هر،مه را شناسایی کنند. ،یدن زم، است که سیستم های خودکار ما از محتوا بازدید می کنند و آن را برای درج در فهرستی که برای ارائه نتایج جستجو استفاده می کنیم در نظر می گیرند. برخی از محتوای شناسایی شده به ،وان هر،مه به فهرست اضافه نمی شود.
این سیستمها همچنین برای محتوایی که از طریق نقشههای سایت و کنسول جستجو کشف میکنیم، کار میکنند.
به ،وان مثال، کنسول جستجو دارای ویژگی درخواست ایند، است تا سازندگان بتوانند ما را در مورد صفحات جدیدی که باید به سرعت اضافه شوند مطلع کنند. ما مشاهده کردیم که هر،مهها به سایتهای آسیبپذیر هک می،د، وانمود می،د که مالک این سایتها هستند، خودشان را در کنسول جستجو تأیید می،د و از این ابزار برای درخواست از Google برای ،یدن و فهرستبندی بسیاری از صفحات هر،مهای که ایجاد کردهاند استفاده می،د.
با استفاده از هوش مصنوعی، ما توانستیم تأییدیه های مشکوک را مشخص کنیم و از ورود URL های هر،مه به این طریق به فهرست ما جلوگیری کنیم.
بنابراین منصفانه است که بگوییم یکی از بسیاری از کارکردهای SpamBrain این است که مانند یک دروازه بان عمل کند، قبل از اینکه هر،مه ها فرصتی برای ورود به فهرست گوگل پیدا کنند، آنها را مسدود می کند.
حفاظت از کلاهبرداری اکنون چند زبانه است
چیز جدیدی برای SpamBrain این است که سیستم شناسایی کلاهبرداری اکنون چند زبانه است و در مقایسه با سال قبل 50٪ کلیک روی سایت های کلاهبرداری را کاهش می دهد.
در مورد محتوای هر،مه چطور؟
گزارش امسال بر روی یافتن هر،مه لینک ها، شناسایی سایت های هک شده و بهبود در تشخیص هر،مه در زمان ،یدن تمرکز داشت.
چیزی که ذکر نشده بود، ارتباطی با شناسایی محتوای هر،مه داشت.
آیا این به این دلیل است که بخش محتوا توسط الگوریتم محتوای مفید مدیریت می شود و نه SpamBrain؟
گزارش وب اسپم گوگل را بخو،د:
نحوه مبارزه با هر،مه در جستجوی Google در سال 2022
تصویر برجسته توسط Shutterstock/Asier Romero
منبع: https://www.searchenginejournal.com/google-webspam-report-spam،in/484448/