فايل دانشگاهی – بهینه سازی روش تشخیص اهمیت پیوند در پایگاه پیوند و کاربست آن …

عدم تکرار بیش از حد کلمات کلیدی در عنوان متاتگ توضیحات و متن صفحه[۷۳]
عادی سازی URL صفحات وب
عادی سازی URL صفحات وب که از طریق URL های چندگانه قابل دستیابی باشند با استفاده از متاتگ “Canonical”
۲-۱۴الگوریتم های رتبه بندی
منظور از الگوریتم ها رتبه بندی الگوریتم هایی هستند که تصمیم می گیرند بر اساس کدام کلمات کلیدی، چه وبسایتی، در کدام صفحه و رده ای از نتایج جستجو قرار گیرد. الگوریتم های رتبه بندی امروزه بسیار پیچیده هستند و از هزاران پارامتر بهره می برند. در ادامه برخی از مشهورترین پارامتر ها بیان می شود.
۲-۱۴-۱ پارامتر های رتبه دهی سه دسته اند:

  • کلمات (تعداد و موقعیت کلمات)
  • لینک ها ( تعداد و ارجاعات)
  • آمار کاربران (کلیک یا رای کاربر)

مهمترین پارامتر کلمات هستند. اخیراً تکنیک های پیشرفته ای برای رتبه بندی ابداع شده که از رفتار کاربران به عنوان پارامتر استفاده می کنند. شرکت گـوگل از پیشتازان این روش است و با ایجاد امکان نظردهی کاربران بر نتایج این سیستم را نیز وارد الگوریتم های پیچیده خود کرده است[۳۲].
۲-۱۴-۲ وزن دهی به کلمات
برای هر کلمه ای در یک متن یک وزنی با الگوی خاصی در نظر گرفته می شود. این وزن بیانگر تاثیر کلمه بر موضوع متن در مقایسه با سایر کلمات بکار رفته است.
اهمیت کلمات را می توان بر پایه شرایطی مشخص کرد[۵۷]:

دانلود متن کامل پایان نامه در سایت jemo.ir موجود است

  • وزن آماری کلمه
  • مکان قرار گیری کلمه
  • مفهوم هر کلمه
  • کاربرد خاص کلمه

وزن آماری کلمه تعداد تکرار آن کلمه در متن بر اساس توزیع کلمات در متن است که به دو دسته فراوانی مطلق و فراوانی نسبی تقسیم می شود.
مکان قرارگیری کلمه، اینکه کلمه در عنوان یا زیر عنوان یا بدنه متن یا چکیده متن قرار گیرد از معیار های وزن دهی به کلمات می باشد.
مفهوم هر کلمه که بیانگر ارتباط کلمه با کلمات دیگر است به بیانی مترادف یا متضـاد بودن آن کلمـه است.
از کاربـرد های خاص کلمـه می توان اسـامی را در سیستمی که دنبال اسامی خـاص می گـردد مثال زد که
اهمیت ویژه ای دارد.
۲-۱۴-۳ ارزیابی کلمات کلیدی
کلماتی که از آستانه تعیین شده برای وزن دهی عبور می کنند باید معیار های زیر را داشته باشند[۵۷]:

  • جامعیت
  • تعیین کنندگی

جامعیت یعنی اینکه هر چه تعداد کلمات بیشتری از یک متن استخراج شود، احتمال بازیابی آن متن نیز بیشتر می شود و تعیین کنندکی یعنی هر کلمه کلیدی تا چه حد دقیق، متن های مربوط را مشخص کند.
۲-۱۴-۴ پارامتر های وزن دهی
سه پارامتر اصلی در وزن دهی به کلمات عبارتند از[۵۷]:

  • tf.idf
  • سیگنال و نویز