با افزایش اطلاعات و حجم داده ها و توسعه وب سایت ها به روش ها و ترفند هایی برای دستیابی به داده ها و استخراج اطلاعات از آن نیاز داریم که به آن وب کاوی می گویند.
در این آموزش، ابتدا به معرفی مفاهیم و تکنیک های پایه بازیابی اطلاعات وب و کاربردهای آن ها پرداخته می شود.
در ادامه ساختار، معماری و مولفه های شاخص سامانه های پایه جستجوی اطلاعات وب یعنی جویشگرها (Web Search Engines) و فراجویشگرها (Web Meta-Search Engines) مورد مطالعه و بررسی قرار خواهد گرفت.
بخش پایانی این آموزش نیز به معرفی مباحث به روز در این حوزه از جمله بازیابی بین زبانی (Cross-Language Information Retrieval)، رتبه بندی مبتنی بر یادگیری (Learning to Rank) و نیز آینده پژوهی فناوری وب اختصاص یافته است.
با پلاسما وب همراه باشید !
وب کاوی یا Web Mining
وب به عنوان گسترده ترین رسانه جهانی از منظر تولید محتوا و نیز میزان کاربران، فرصت ها و چالش های نوینی را فرا روی بشر قرار داده است. تنوع اطلاعات و خدمات در وب، تامین نیاز اطلاعاتی کاربران را به یکی از چالش های جدی آنان تبدیل نموده است.
در این دوره آموزشی، ابتدا به معرفی مفاهیم و تکنیک های پایه بازیابی اطلاعات وب و کاربردهای آن ها پرداخته می شود.
در ادامه این دوره، ساختار، معماری و مولفه های شاخص سامانه های پایه جستجوی اطلاعات وب یعنی جویشگرها (Web Search Engines) و فراجویشگرها (Web Meta-Search Engines) مورد مطالعه و بررسی قرار خواهد گرفت.
بخش پایانی این دوره نیز به معرفی مباحث بروز در این حوزه از جمله بازیابی بین زبانی (Cross-Language Information Retrieval)، رتبه بندی مبتنی بر یادگیری (Learning to Rank) و نیز آینده پژوهی فناوری وب اختصاص یافته است.
پیش نمایش :
فهرست سرفصل ها و رئوس مطالب مطرح شده در این مجموعه آموزشی، در ادامه آمده است:
- درس یکم: معرفی مفهوم وب کاوی، اصول و شاخص های ارزیابی
- درس دوم: تکنیک های پایه ارزیابی اطلاعات متنی
- رده بندی Classification
- خوشه بندی Clustering
- درس سوم: معرفی مدل های بازیابی اطلاعات
- مدل های فضای برداری (Vector Space Model)
- مدل های احتمالی (Probabilistic Models)
- مدل های آماری زبانی (Statistical Language Models)
- مدل های بازیابی ضابطه ای (Axiomatic Retrieval Models)
- درس چهارم: معرفی معماری و ساختار سامانه های جستجوی وب
- ملاحظات پیاده سازی سامانه های بازیابی اطلاعات
- الگوریتم های پایه بازیابی اطلاعات وب: معرفی الگوریتم های رتبه بندی PageRank و HITS
- معرفی الگوریتم های رتبه بندی گسترش یافته روش های PageRank و HITS
- معرفی ساختار و اجزای جویشگرهای وب (Web Search Engines) – بیان برخی از کاربردهای تکنیک های بازیابی اطلاعات وب
- معرفی ساختار و اجزای فراجویشگرهای وب (Web Meta-Search Engines)
- درس پنجم: مسائل به روز در بازیابی اطلاعات وب
- معرفی صفحات هرز (Spam) در محیط وب و الگوریتم های تشخیص آن ها
- مباحث پیشرفته در زمینه بازیابی اطلاعات وب: رتبه بندی مبتنی بر یادگیری (Learning to Rank)
- ادامه کاربردهای تکنیک های بازیابی اطلاعات وب: رده بندی، خوشه یابی، پالایش اطلاعات و خلاصه سازی متون
- بازیابی بین زبانی اطلاعات (Cross-Language Information Retrieval)
- تکنیک های طراحی واسط کاربر برای سامانه های بازیابی اطلاعات وب
- بیان روند تکامل وب و معرفی نسل های مختلف آن و دورنمای آینده
مفید برای رشته های
- مهندسی کامپیوتر
- فناوری اطلاعات
- علوم کامپیوتر
در ادامه لیست کتب انگلیسی منتشر شده در این زمینه معرفی شده اند:
- Christopher D. Manning, Prabhakar Raghavan and Hinrich Schuetze; Introduction to Information Retrieval; 2008
- Stefan Büttcher, Charles L. A. Clarke, and Gordon V. Cormack ; Information Retrieval: Implementing and Evaluating Search Engines (MIT Press); 2010
- Ricardo Baeza-Yates & Berthier Ribeiro-Neto; Modern Information Retrieval; 2011
هیچ دیدگاهی برای این محصول نوشته نشده است.