•انتصاب مقدار مناسب به فيلدهاي استخراج شده براي كشف محتويات داخل دادهپايگاه
•تكنيك اول:
–استفاده از پرسوجوهاي از پيش تعيين شده
•تكنيك دوم:
–استفاده از مقادير موجود در فيلدها بصورت جايگشتي
•تكنيك سوم:
–آموزش خزشگر با استفاده از پالايش صفحهي جستجو
•تكنيك چهارم:
–استفاده از تكنيكهاي يادگيري ماشين
•تكنيك پنجم:
–تبديل مسألهي پيدا كردن بهترين پرسوجو براي يك داده پايگاه به مسألهي پوشش مجموعه در گرافها
–تبديل به مسألهي مجموعهي غالب وزندار كمينه
•تكنيك ششم:
–كار با اسكريپتهاي سمت مشتري
4-آناليز نتايج دريافتي از دادهپايگاهها
ر
•دلايل:
–بدست آوردن كلمات كليدي جديد
–تخمين تعداد مستندات دادهپايگاه در يك زمينهي خاص
5-دستهبندي يا خوشهبندي دادهپايگاهها
•دستهبندي يا خوشهبندي؟
•روشهاي مختلف دستهبندي:
–دستهبندي مبتني بر پرسوجو
–دستهبندي مبتني بر خزش
–دستهبندي با استفاده از توصيفات كلاس سرويس
چشمانداز آينده
•ارائهي يك مدل براي دادهپايگاهها
–حل مسألهي پيدا كردن پرسوجوهاي بهينه
–
•استفاده از تكنيكهاي دستهبندي فازي
–بدليل:
•عدم قطعيت در دستهبندي
•همپوشاني دادهپايگاهها
–مانند: C-Means