Free Web Hosting by Netfirms
Web Hosting by Netfirms | Free Domain Names by Netfirms

article2

اطلاع رسان

ETTELARESAN

تصاويرانگليسيكارهاي كلاسيصفحه اصليدرباره اطلاع رسان

بازگشت به مقالات برگزيده

مقاله شماره 2

عنوان: نمایه سازی موتورهای وب  و اهمیت آن در بازیابی اطلاعات جهان مجازي

  نويسندگان: آذر مكوندي،  سعيد حسيني

منبع: نما. مجله الكترونيكي پژوهشگاه اطلاعات و مدارك علمي ايران.

فهرست مطالب:

چكيده

مقدمه

نمايه سازي وب

نقش موتورهاي جستجو درنمايه سازي وب

نمايه سازي وب و ابرموتور

نتيجه

منابع

 

چكيده:                ابتداي صفحه

با پیدایش دنیای مجازی شاهد ظهور انقلاب دیگری تحت نام انقلاب اطلاعات هستیم.  از سوی دیگر حجم انبوه اطلاعات کاربران را بر آن داشته تا به کیفیت اطلاعات بیش از کمیت آن بیندیشند. اطلاعات روز آمد، دقیق و معتبر سه ویژگی مهمی است که لازمه کار هر محقق می باشد. لذا رشد فناوری های نو ظهور، روشهاي جدیدی را به منظور سازماندهی اطلاعات جهت بازیابی دقیق آن به یاری می طلبد.
با استفاده از روشهای نوین سازماندهی، اطلاعات مفید از اطلاعات سیال و ناپایدار استخراج شده و کاربر به سهولت می تواند به اطلاعات مورد نياز خود دسترسی پیدا کند. یکی از مهمترین این راهکارها، نمایه سازی وب است. دنیای وب با مدد از این راهکار دریچه ای نو را به روي کابرانمي‌گشايد. در این مقاله می کوشیم تا با نگاهی به نمایه سازی وب، به بررسی انواع نمایه، نمایه سازی در موتورهای جستجو، ابر موتورها و ابر داده ها از جمله ابر داده دوبلین کور ، بازنمود نمایه در وب و معرفی نرم افزارهای نمایه سازی بپردازيم و بستری مناسب جهت اهمیت و نقش آن در بازیابی اطلاعات جهان مجازی فراهم آوریم.
 کلید واژه ها: نمايه[1]، نمایه سازی وب[2] ، موتور جستجو[3]، ابر موتور جستجو[4]، ابر داده[5]،دوبلين كور[6]، بازنمود نمایه

مقدمه:           ابتداي صفحه

رشد تصاعدی فضای اطلاعاتی وب، آلودگی اطلاعات را دامن زده است، از سوی دیگر وجود اطلاعات میرا و سیال اهمیت نمایه سازی وب را بیش از پیش مطرح می سازد. لذا آنچه که  براي كاربران وب مهم است، دستيابي سريع و آسان به اطلاعات دقيق، روزآمد و داراي اعتبار مي باشد، نه حجم انبوه اطلاعات. نمایه سازی کارآمد، به کاربر امکان بازیابی اطلاعات دقیق، صحیح و روز آمد را می دهد. به بيان ديگر نمایه سازی وب فرآیند پالایش و فیلتر  اطلاعات دنیای وب است و نمایه ساز پالاینده  اطلاعات آن. بايد دانست كه نمايه سازي وب مفهوم جديدي نيست.

 

نمايه سازي وب:         ابتداي صفحه

با گسترش حجم انبوه اطلاعات و به اشتراک گذاری آن و رویکرد روز افزون برقراری ارتباطات از طریق اینترنت بحث سازمان دادن اطلاعات به قصد سهولت در بازیابی مطرح می باشد. یکی ازکارآمدترین روشهای بازیابی، نمایه سازی وب     می باشد. نمایه وب منابعی را که از طریق  world wide webدر دسترس هستند جمع آوری و سازماندهی مینماید و نقطه شروعی برای یافتن اطلاعات می باشد. در وب نمایه ها ممکن است به روشهای گوناگونی سازماندهی شوند. شیوه سازماندهی یک نمایه با نمایه دیگر فرق میکند، نمایه ها می توانند به طور الفبایی، موضوعی (رده ای) و ... سازماندهی شوند. نمایه های موضوعی اغلب منابع شان را طبق یک نظم سلسله مراتبی از اعم به اخص مرتب می کنند.. نمایه های وب برای نشان دادن لیستهای منابع خود ازپیوندهای فرا متن استفاده می کنند، آنها این امکان را دارند تا از طریق لینک ها صدها و بلکه هزاران منبع را در بر بگیرند. عموما تمام نمایه ها یک نقطه اتصال دهنده مستقیم به منابع فهرست شده را به کاربران عرضه می کنند.
 لذا این نکته به خوبی قابل احساس است که ساختارهای وسیع و جامع یک متن برای دسترسی آسان تر نیاز به سازماندهی و نظم منطقی دارند. از دید یک محقق یا کاربرمعمولا دسترسی آسان به اطلاعات به بیش از یک استراتژی جستجو نیازمند است و نهایتا همه آنها به فرآیند سازماندهی فایلهای HTML درزیر فهرستهایی منتهی می شوند.
این زیر فهرستها هم به تهیه کننده اطلاعات و هم به کاربر وب سایت کمک می کند. در این حالت کاربر می تواند براساس یک کد، یک نام فایل،یا محتوای یک عنوان جستجو کند.به عنوان مثال يكي از راههاي دسترسي به اين موارد برنامه ای به نام CGI مي باشد.[ http://www.cu.edu/]
 نمایه های وب برای نشان دادن لیستهای منابع خود از پیوندهای فرا متن استفاده می کنند، آنها این امکان را دارند تا از طریق لینک ها صدها و بلکه هزاران منبع را در بر بگیرند.
 
تعدادی از نمایه های مشهور وب به شرح ریر می باشند:[ : http://www.ext.nodak.edu/ ]

●Yahoo!TM
●The WWW Virtual Library
●Trade Wave Galaxy
●فهرست خدمات اینترنتی Yanoff
●The Argus Clearinhouse
●Magellan
●Point

 

نقش موتورهای جستجو در نمایه سازی وب       ابتداي صفحه


حجم انبوه اطلاعات وب و عدم نمایه سازی جامع، متخصصان این حوزه را برآن داشته تا با مدد از فن آوری افکار، موتورهای جستجو را بکار گیرند و راهکاری مناسب جهت نمایه سازی را فراهم آورند. از سوی دیگر برخی از وب سایت ها برای اطمینان از بازیابی بیشترین رتبه بندیهای مرتبط، از اصطلاحات کلیدی استفاده  می کنند، این در حالی است که تعدادی دیگر از نمایه سازی کور بهره می گیرند.
مشکل اصلی این نوع نمایه سازی اضافه بازیابی است که حجم زیاد اطلاعات نامرتبط را شامل می شود، لذا جهت افزایش جامعیت و مانعیت بازیابی، موتورهای جستجو به عنوان یک راهکار مطرح شدند. (دیگان، 1382، ص 161)
موتورهای جستجو، ابر موتورها و ابر داده ها در واقع ابزارهای کمکی برای نمایه سازی و ارائه اطلاعات مرتبط با موضوع مورد جستجو در اینترنت هستند.
نمايه ها اساس كار موتورهاي جستجو در رتبه بندي نتايج جستجو و تركيب منطقي واژه ها (جستجوي بولي) براي بازيابي اطلاعات در اينترنت را تشكيل مي دهد. اما بزرگترين موتورهاي جستجو هم قادر به نمايه سازي وب نيستند. برخي از اين موتورها نظام نمايه سازي تمام متن دارند و هر واژه موجود درمتن به جز واژه هاي فاقد بار اطلاعاتي مانند حروف اضافه، ربط و تعريف را نمايه مي كند. برخي بخشي از منبع را نمايه مي كنند.برخي ديگر، سرعنوانها، عناوين فرعي و فراپيوندها را همراه 20 خط ابتداي متن و 100 كلمه اي كه از بسامد بالايي برخوردار است، نمايه مي كنند. (داورپناه،1381،ص 84)
از دیدگاه مدیریت نظام اطلاعاتی چهار ویژگی اصلی برای اطلاعات بازیابی شده قابل لحاظ است: دقت[7]، پیوستگی زمانی[8]، بهنگام بودن[9] و مرتبط بودن[10].(منتظر،1380، ص 31) لذا نمایه سازی باید بر مبنای چهار ویژگی مذکور انجام پذیرد. بنابراین جهت رسیدن به نمایه سازی جامع و مانع وب به نمایه سازی دقیق موتورهای جستجو نیاز داریم
.
 
 

نمایه سازی وب و ابر موتورها        ابتداي صفحه
از ابرداده ها برای جستجو، سازماندهی و بازیابی منابع الکترونیکی موجود در شبکه جهانی اینترنت استفاده می شود.اساس کار آنها همان نمایه سازی موتورهای جستجو می باشد. نکته مهم این است که ابر موتورها دارای پایگاه اطلاعاتی مختص به خود نیستند؛ به گردآوری اطلاعات صفحات وب نمی پردازند؛ صفحات وب را بررسی، طبقه بندی و یا نمایه سازی نمی کنند بلکه کلید واژه ها یا عبارتهای مورد جستجو را به طور همزمان به چند موتور جستجو، که در ساختار ابر موتور تعریف شده است، ارسال می کنند و نتایج را به صورت منظم و طبقه بندی شده ارائه و رکوردهای تکراری حاصل را حذف می نمایند. (منتظر،1380)
تعدادی ابر موتور جستجو در زیر آورده شده است:

Metacrawler, Metafind, Cyber 411, Inference Find, Super Seek, Dogpile

باهوشترين ابر جستجوي دنياي وب  ixquick مي باشد كه بسيار منطقي ومتفكر است و جوابهاي بازگشتي را بر حسب مورد جستجو آناليز و رده بندي مي كند. از ويژگيهاي اين ابرجستجوگر به موارد زير مي توان اشاره كرد:(نائيني علي اكبري، 1380، ص299-300)
● جامعیت و صحت نتایج: هنگام جستجو این ابر موتور جسجو به طور همزمان چندین موتور جستجو را مورد کاوش قرار   می دهد
● قدرت پالایش نتایج
● سرعت بالا
● رده بندي جوابها: ixquick برای هر موتور جستجو که آن را به عنوان یکی از ده نتیجه بهتر برای جستجو انتخاب می شود یک علامت ستاره و اگر 5 موتور جستجو بر روی یک نتیجه به توافق برسند علامت 5 ستاره را نشان می دهد.
● دارای جستجو به 18 زبان زنده دنیا می باشد.
● كار با آن آسان است
● از سیزده موتور جستجو و دايركتوري برتر دنياي وب بهره مي گيرد. هر چه نمایه سازی این موتورها دقیق تر و جامعتر باشد، بازیابی و پالایش اطلاعات توسط ابرموتور نیز از جامعیت و دقت بیشتری برخوردار است.

 

نتيجه        ابتداي صفحه
همه موتورهاي جستجو از يك نوع روش نمايه سازي استفاده نمي كنند و عدم وجود يك نمايه جهاني با يك زبان و نرم افزار واحد باعث شده است نتايج حاصل از جستجو در يك موتور جستجو با نتايج حاصل از جستجو در موتور جستجوي ديگر متفاوت مي باشد لذا هر كاربر اطلاعاتي بايد برايي رسيدن به نتيجه مطلوب جستجو بيش از يك موتور جستجو را به كار گيرد. شايد در آينده اي نه چندان دور شاهد ظهور چنين نمايه اي باشيم
.
 

منابع        ابتداي صفحه
1. داورپناه، محمدرضا،1381، "جستجوي اطلاعات علمي و پژوهشي در منابع چاپي و الكترونيكي؛ شامل حوزه هاي علوم و فني مهندسي...". تهران: دبيزش.
2. ديگان، ماريلين؛ تانر، سيمون، 1382."آينده ديجيتالي كتابخانه ها: راهبردهايي براي عصر اطلاعات"، ترجمه عباس گيلوري، تهران: دبيزش، چاپار.
3. رزم گير، مريم؛ سيف، زهرا،1384،"توسعه خدمات كاربرمدار: چشم انداز كيفي خدمات كتابخانه ها"، مجموعه مقالات هشتمين همايش كتابداران سازمان مديريت و برنامه ريزي كشور، اصفهان 1-3 دي 1383.
4. سلطانی، پوری؛ راستین، فروردین، 1382، "دانشنامه کتابداری و اطلاع رسانی، فارسی – انگلیسی و انگلیسی – فارسی" . تهران: فرهنگ معاصر.
5. كميجاني، احمد، " ساختار نمايه‌سازي در موتورهاي كاوش وب"،فصلنامه اطلاع رساني. دوره 17، شماره 3و4
6. لانكاستر، اف ويلفريد، 1379، " نظامهاي بازيابي اطلاعات، آزمون و ارزيابي"، ترجمه جعفر مهرداد، شيراز: نويد، 1379.
7. محمدي، سيد حسين، 1383، " ابر‌داده: مفاهيم و كار‌برد‌ها". http://www.irandoc.ac.ir/data/E_J/vol2/metadata.htm
8. مختاری نبی، ابراهیم،1382،" سازماندهی منابع اینترنتی: چالش ها و ضرورت ها". http://www.irandoc.ac.ir/Data/E_J/vol1/organaizing.htm
9. منتظر،غلامعلی،1381، "موتورهای کاوش اینترنت: درآمدی بر بازیابی بهینه اطلاعات". تهران:کویر.
10. موران، جیمز؛ هال، ویکتوریا؛ ویلر، دانا، (1383)."آموزش ICDL  به زبان ساده مهارت هفتم: اطلاعات و ارتباطات"، ترجمه علی اکبر متواضع، تهران: موسسه فرهنگی هنری دیباگران.
11. نائيني علي اكبري، اردوان،1380، "مرجع كامل قويترين تكنيكهاي جستجو در اينترنت". تهران: ارس يارانه.
12. هيئت مولفان و ويراستاران انتشارات ميكروسافت،1382،"فرهنگ تشريحي كامپيوتر ميكروسافت 2004"، ترجمه رضا حسنوي، داريوش فرسائي. تهران: دانشيار، پيك علوم.