موتورهای جستجوی فارسی: ارزیابی امکانات جستجو، بازیابی اطلاعات، میزان جامعیت و مانعیت، و تعیین همپوشانی میان آنها

نوع مقاله: مقاله پژوهشی

نویسندگان

1 کارشناسی ارشد علم اطلاعات و دانش‌شناسی، دانشگاه آزاد اسلامی، واحد همدان

2 استادیار گروه علم اطلاعات و دانش‌شناسی، دانشگاه قم

چکیده

هدف: شناسایی و ارزیابی امکانات جستجو در موتورهای جستجوی فارسی، تعیین کارآمدترین موتور جستجو به‌لحاظ بازیابی اطلاعات مرتبط، شناسایی موتورهای جستجوی کارآمد از حیث محاسبة میزان جامعیت و مانعیت، و تعیین میزان همپوشانی میان آنها.
روش/ رویکرد پژوهش: پژوهش از نوع کاربردی است و به‌روش پیمایشی- تحلیلی انجام شده است. امکانات موجود در 5 موتور جستجوی عمومی و در دسترس فارسی براساس سیاهة وارسی پژوهشگر‌ساخته مورد مقایسه قرار گرفت. ضریب بازیافت نتایج مرتبط منتخب براساس 50 صفحة بازیابی‌شده برای 7 کلیدواژه و عبارت به‌صورت مجزا محاسبه شد. جامعیت و مانعیت در موتورهای جستجو در صورت وجود همپوشانی و ناهمپوشانی محاسبه شد. میزان همپوشانی موجود بین موتورها نیز در مسیر محاسبه مانعیت به‌دست آمد.
یافته‌ها: موتورهای جستجوی فارسی از امکانات جستجوی مناسبی برخوردار هستند و می‌توان تا حدودی از عملکرد آنها اطمینان حاصل کرد. در رابطه با بازیابی نتایج مرتبط و میزان جامعیت، بین موتورهای جستجو فاصله و تفاوت معناداری وجود دارد. موتورهای دارای امکانات جستجوی بیشتر از نظر بازیافت اطلاعات مرتبط‌تر و همپوشانی بیشتر کارآمدتر معرفی شده‌اند.
نتیجه‌گیری: توجه به ظرفیت‌های خالی شناسایی‌شده در موتورهای جستجوی فارسی می‌تواند در تقویت نقاط قوت و بهبود نقاط ضعف آنها مفید واقع شود.

کلیدواژه‌ها


عنوان مقاله [English]

Persian Search Engines: Evaluating Search Features, Information Retrieval, Precision and Recall and Their Overlaps

نویسندگان [English]

  • M. Rajabi 1
  • Y. Norouzi 2
چکیده [English]

Purpose: To identify and evaluate Persian search engines' features, specify the best one regarding retrieving related information, precision and recall and their overlaps.
Methodology: It's an applied research using an analytical survey. Search features of 5 general and available Persian engines were compared using a self-designed checklist. The rate of retrieving related result was calculated based on 50 retrieved pages using 7 keywords and phrases separately. Also, the precision and recall with and without overlaps were measured. The extent to which engines had overlaps was acquired during calculating recall.
Results: Persian search engines have appropriate features so one can have confidence about their performance. There are siginificant differences between search engines regarding retrieving related information and precision. Those engines having more search features were more efficient in retrieving related information and had higher level of overlapping.
Conclusion: The identified gaps existed in search engines must be taken into consideration in order to support strengths and overcome weaknesses of these tools.

کلیدواژه‌ها [English]

  • Persian search engines
  • Efficiency
  • Information retrieval
  • Overlapping
  • Precision
  • recall
  • Evaluation

اسفندیاری مقدم، علیرضا (1384). بررسی نتایج جستجو در ابرموتورهای کاوش و موتورهایتحت پوششآنها از جنبه همپوشانی و رتبه‌بندی. پایان‌نامۀ کارشناسی ارشد، دانشگاه فردوسی، مشهد.

بهاری موفق، زهره (1388). بررسی تطبیقی نتایج جستجوی کلیدواژه‌های تخصصی پزشکی در موتورها و ابرموتورهای کاوش وب. پایان‌نامۀ کارشناسی ارشد، دانشگاه آزاد اسلامی، همدان.

قاضی‌میرسعید، جواد؛ حقانی، حمید؛ و اکبری، علیرضا (1386). مطالعه مقایسه‌ای موتورهای کاوش و ابرموتورهای کاوش در بازیابی اطلاعات فیزیوتراپی از شبکه جهانی وب و تعیین میزان همپوشانی میان آنها. مدیریت اطلاعات سلامت، 4 (1)، 11- 21.

کمیجانی، احمد (1382). مقایسه کارآیی موتورهای کاوش عمومی و تخصصی وب در بازیابی اطلاعات کشاورزی. فصلنامه اطلاع‌شناسی، 1 (1)، 125- 144.

Bar-Ilan, J., & Levene, M. (2011). A method to assess search engine results. Online Information Review, 35 (6), 854-868.

Bitirim, Y., Tonta, Y., & Sever, H. (2002). Information retrieval effectiveness of Turkish search engines. In Advances in information systems (93-103). Second International Conference, ADVIS 2002, İzmir (Turkey), 23-25.Springer-Verlag. Berlin Heidelberg: Springer.

Erfanmanesh, M. A. & Didegah, F. (2010). Evaluating function of Persian search engines on the web using correspondence analysis.InternationalJournal of Information Science and Management(IJSM), 8(2), 77-87, Retrieved October 14, 2015, from    http://ijism.ricest.ac.ir/index.php/ijism/article/view/51/54

Halim, H. & Kaur, K. (2006). Malaysian web search engines: A critical analysis. MalaysianJournal of Library & Information Science, 11(1), 103-122.

Isfandyari Moghaddam, A. & Parirokh, M. (2006). A comparative study on overlapping of search results in metasearch engines and their common underlying search engines. Library Review, 55(5), 301-306.

Joachims, T. (2002). Optimizing search engines using clickthrough data. In Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining (KDD '02). ACM, New York, NY, USA, 133-142. DOI=10.1145/775047.775067 http://doi.acm.org/10.1145/775047.775067

Kumar, B. S., & Prakash, J. N. (2009). Precision and relative recall of search engines: A comparative study of Google and Yahoo. Singapore Journal of Library & Information Management, 38(1), 124-137.

Leighton, H. V. (1995). Performance of four World Wide Web (WWW) index services: Infoseek, Lycos, WebCrawler, and WWWWorm. Retrieved October 14, 2015, from http://course1.winona.edu/vleighton/webind.htm

Leighton, H. V. & Srivastava, J. (1997). Precision among world wide web search services (search engines): Alta Vista, Excite, Hotbot, Infoseek, Lycos, Retrieved October 14, 2015,    from http://course1.winona.edu/VLeighton/webind2/webind2.htm#REFLEI1

Peterson, R. E. (1997). Eight Internet search engines compared. First Monday, 2(2).

PEW (March 2000 - September 2009). Pew Internet & American Life Project tracking surveys, Pew  Internet & American Life Project, Retrieved October 14, 2015, from http://www.pewinternet.org/

 Rather, R. A., Lone, F. A., & Shah, G. J. (2008). Overlap in Web search results: A study of five search engines. Library Philosophy and Practice (e-journal), 226. Retrieved October 14, 2015, from http://digitalcommons.unl.edu/cgi/viewcontent.cgi?article=1228&context= libphilprac

Shafi, S. M., & Rather, R. A. (2005). Precision and recall of five search engines for retrieval of scholarly information in the field of biotechnology. Webology, 2 (2).

Spink, A., Jansen, B. J., Kathuria, V., & Koshman, S. (2006). Overlap among major web search engines. Internet Research, 16 (4), 419-426.