تأثیر برچسب‌گذاری معنایی در رفع ابهام هم‌نویسه‌های تخصصی از نظر ریزش کاذب در بازیابی متون علمی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری علم اطلاعات و دانش‌شناسی (گرایش بازیابی اطلاعات)، دانشگاه الزهرا، تهران، ایران

2 دانشیار گروه علم اطلاعات و دانش‌شناسی، دانشگاه الزهرا، تهران، ایران

3 استادیار گروه زبان انگلیسی، دانشکده ادبیات، دانشگاه الزهرا، تهران، ایران

چکیده

هدف: مسئله اصلی در بازیابی مؤثر و کاربرمدار هم‌نویسه‌های تخصصی، توسعه فرایندی است که بازیابی اطلاعات نامرتبط را به حداقل برساند (ریزش کاذب= ۰). در این مقاله سعی شده با به‌کارگیری رویکرد پیکره‌مدار با استفاده از برچسب‌گذاری معنایی، بازیابی مدارک حاوی هم‌نویسه‌های تخصصی ارزیابی و با راهبردهای موجود (بدون برچسب‌گذاری) مقایسه و یافته‌ها آشکار شود. هدف بهینه‌سازی کارایی نظام بازیابی اطلاعات در کاهش ریزش کاذب بازیابی متون علمی با استفاده از روش رفع ابهام معنایی از هم‌نویسه‌های تخصصی به کمک برچسب‌گذاری معنایی بوده است.
روش: پژوهش به‌دلیل ماهیتش به روش ‌تجربی انجام شد. روش تجربی از روش‌های سه‌گانه رفع ابهام معنایی (بانظارت، نیمه‌نظارتی و بدون نظارت) بوده و روشی بانظارت به‌شمار می‌رود. جامعه پژوهش را ۴۴۲ مقاله علمی در دو گروه گواه و آزمون تشکیل دادند. گروه گواه (پایه) شامل ۲۲۱ متن کامل مقاله بدون برچسب و گروه تجربی (آزمون) شامل همان ۲۲۱ مقاله، اما دارای برچسب بود که ۴۶ هم‌نویسۀ تخصصی آن‌ها به روش دستی برچسب‌گذاری شد و در نظام بازیابی پیشنهادی قرارگرفتند و برای بررسی کارآیی برچسب‌ها در رفع ابهام معنایی، از هم‌نویسه‌های تخصصی و کاهش ریزش کاذب آزموده شدند.
یافته‌ها: بازیابی در مقاله‌های گروه گواه به‌دلیل ابهام معنایی هم‌نویسه‌های تخصصی، با ریزش کاذب همراه بود؛ درحالی‌که برچسب‌گذاری هم‌نویسه‌های تخصصی در متن کامل مقاله‌های گروه تجربی، تأثیر مستقیمی در کاهش ریزش کاذب داشت. سطح معنی‌داری آزمون رتبه‌های علامت‌دار ویلکاکسون (۰/۰۰۰۱ = P، ۵/۹۰۹- = Z) نشان داد که میزان ریزش کاذب نتایج بازیابی بعد از به‌کارگیری پیکره تخصصی برچسب‌گذاری‌شده در نظام بازیابی اطلاعات به‌نسبت قبل، تفاوت معنا‌داری داشت. بررسی رتبه‌های منفی و مثبت نشان داد که میزان ریزش کاذب نتایج بازیابی بعد از به‌کارگیری پیکرة تخصصی برچسب‌گذاری‌شده به میزان معنا‌داری کاهش یافته است.
نتیجه‌گیری: حد ریزش کاذب در یافته‌های پژوهش، گواه عملکرد قابل قبول برچسب‌گذاری در رفع ابهام معنایی هم‌نویسه‌های تخصصی است. همچنین بیانگر نقش مؤثر آن در بهینه‌سازی نظام بازیابی اطلاعات برای به‌حداقل‌رساندن ریزش کاذب نتایج است. بنابراین، رویکرد پیکره‌مدار نظام بازیابی اطلاعات، ضمن فراهم‌آوردن بستر بازیابی تمام‌متن، زمینه جلوگیری از ریزش کاذب و صرفه‌جویی در وقت و انرژی کاربران را فراهم خواهد کرد. گفتنی است برای رفع ابهام معنایی هم‌نویسه‌های تخصصی، برچسب‌ها منابع ارزشمندی‌اند، اما این مستلزم بهره‌مندی از مجموعة آموزش باکیفیت است. نتایج پژوهش نشان می‌دهد که داده‌های آموزشی، که به‌خوبی ساختاربندی شده باشند، نقش بسیار مهمی در بهبود رفع ابهام معنایی هم‌نویسه‌های تخصصی ایفا می‌کنند. این پژوهش به‌صورت تجربی و تحلیلی نشان داد که رویکرد پیکره‌مدار در مقایسه با جست‌وجوی مبتنی بر کلیدواژه، به‌طور معنا‌داری سطح ایده‌آلی از ریزش کاذب را به‌دست می‌دهد. روش به‌کاررفته برای رفع ابهام معنایی هم‌‌نویسه‌های تخصصی در همة زبان‌ها کاربرد دارد. 

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Effectiveness of Semantic Tagging in Sense Disambiguation of Specialized Homographs from the Perspective of False Drop in Retrieving Scientific Texts

نویسندگان [English]

  • Mina Rezaei Dinani 1
  • Masoumeh Karbala Aghaei Kamran 2
  • VahidReza Mirzaeian 3
1 Ph.D. Candidate in Knowledge and Information Science, Alzahra University, Tehran, Iran
2 Associate Professor, Department of Knowledge and Information Science (Corresponding Author), Alzahra University, Tehran, Iran
3 Assistant Professor, Department of English, Faculty of Literature, Alzahra University, Tehran, Iran
چکیده [English]

Purpose: The key problem in achieving efficient and user friendly retrieval when specialized homographs are searched is the development of a search mechanism to guarantee delivery of minimal irrelevant information (false drop=0). This paper has solved the problem through the implementation of a corpus-based approach using semantic tagging. The aim has been to optimize information retrieval system’s performance using semantic tagging of specialized homographs to decrease false drop.
Method: This research was conducted experimentally and employed one of the three methods of word sense disambiguation. The research sample consisted of 442 scientific articles of two groups ie, experimental group and the control group. The control group had 221 full-text articles without tags and the experimental group included the same number articles, but manually tagged and placed in the proposed retrieval system to measure the effectiveness of tags in disambiguating specialized homographs and decreasing false drop.
Findings: While retrieval in the control group was with false drops due to the semantic ambiguity of specialized homographs, tagging specialized homographs in the full text of articles in the experimental group had a direct effect on decreasing false drop. The level of significance of the Wilcoxon signed-rank test (P = 0.0001, Z = -5.909) showed that the rate of false drop of retrieval results after using the tagged specialized corpus in the information retrieval system was significantly different. Assessment of negative and positive rankings showed that the rate of false drop of the results after using the tagged specialized text corpus decreased significantly and reached its minimum level of 0.
Conclusion: The rate of false drop in the research findings is an evidence of acceptable tagging effectiveness in Sense Disambiguation of specialized homographs and its effective role in optimizing the information retrieval system to minimize false drop of the results.  Accordingly, the corpus-based approach of the information retrieval system, while providing an opportunity for full-text retrieval could prevent false drop and save the user time and energy. Semantic tags are valuable for disambiguation of specialized homographs, but require high quality training data. Overall, the results show that well-structured training data can play a very important role to improve disambiguation. This research experimentally and analytically reveals that this approach, compared to keyword search, achieves a significantly better degree of false drop. The technique employed can be applied to the problem of information retrieval in all languages

کلیدواژه‌ها [English]

  • specialized homographs
  • Sense Tagging
  • false drop
  • text corpus
  • Sense Disambiguation
اکبری، اسماعیل، حسینی بهشتی، ملوک‌السادات و نوروزی‌اقبالی، مهرداد (1384). اص‍طلاح‌ن‍ام‍ه‌ علوم‌زیستی‌. ت‍ه‍ران‌: م‍رک‍ز اطلاع‍ات‌ و م‍دارک‌ ع‍ل‍م‍ی‌ ای‍ران‌.
انبایی‌فریمانی، سعیده، طباطبایی، حمید و کفاشان‌کاخکی، مجتبی (1398). جستاری بر فرایند سازمان‌دهی و بازیابی متون وبی مبتنی بر تجمیع مفاهیم معنایی در راستای سازمان‌دهی دانش. پژوهشنامه پردازش و مدیریت اطلاعات، ۳۴‌(۴)، ۱۸۷۹-۱۹۰۴.
بوث، باربارا و بلر، میشل (1382). اص‍طلاح‌ن‍ام‍ه‌ ج‍ام‍ع‍ه‌ش‍ن‍اس‍ی‌. ترجمه مهوش معترف. ت‍ه‍ران‌: م‍رک‍ز اطلاع‍ات‌ و م‍دارک‌ ع‍ل‍م‍ی‌ ای‍ران‌.
جعفری پاورسی، حمیده، حریری، نجلا، علیپورحافظی، مهدی، باب الحوائجی، فهیمه و خادمی، مریم (1399). ارتقای بازیابی معنایی اطلاعات با استفاده از برچسب‌گذاری و هستان‌شناسی. فصلنامه مطالعات کتابداری و سازماندهی اطلاعات، 31(1)، 18-38.
جلالی، وحید (1387). بازیابی معنایی اطلاعات با استفاده از بسط مفاهیم حاصل از جست‌وجوی مبتنی بر کلیدواژه. پایان‌نامه کارشناسی ارشد، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی امیرکبیر، تهران.
حریری، نجلا، باب‌الحوائجی، فهیمه، فرزندی‌پور، مهرداد و نادی راوندی، سمیه (1393). معیارهای ارزیابی ربط در نظام‌های بازیابی اطلاعات: دانسته‌ها و ندانسته‌ها. پردازش و مدیریت اطلاعات، 30(1)، 199-221.
حسینی‌بهشتی، ملوک‌السادات (1382). کاربرد اصطلاح‌شناسی و واژه‌گزینی در نمایه‌سازی ماشینی و بازیابی اطلاعات. کتابداری و اطلاع‌رسانی، 18(3)، 31-44.
حسینی بهشتی، ملوک‌السادات؛ وفایی، سعیده و نوروزی ‌اقبالی، مهرداد (1393). اصطلاح‌نامه ریاضیات. ت‍ه‍ران‌: م‍رک‍ز اطلاع‍ات‌ و م‍دارک‌ ع‍ل‍م‍ی‌ ای‍ران.
خیرمند پاریزی، منیر و نورمندی‌پور، رضا (1395). رفع ابهام معنایی کلمات فارسی با استفاده از رویکرد نظارت‌شده الگوریتم‌های IBL‌. علوم رایانشی، 1(2)، 63-73.
دلیخون، لیلا (1395). بررسی راه‌های گسترش پرسش کاربران در موتورهای جست‌وجو و پایگاه داده‌های تخصصی: مطالعه موردی دانشجویان کارشناسی ارشد فنی و مهندسی دانشگاه الزهرا (س). پایان‌نامه کارشناسی ارشد. دانشکده علوم تربیتی و روانشناسی. دانشگاه الزهرا.
ذوالفقار کندری، زهره‌، میانگاه، طیبه، روشن، بلقیس و وکیلی‌فرد، امیررضا (1399). بررسی تکنیک‌های بهبود عملکرد روش‌های بسامدشماری پیکره‌بنیاد در استخراج خودکار واژگان (مورد مطالعه: واژگان پایه علوم پزشکی). پژوهشنامه پردازش و مدیریت اطلاعات. ۳۵(۴)، ۱۰۳۹-۱۰۶۴.
رجبی، تقی، غریبی، حسین، حسینی ‌بهشتی،‌ ملوک‌السادات و نوروزی ‌اقبالی، مهرداد (۱۳۸۳) . اص‍طلاح‌ن‍ام‍ه‌ ش‍ی‍م‍ی‌. ت‍ه‍ران‌: م‍رک‍ز اطلاع‍ات‌ و م‍دارک‌ ع‍ل‍م‍ی‌ ای‍ران‌.
زرداری، سولماز (1395). مهندسی هستی‌‏نگاری علم اطلاعات و دانش‌شناسی بر اساس دائرۃ‌المعارف کتابداری و اطلاع‌رسانی. رساله دکتری، دانشکده علوم تربیتی و روانشناسی، دانشگاه شهید چمران اهواز.
ستوده، هاجر و هنرجویان، زهره (1391). مروری بر دشواری‌های زبان فارسی در محیط دیجیتال و تأثیرات آنها بر اثربخشی پردازش خودکار متن و بازیابی اطلاعات.  کتابداری و اطلاع‌رسانی، 15(4)، 59-92.
ستوده، هاجر و هوشیار، مژگان (1397). بررسی نقش انواع بافتار هم نویسه‌ها در تعیین شباهت بین مدارک. پژوهشنامه پردازش و مدیریت اطلاعات، 33(3)، 1183-1206.
سلطانی، محمود و فیلی، هشام (1387). استفاده از تکنیک ابهام‌زدایی معنایی واژگان در بازیابی بین زبانی اطلاعات. چهاردهمین کنفرانس ملی سالانه انجمن کامپیوتر ایران، انجمن کامپیوتر ایران. تهران، دانشگاه صنعتی امیرکبیر.
شاپوری، سودابه (1379). مشکلات جست‌وجوی موضوعی استفاده‌کنندگان از فهرست رایانه‌ای کتابخانه مرکزی دانشگاه فردوسی مشهد. کتابداری و اطلاع­رسانی، 3(2)، 49-68.
شهبازی، مهری و شاهینی، شبنم (1394). بررسی میزان کارآیی پایگاه‏های اطلاعاتی مگ ایران، نورمگز و اس.آی.دی. در بازیابی و ربط مباحث علم اطلاعات و دانش‏شناسی با استفاده از کلیدواژه‏های آزاد و مقایسه آنها از نظر میزان استفاده از کلیدواژه‏های مهارشده. پژوهشنامه پردازش و مدیریت اطلاعات. ۳۱(۲)، ۴۳۱-۴۵۴.
صدقی، فاطمه (1392). رفع ابهام از هم‌نویسه‌ها در متون فارسی با روش‌های نیمه نظارتی. پایان‌نامه کارشناسی ارشد. گروه مهندسی کامپیوتر ـ هوش مصنوعی. دانشکده فنی ـ مهندسی. دانشگاه الزهرا.
صدیقی، مهری، حسینی‌بهشتی، ملوک‌السادات و نوروزی‌اقبالی، مهرداد (1384). اصطلاح‌نامه علوم زمین. ت‍ه‍ران‌: م‍رک‍ز اطلاع‍ات‌ و م‍دارک‌ ع‍ل‍م‍ی‌ ای‍ران‌.
عبدالهی‌ نورعلی، محمدصادق (1386). کندوکاو مسائل ریختشناسی زبان فارسی در بازیابی اطلاعات از جست‌وجوگرهای وب. پایان‌نامة کارشناسی ارشد، گروه علم اطلاعات و دانش‌شناسی. دانشکدة علوم تربیتی و روان‌شناسی. دانشگاه شیراز
عبدالهی‌نورعلی، محمدصادق و جوکار، عبدالرسول (1388). چالش‌های شیوة نگارش زبان فارسی در بازیابی اطلاعات از موتورهای کاوش وب. مطالعات تربیتی و روانشناسی دانشگاه فردوسی مشهد. 10‌(2)، 67-90.
عرب، میثم (1394). استفاده از روابط پنهان بین کلمات در رفع ابهام معنایی کلمات. پایان­نامه کارشناسی ارشد. گروه مهندسی کامپیوتر. واحد بین­الملل دانشکده فنی ـ مهندسی. دانشگاه شیراز.
علی‌پوری حافظی، حامد، مولودی، امیرسعید و بیات، محمدکریم (1398). رفع ابهام معنایی از واژگان هم‌آوا هم‌نویسه فارسی: رویکرد پیکره‌بنیاد. دومین کنفرانس بازیابی تعاملی اطلاعات، تهران.
قیومی، مسعود (1398). تعیین خودکار معنای واژه‌های فارسی با استفاده از تعبیه معنایی واژه. پژوهشنامه پردازش و مدیریت اطلاعات، 35(1)، 25-50.
گل‌تاجی، مرضیه و بذرگر، سعیده (1389). بررسی مشکلات ریخت‌شناسی زبان فارسی در سه پایگاه اطلاعاتی مرکز منطقه‌ای اطلاع‌رسانی علوم و فناوری، پژوهشگاه اطلاعات و مدارک علمی ایران و جهاد دانشگاهی. کتابداری و اطلاع‌رسانی، ۱۳(2)، 191-214.
مدرس خیابانی، شهرام (1391). بررسی پیکره‌بنیاد واژه‌های هم‌معنی. پاژند، ۳۰(8)، 85-105.
میرجود، سیدحسین، قیاسی، میترا، دلیری، سعی، کوچکی‌نژاد، لیلا و عباسیان جوشقانی، آمنه (1394). مقایسه دقت موتورهای جست‌وجوی عمومی و تخصصی در بازیابی تصاویر پزشکی. توسعۀ آموزش جندی شاپور، 6(2)، 131-138.
نوروزی، یعقوب و هماوندی، هدی (1394). بررسی مشکلات جست‌وجو و بازیابی تصاویر در موتورهای کاوش برگزیده مبتنی بر ویژگی‌های نگارشی زبان فارسی. کتابداری و اطلاع‌رسانی،  5(2)، 206-222.
نوروزی اقبالی، مریم، حسینی بهشتی، ملوک‌السادات و نوروزی اقبالی، مهرداد (1385). اصطلاح‌نامه فیزیک. ت‍ه‍ران‌: م‍رک‍ز اطلاع‍ات‌ و م‍دارک‌ ع‍ل‍م‍ی‌ ای‍ران‌.
یوسفی، احمد (1376). ریزش کاذب در ذخیره و بازیابی اطلاعات. پژوهشنامه پردازش و مدیریت اطلاعات، ۱۳(۱)، ۱۰-۱۹.
یوسفی‌راد، ابراهیم (1388). آر. دی. اف: الگویی برای توصیف منابع در وب معنایی. فصلنامه کتاب، ۲۰(۳)، 9-22.
References
Abdollahi NorAli, M. S. (2007). Survey on morphological difficulties of Persian language in information retrieval from web search tools. M.S thesis, Library and Information science. Faculty of Education and Psychology, Shiraz University. Doi: 10.22067/FE.V10I2.2112. [In Persian].
Abdollahi NorAli, M. S. & Jokar, A. (2009). Survey on morphological difficulties of Persian Language in Information retrieval from Web Search Engines. Educational and Psychological Studies. 10(2), 67-90 [In Persian].
Akbari, E.,  Hosseini Beheshti, Moluksadat &  Noroozi Eghbali, Mehrdad (2005). Thesaurus of Biological Science. Tehran, Iranian Research Institute for Information Science and Technology [In Persian].
Alexopoulou, D. (2009). Biomedical word sense disambiguation with ontologies and metadata: automation meets accuracy. Automation meets accuracy. BMC Bioinformatics10(1), 28. https://doi.org/10.1186/1471-2105-10-28
Alipouri Hafezi, H., Moloudi, A. & Bayat, M.K. (2019). Sense disambiguation of the Persian homographs: The corpus-based Approach. Interactive Information Retrieval Conference, Tehran. [In Persian]  
Anbaee Farimani, S., Tabatabaee, H. & Kaffashan Kakhki, M. (2019). An Investigation into the Process of Organizing and Retrieving Web Texts based on the Integration of Semantic Concept in order to Organize Knowledge. Iranian Journal of Information Processing & Management; 34 (4), 1879-1904. [In Persian].
Arab, M. (2016). Using hidden relations between words in word sense disambiguation. M.S thesis, Computer engineering, Artificial intelligence. Shiraz University. [In Persian]  
Atkins, S., Clear, J., & Ostler, N. (1992). Corpus Design Criteria. Literary and Linguistic Computing, 7(1), 1-16. Doi: 10.1093/llc/7.1.1
Booth, B. & Blair, M. (1992). Thesaurus of sociological indexing terms. Tehran, Iranian Research Institute for Information Science and Technology. [In Persian]  
Bowker, L (2018). Corpus linguistics is not just for linguists: Considering the potential of computer-based corpus methods for library and information science research. Library Hi Tech, 36(2), 358-371. https://doi.org/10.1108/LHT-12-2017-0271
Delikhoun, L. (2016). A Survey of Query Expansion (QE) of Users in Search Engines and Specialized Databases: A Case Study of Engineering Graduate Student at Alzahra University. Thesis for Master, Knowledge and Information Science. Faculty of Education and Psychology, Alzahra University. [In Persian]  
Ghayoomi, M. (2019). Identifying Persian Words’ Senses Automatically by Utilizing the Word Embedding Method. Iranian Journal of Information Processing & Management; 35(1), 25-50. [In Persian]  
Goltaji, M. & Bazregar, S. (2010). Investigating the morphological problems of Persian language in three databases of ISC, Irandoc & Jahad institute. Library and Information Sciences, 13(2), 191-214. [In Persian]  
Gorman, K., Mazovetskiy, G. & Nikolaev, V. (2018). Improving homograph disambiguation with supervised machine learning. LREC (11), 1349-1352.
Hariri, N., Babalhavaeji, F., Farzandipour, M.&  Nadi Ravandi, S. (2014). Evaluation Criteria of Information Retrieval Systems: What We Know and What We Do Not Know. Iranian Journal of Information Processing & Management; 30(1)، 199-221. [In Persian]  
Hasi, Y. Z., & Xiaoxiao, X. (2013). Research on the homonyms disambiguation based on Mongolian nouns semantic network. 6th International conference on intelligent networks and intelligent systems (ICINIS). Doi10.1109/ICINIS.2013.69
Hearst, M. A (1991). Noun homograph disambiguation using local context in large text corpora. Proceedings of the 7st Annual conference of the University of Waterloo Centre for the new OED and text research, Berkeley, 185-188.
Hoseini Beheshti, M. S. (2003). Application of terminology and word selection in machine indexing and information retrieval. Library and Information science, 18 (3), 31-44. [In Persian]  
Hoseini Beheshti, M. S., Vafaei, S. & Noroozi Eghbali, M. (2015). Thesaurus of mathematic. Tehran, Iranian Research Institute for Information Science and Technology. [In Persian]  
Jafari Pavarsi, H., Hariri, N., Alipour Hafezi, M., Babalhavaeji, F., & Khademi, M. (2020). Optimizing Semantic Information Retrieval by Labeling and Ontology. Journal of National Studies on Librarianship and Information Organization, 31(1), 18-38. Doi: 10.30484/NASTINFO.2019.2247.186. [In Persian]
Jalali, V. (2009). Semantic Information retrieval using result concepts of a keyword based query. Msc Thesis. Department of Computer Engineering and Information Technology, AmirKabir University of Technology. [In Persian]  
Jones, C. & Waller, D. (2015). Corpus linguistics for grammar. A guide for research. London, Routledge.
Karimpour, R., Ghorbani, A., Pishdad, A., Mohtarami, M., AleAhmad, A., Amiri, H., & Oroumchian, F. (2008). Using Part of Speech Tagging in Persian Information Retrieval. http://ceur-ws.org/Vol-1174/CLEF2008wn-adhoc-KarimpourEt2008.pdf
Kessler, W. (2012). Evaluation of Text Classification. Retrieved 20 March, 2020 from: http://www.ims.unistuttgart.de/institut/mitarbeiter/kesslewd/lehre/sentimentanalysis12s/ml_evaluation.pdf.
Khan, L., McLeod, D., & Hovy, E. (2004). Retrieval effectiveness of an ontology-based model for information selection. The VLDB Journal— The International Journal on Very Large Data Bases, 13(1), 71-85. Doi: 10.1007/s00778-003-0105-1
Kheirmand Parizi, M. & Nourmandipoor, R. (2016). Persian word sense disambiguation with using of supervised method (IBL algorithms). Computing Science Journal (CSJ), 1(2), 63-73. [In Persian]  
Lazarinis, F. (2007). Evaluating the searching capabilities of e‐commerce web sites in a non‐English language: A Greek case study, Online Information Review, 31)6(, 881-891. https://doi.org/10.1108/14684520710841829
Lewandowski, D. (2008). Problems with the use of Web search engines to find results in foreign languages. Online Information Review, 32(4), 668-672. Doi: 10.1108/14684520810914034
Modarres Khiabani, S. (2010). Corpus-based approach on synonyms. Pazhand, 30(8), 85-105. [In Persian]  
Mirjoud, S. Ho., Ghiasi, M., Daliri, S., Kouchakinezhad, L., & Abasian Joshaghani, A. (2015). Comparison of the accuracy of general search engines and specialized search engines in retrieve medical images. Educational Development of Jundishapur, 6(2), 131-138. [In Persian]  
Norouzi, Y. & Homavandi, H. (2015). Survey of Image Search and Retrieval Problems in
5(2), 206-222. [In Persian]
Noroozi Eghbali, M., Hoseini Beheshti, M. S & Noroozi Eghbali, M. (2007). Thesaurus of physics. Tehran, Iranian Research Institute for Information Science and Technology. [In Persian]
Prokofyev, R., Demartini, G., Boyarsky, A., Ruchayskiy, O., & Cudré-Mauroux, P. (2013). Ontology-based word sense disambiguation for scientific literature. Advances in information retrieval. 35th European conference on IR research, ECIR 2013. Berlin, Germany: Springer.594-605. Doi: 10.1007/978-3-642-36973-5_50
Rajabi, T., Gharibi, H.,  Hosseini Beheshti, M. & Noroozi Eghbali, M. (2004). Thesaurus of Chemistry. Tehran, Iranian Research Institute for Information Science and Technology. [In Persian]
Sanderson, M. (2010). Test Collection Based Evaluation of Information Retrieval Systems. Foundations and Trends in Information Retrieval. 4(4), 247-375. http://www.nowpublishers.com/articles/foundations-and-trends-in-informationretrieval/ INR-009 (accessed May 22, 2020). Doi: 10.1561/1500000009
Schutze, H. (2014). Introduction to Inforation Retrieval: Relevance Feedback and Quary Extention. http://www.cis.uni-muenchen.de/~hs/teach/13s/ir/pdf/09expand.pdf
Sedghi, F. (2013). Homograph Disambiguation in Persian Context with Semi-Supervised Methods. Msc Thesis. Faculty of computer engineering Alzahra University. [In Persian]
Sedighi, M., Hoseini Beheshti, M. S., & Noroozi Eghbali, M. (2004). Thesaurus of geosciences. Tehran, Iranian Research Institute for Information Science and Technology. [In Persian].
Shahbazi, M. & Shahini, S. (2016). Study of the the efficacy Magiran, Noormags and SID database in retrieval and relevance of Information Science and Knowledge subject by free keywords and Compare them in terms of the use of controlled keywords. Iranian Journal of Information Processing & Management, 31(2), 431-454. [In Persian]
Shapoori, S. (2000). Problems of subject search for users of the computer catalog of the Central Library of Ferdowsi University of Mashhad. Library and Information Science, 3(2), 49-68. [In Persian]
Soltani, M., & Faili. H. (2009). Using of word sense disambiguation technique in cross language Information retrieval. 14 th annual International CSI Computer Conference. Computer society of Iran, Tehran. AmirKabir University of Technology. [In Persian]
Sotoudeh, H. & Honarjooyan, Z. (2012). A review of the difficulties of the Persian language in the digital environment and their effects on the effectiveness of automatic text processing and information retrieval. Library and Information Science, 15(4), 59-92. [In Persian]
Sotoudeh, H. & Houshyar, M. (2018). The Role of Different Types of Homograph Contexts in Measuring Documents Similarities. Iranian Journal of Information Processing & Management, 33(3), 1195-1220. [In Persian]
Spink, A., Wolfram, D., Jansen, M. B., & Saracevic, T. (2001). Searching the Web: the public and their queries. Journal of the American Society for Information Science and Technology. 52)3(, 226-234. Doi:10.1002/1097-4571(2000)9999:9999<::AID-ASI1591>3.3.CO;2-I
Stefanowitsch, A. (2006). Corpus-based approaches to metaphor and metonymy. In Corpus-Based Approaches to Metaphor and Metonymy. Ed. By Anatol Stefanowitsch and Stefan Th. https://doi.org/10.1515/9783110199895
Tabatabaie Jafari, Z. (2011). A Survey to Query Expansion (QE) in Information Searching Behavior in Search Engines: A study of LIS graduate student Tehran states university. Thesis for Degree of Master of ART (MA), Library & Information science. Faculty of Humanities, The University of Qom. [In Persian]
Tesprasit, V., Charoenpornsawat, P., & Sornlertlamvanich, V (2003). A contextsensitive homograph disambiguation in Thai text-to-speech synthesis. Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology, Thailand. 2,103-105. Doi: 10.3115/1073483.1073518
Voorhees, E. M. (1998). Variations in Relevance Judgments and the Measurement of Retrieval Effectiveness. In C. J.Van rijs Bergen W. Bruce Croft,Alistair Moffat, Proceedings of the 21st Annual International ACM Sigir Conference on Research and Development in Information Retrieval, Pages315-323. Australia, University of Melbourne https://doi.org/10.1145/290941.291017
Yousefi, A. (1997). False drop in Information storage and retrieval. Iranian Research Institute for Information Science and Technology (IranDoc), 13(1), 10-19. [In Persian]
Yousefi Rad, E. (2009). R.D.F: A model for resource description in semantic web. National Studies on Librarianship and Information Organization, 20(3), 9-22. [In Persian]
Zardary, S. (2016). Ontology engineering of knowledge and information science based on Encyclopedia of Library and Information Science. Ph.D. degree, Knowledge and Information Science Department. Faculty of Education and Psychology, Shahid Chamran University of Ahwaz. [In Persian]
Zhang, J. & Lin, S. (2007). Multiple language supports in search engines, Online Information Review, 31)4(, 516-532. Doi:10.1108/14684520710780458
Zolfaghar, Z., Mosavi Miangah, T., Rovshan, B. & Vakilifard, A. R. (2020). A Study on the Improved Techniques of Corpus-based Frequency Approaches in Automatic Term Extraction (ATE) (The Case Study: Basic Medicine Vocabulary). Iranian Research Institute for Information Science and Technology (IranDoc), 35(4), 1039-1064. [In Persian]
CAPTCHA Image