ارتقای بازیابی معنایی اطلاعات با استفاده از برچسب‌گذاری و هستان‌شناسی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکترای علم اطلاعات و دانش‌شناسی‌‌‌‌؛ دانشگاه آزاد اسلامی؛ واحد علوم و تحقیقات؛ تهران، ایران‌‌‌‌

2 دکترای علم اطلاعات و دانش‌شناسی؛ استاد؛ دانشگاه آزاد اسلامی؛ واحد علوم و تحقیقات؛ تهران‌‌‌‌، ایران

3 دکترای علم اطلاعات و دانش‌شناسی؛ استادیار؛ دانشگاه علامه طباطبائی؛ تهران، ایران

4 دکترای علم اطلاعات و دانش‌شناسی‌‌‌‌؛ دانشیار؛ دانشگاه آزاد اسلامی؛ واحد علوم و تحقیقات؛ تهران، ایران

5 دکترای ریاضی کاربردی؛ دانشیار؛ دانشگاه آزاد اسلامی؛ واحد تهران جنوب؛ تهران، ایران

چکیده

هدف: بهینه‌سازی بازیابی معنایی اطلاعات با استفاده از روش‌های برچسب‌گذاری و هستان‌شناسی.
روش‌شناسی: این پژوهش کاربردی با رویکرد تحلیل ‌محتوا انجام شده است. ۳۱۳مقاله فارسی در موضوع بازیابی اطلاعات در یک پایگاه اطلاعاتی با قابلیت‌های جستجوی موضوعی برای دو گروه پیش‌آزمون و پس‌آزمون گردآوری شد. پس از برچسب‌گذاری ۵۷۰۰واژه به‌کمک نرم‌افزار پردازش زبان طبیعی دانشگاه فردوسی مشهد، هستان‌شناسی مفاهیم و روابط معنایی آنها در محیط پروتژ طراحی و پیاده‌سازی شد. دقت نتایج بازیابی‌شده در دو مرحله پیش و پس‌آزمون سنجیده شد.
یافته‌ها:سطح معنا‌داری آزمون Z‌‌‌‌، به‌لحاظ آماری و اطمینان ۰/۹۹‌‌‌‌، تفاوت معنا‌داری را میان میزان دقت نتایج مرتبط بازیابی‌شده در دو گروه پیش‌آزمون و پس‌آزمون نشان داد. بنابراین، این ابزارها کارایی پذیرفتنی دارند.
نتیجه‌گیری: دو روش پردازش زبان طبیعی و هستان‌شناسی به ارتقای بازیابی معنایی اطلاعات منجر می‌شود.

کلیدواژه‌ها


عنوان مقاله [English]

Optimizing Semantic Information Retrieval by Labeling and Ontology

نویسندگان [English]

  • H. Jafari Pavarsi 1
  • N. Hariri 2
  • M. Alipour Hafezi 3
  • F. Babalhavaeji 4
  • M. Khademi 5
1 PhD Candidate, Knowledge and Information Science; Science and Research Branch; Islamic Azad University; Tehran, Iran
2 PhD in Knowledge and Information Science; Professor; Department of Science and Research Branch; Islamic Azad University; Tehran, Iran
3 PhD in Knowledge and Information Science; Assistant Professor; Department of Knowledge and Information Science; Allameh Tabataba'i University; Tehran, Iran
4 PhD in Knowledge and Information Science; Associate Professor; Science and Research Branch; Islamic Azad University; Tehran, Iran
5 PhD in Applied Mathematics; Associate Professor, Department of Tehran-South Branch; Islamic Azad University; Tehran, Iran
چکیده [English]

Purpose: To optimize the semantic information retrieval by labeling and ontology methods.
Methodology: This applied research has been done with the approach of content analysis. 313 Persian articles on the subject of information retrieval were collected in a database with subject search capabilities for both pre-test and post-test groups. After labeling 5700 words with the help of Ferdowsi University of Mashhad's software for natural language processing software, the ontology of concepts and their semantic relations were designed and implemented in protégé software. The accuracy of the retrieved results was measured in two stages before and after the test.
Findings: The significance level of Z test, in terms of statistical and reliability of 0.99, showed a significant difference between the accuracy of the retrieved related results in the two groups of pre-test and post-test. Therefore, these tools are acceptable.
Conclusion: Tow methods of natural language processing and ontology optimize semantic information retrieval.

کلیدواژه‌ها [English]

  • Semantic information retrieval
  • Labeling
  • Natural language processing
  • Protégé
  • Ontology

آزمایشگاه سیستم‌های پردازش هوشمند رایانه‌ای (سپهر) دانشگاه تبریز (1397). راهنمای نصب‌‌‌‌، راه‌اندازی و استفاده برنامه نرم‌افزار جامع پردازش متن دانشگاه تبریز. ویرایش 3. بازیابی 7 آذر 1398، از http://ece.tabrizu.ac.ir/

اخوتی‌‌‌‌، مریم؛ رحیمی‌‌‌‌، مژگان؛ و ذوالعلی‌‌‌‌، فرزانه (1393). بررسی تأثیر عوامل زمینه‌ای بر فرایند رفتار اطلاع‌جویی دانشجویان کارشناسی ارشد دانشگاه علوم پزشکی کرمان در وب. پردازش و مدیریت اطلاعات. 30 (2)، 419-445.

الهی‌منش‌‌‌‌، محمدحسین؛ مینایی‌‌‌‌، بهروز (1390). برچسب‌گذاری ادات سخن متون فارسی به‌کمک مدل مخفی مارکوف. رهآوردنور، 10 (34). 102-106.

باقربیگی‌‌‌‌، سمیه؛ شمس‌فرد‌‌‌‌، مهرنوش (1390). روشی نوین در ساخت نیمه‌خودکار شبکه‌ی واژگانی افعال فارسی. ‌نامه فرهنگستان، 12 (1)، 108-161.

حریری‌‌‌‌، نجلا (1377). مفهوم «ربط» در بازیابی از نظام‌های اطلاعاتی. فصلنامه کتاب، 9 (2)، 7-17.

خوشحال‌‌‌‌، مصطفی (1393). ارائه یک سیستم برچسب‌گذاری خودکار اجزای واژگانی کلام برای متون فارسی. پایان‌نامه کارشناسی ارشد، دانشگاه شیراز، شیراز.

خون‌سیاوش‌‌‌‌، احسان (1389). ارائه یک روش نمایه‌سازی معنایی برپایه هستی‌شناسی برای نمایه‌سازی متون و اسناد علمی. پایان‌نامه کارشناسی ارشد، دانشگاه اصفهان، اصفهان.
دانشگاه علم‌ و ‌صنعت ایران. (1388). مطالعه و بررسی ابزارهای برچسب‌دهی خودکار به‌منظور به‌کارگیری در پیکره متنی زبان فارسی. دبیرخانه شورای عالی اطلاع‌رسانی. بازیابی 21 اردیبهشت 1398، از https://www.prosody.ir/%D9%85%D9%82%D8%A7%D9%84%D9%87-%D9%87%D8%A7
زاهدی‌‌‌‌، راضیه؛ امین‌‌‌‌، غلامرضا؛ کریمی‌‌‌‌، مهرداد؛ و علی‌بیک‌‌‌‌، محمدرضا (1392). روش‌شناسی ایجاد هستی‌شناسی مبتنی بر نظام زبان واحد پزشکی؛ مطالعه موردی: هستی‌شناسی گیاهان دارویی ایران. کتابداری‌‌‌‌ و اطلاع‌‌رسانی، 16 (3)، 81-100.
زرداری‌‌‌‌، سولماز (1395). مهندسی هستی‌نگاری علم اطلاعات و دانش‌شناسی براساس «دائره‌المعارف کتابداری و اطلاع‌رسانی». پایان‌نامه کارشناسی ارشد، دانشگاه شهید چمران، اهواز.

شهابی‌‌‌‌، امیرشهاب؛ صراف‌زاده‌‌‌‌، امیرحسین (1380). ترجمه ماشینی زبان فارسی:راهکارها و موانع. تازه‌های علوم شناختی، 3 (1 و 2)، 9-14.

صنعت‌جو‌‌‌‌، اعظم؛ فتحیان‌‌‌‌، اکرم (1390). مقایسه کارآمدی اصطلاحنامه و هستی‌شناسی در بازنمون دانش (طراحی و ساخت نمونه هستی‌شناسی اصفا). پژوهشنامه کتابداری و اطلاع‌رسانی، 1 (1)، 219-240.
فرج‌پهلو‌‌‌‌، عبدالحسین؛ شهبازی‌‌‌‌، مهری (1381). عوامل مؤثر در استفاده از پایگاه‌های اطلاعاتی: بررسی نگرش‌ها و عملکرد دانشجویان دوره تحصیلات تکمیلی. فصلنامه کتاب، 13 (4). 54-71.
فیضی‌درخشی‌‌‌‌، محمدرضا؛ فیروزی‌‌‌‌، فرهنگ؛ و رحیمی‌‌‌‌، مهدی (1393، 28 و 29 آبان). مقایسه کارهای انجام‌شده برای برچسب‌گذاری ادات سخن زبان فارسی. مقاله ارائه‌شده در سومین همایش ملی زبان‌شناسی رایانشی، تهران. بازیابی 7 آذر 1398، از
https://www.researchgate.net/publication/269107861_mqaysh_karhay_anjam_shdh_bray_brchsb_gdhary_adat_skhn_zban_farsy
کفاشان‌‌‌‌، مجتبی؛ فتاحی‌‌‌‌، رحمت‌الله (1390). نظامهای نوین سازماندهی دانش: وب معنایی‌‌‌‌، هستی‌شناسی و ابزارهای سازماندهی دانش عینی. کتابداری و اطلاع‌رسانی. 14 (2)، 45-70.

محسنی‌‌‌‌، مهدی؛ مینایی‌بیدگلی‌‌‌‌، بهروز (1386). مدل مارکوف مرتبه دو برای برچسب‌گذاری پیکره زبان فارسی. مجموعه مقالات دانشگاه علامه طباطبایی، 220، 591-603.

محسنی‌‌‌‌، مهدی؛ مینایی‌بیدگلی‌‌‌‌، بهروز (1388). سیستم برچسب‌گذاری اجزای واژگانی کلام در زبان فارسی. پردازش علائم و داده‌ها، 6 (2)، بازیابی 16 فروردین 1398، از https://www.magiran.com/paper/878748

نعمتی‌شمس‌آباد‌‌‌‌، حسنعلی (1390). متن‌کاوی و وب‌کاوی. بازیابی 7 آذر 1398، از

http://www.farabar.net/wp-content/uploads/2016/12/@Farabar_BI-Text-Web-Mining.pdf

نیشابوری‌‌‌‌، مرتضی (1389). ارائه یک روش کارا در پردازش زبان‌های طبیعی برای ساخت وارسی کننده‌های دستوری و نگارشی در زبان فارسی. پایان‌نامه کارشناسی ارشد، دانشگاه آزاد اسلامی، واحد علوم و تحقیقات، تهران.

ولی‌نژادی‌‌‌‌، علی؛ آزاده‌‌‌‌، فریدون؛ حری‌‌‌‌، عباس؛ شمس‌اردکانی‌‌‌‌، محمدرضا؛ و امیرحسینی‌‌‌‌، مازیار ((1387). طرح ادغام سرشاخه خوشه طب سنتی ایران در ساختار ابراصطلاحنامه «نظام زبان واحد پزشکی (UMLS)». پیاورد سلامت، 2 (3)، 67-74.

یادگاری‌‌‌‌، الهام (1396). روشی جدید برای خلاصه‌سازی تک سند فارسی با استفاده از پردازش زبان طبیعی. پایان‌نامه کارشناسی ارشد، مؤسسه آموزش عالی صفاهان‌‌‌‌، اصفهان.

Beirade, F., Azzoune, H., & Eddine Zegour, D. (2019). Semantic query for Quranic ontology. Journal of King Saud University - Computer and Information Sciences. Retrieved May 28, 2019, from https://doi.org/10.1016/j.jksuci.2019.04.005
Lou, W., & Qiu, J. (2014). Semantic information retrieval research based on co-occurrence analysis. Online Information Review, 38 (1), 4-23.
Macgregor, G., & McCulloch, E. (2006). Collaborative tagging as a knowledge organization and resource discovery tool. Library Review, 55 (5), 291-300.
Selamat, A., & Ng, C.-C. (2008). Arabic script language identification using letter frequency neural networks. International Journal of Web Information Systems, 4 (4), 484 -500.
Zhang, F., Fleyeh, Hasan,, Wang, Xinru, Lu, Minghui (2019). Construction site accident analysis using text mining and natural language processing techniques. Automation in Construction, 99, 238–248. Retrieved March 24, 2019, from https://doi.org/10.1016/j.autcon.2018.12.016
CAPTCHA Image