هستان‌نگاری فراداده‌ای پایان‌نامه‌ها: طراحی یک الگو

نوع مقاله : مقاله پژوهشی

نویسنده

استادیار سازمان اسناد و کتابخانه ملی ایران

10.30484/nastinfo.2024.3498.2247

چکیده

هدف: طراحی الگوی هستان‌نگاری فراداده‌ای پایان‌نامه‌ها با استفاده از SPAR (مجموعه هستان‌نگاری‌های طراحی شده به‌منظور انتشار و ارجاع‌دهی معنایی) برای بازنمون معنایی آنها بوده است.

روش‌شناسی: پژوهش از نوع کاربردی است و در آن از دو روش تحلیل محتوا و انطباق و ابزار پژوهش مشاهده و سیاهۀ وارسی، استفاده شده‌ است. جامعه پژوهش تعداد 69 پایان‌نامه‌ و رساله‌ با موضوع سازمان اسناد و کتابخانه ملی ایران، در سه پایگاه (سامانه منابع دیجیتال، نرم‌افزار رسا و پایگاه اطلاعات علمی ایران (گنج))، هستند و فراداده‌های آنها از طریق انطباق با یکدیگر، اصلاح و تکمیل شدند. از سوی دیگر، با تحلیل موجودیت‌های هر یک از هستان‌نگاری‌های SPAR، و افزودن موجودیت‌های دیگر توسط پژوهشگر، سیاهۀ نهایی به تفکیک کلاس‌ها، روابط (ویژگی‌ها) و اعضا (نمونه‌ها) تشکیل و با ورود آنها به نرم‌افزار Protégé نسخه 5.5، الگوی هستان‌نگاری فراداده‌ای آنها، MdOntTDs ترسیم شد.

یافته‌ها: بررسی‌ها، کاستی‌هایی را در وجود چهار عنصر مهمِ فراداده‌ای (موضوع، راهنما، مشاور و چکیده) در رسا و کتابخانه دیجیتال مشخص کرد. در میان 18 هستان‌نگاری SPAR بیشترین موجودیت به‌ترتیب از FaBiO ، FRAPO و CiTO انتخاب شد. همه موجودیت‌های BiDO، BiRO، C4O، Fivestar، FR، FRBR، PO، PRO، PSO و PWO برای پایان‌نامه‌ها مناسب تشخیص داده شد. 195 عضو از 6 هستان‌نگاری SPAR، 292 عضو با برچسب MdTDs از اطلاعات پایان‌نامه‌ها و ۱۰۰ عضو با برچسب SUNMdTDs توسط پژوهشگر انتخاب و وارد نرم‌افزار شد. سیاهه‌ نهایی شامل 1558 موجودیت شد که به تفکیک کلاس، روابط (شئ، داده و توضیحی) و نمونه یا عضو به همراه توصیف و تعریف هر یک از موجودیت‌ها به بخش‌های مربوط در نرم‌افزار انتخابی با در نظر داشتن روابط سلسله مراتبی و تعیین قیود برای کلاس‌ها و تعیین دامنه (domain) و بُرد (range) برای روابط یا ویژگی‌ها وارد شد. در نهایت گراف RDF با استفاده از پلاگین‌ گرافیکی OntoGraf ترسیم و الگوی نهایی MdOntTDs تدوین شد.

سه نوع فراداده جدید پیشنهاد شذ: 1) موضوع: علاوه بر کلیدواژه‌های پایان‌نامه‌ها، موضوعات آنها تا سه سطح دسته‌بندی و براساس رابطه hasSubject و isSubjectOf به پایان‌نامه‌ها متصل شد. 2) روش پژوهش، با خواندن چکیده و گاه متن هر پایان‌نامه استخراج شد و با استفاده از رابطه‌های hasMethod و usedIn به پایان‌نامه مربوط پیوند خورد. 3) مقاله‌های برگرفته از پایان‌نامه‌ها نیز تا جای ممکن جستجو و با رابطۀ hasJournalArticle و journalArticleOf به پایان‌نامه وصل شد.

نتیجه‌گیری: الگوی حاصل در صورت پیاده‌سازی، می‌تواند بر موانع بازیابی مانند محدودیت جستجوی کلیدواژه‌ای، مشکل پیوند و اشتراک داده‌ها در وب و نایکدستی داده‌ها فائق آید. در نرم‌افزار این پژوهش ارتباطات هر کلاس و نمونه‌های مربوط به آن به‌صورت شبکه‌ای سلسله مراتبی در قالب سه‌گانه‌های RDF به وضوح قابل رؤیت است و ارتباط میان موجودیت‌ها با افزایش نقاط دسترسی، جستجوهای معنایی عمیق‌تری را نوید می‌دهد. با تمام اینها در حال حاضر به‌سبب نبود یا کمبود اطلاعات برچسبی و پیوندی، استفادۀ بخشی از موجودیت‌های انتخاب شده در این مقاله مقدور نیست.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Metadata Ontology of Theses and Dissertations: Designing a Model

نویسنده [English]

  • S. Nozari
Assistant Professor of the National Library and Archives and Library of Iran
چکیده [English]

Purpose: Designing metadata ontology model for semantic representation of Theses and Dissertations by using the SPAR (Semantic Publishing and Referencing) Ontologies.

Methods: This study was an applied form and two methods was used, Content Analysis and mapping. The metadata of 69 theses and dissertations on National library and Archive of Iran in three Databases: 1) Digital Library of National library and Archive of Iran. 2) Rasa Software and 3) Ganj in Irannian Research Institue for Information Science and Technology were selected and modified and completed by mapping. On the other hand, by analyzing the entities of each SPAR Ontologies and suggesting another entities by researcher, the checklist was formed. This checklist included classes, properties and individuals. At last by entering them into Protégé software version 5.5, the model of metadata ontology, MdOntTDs, was drawn.

Findings: Findings: Findings identified deficiencies in the existence of four important metadata elements (subject, supervisor, advisor and abstract) in RASA and NLAI Digital Library. Among the 18 SPAR Ontologies, the most entities were selected from FaBiO, FRAPO and CiTO respectively. All entities of BiDO, BiRO, C4O, Fivestar, FR, FRBR, PO, PRO, PSO, and PWO were suitable for theses. 195 individuals from 6 SPAR Ontologies, 292 individuals labeled with MdTDs from theses and 100 individuals labeled with SUNMdTDs were selected by the researcher and entered into the software. 1558 entities categorized by class, Properties (object, data and Annotation) and individuals along with the description and definition of each entity were placed in the software, in the form of hierarchical and determining axioms for classes. and specifying domain and range for relationships. Finally, the RDF graph was drawn using the OntoGraf plugin and the final Model, MdOntTDs was developed.

in this research has proposed three new types of metadata: 1) Except for the existing keywords, topics have been categorized and modeled up to three level including 4 main categories, 16 subcategories and many units. Each of these final topics has been related with “hasSubject” and “isSubjectOf“ properties. 2) The research methods of Theses that were connected with “hasMethod” and “usedIn” properties. 3) The papers taken from Theses were also searched, as far as possible, and were connected with “hasJournalArticle” and “journalArticleOf” properties.

Conclusion: This model, if implemented, can overcome keyword search limitations, the problem of linking and Data sharing in the web, and the inconsistency of data. In the software, classes and its related individuals are clearly visible in the form of a hierarchical network in RDF triples, and the connection between entities with increasing of access points promise deeper semantic searches. However, due to the absence or lack of tagged and linked data, usage of the some of selected entities, are not possible.

Keywords: SPAR Ontologies; Metadata Ontologies; Semantic Publishing; Thesis; Dissertations; National Library and Archives of Iran; Ganj; Digital Library; Rasa Software.

کلیدواژه‌ها [English]

  • SPAR Ontologies
  • Semantic Publishing
  • Thesis
  • National Library and Archives of Iran
  • Ganj
  • Digital Library
  • Rasa Software
CAPTCHA Image

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از تاریخ 09 اسفند 1402
  • تاریخ دریافت: 16 مهر 1402
  • تاریخ بازنگری: 20 دی 1402
  • تاریخ پذیرش: 09 اسفند 1402