کاربرد داده‌کاوی در سامانۀ توصیه‌گر کتابخانه‌های دیجیتال بر اساس قوانین انجمنی (مطالعۀ موردی: کتابخانۀ دیجیتال آستان قدس رضوی)

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری، علم اطلاعات و دانش شناسی، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران

2 دانشیار، علم اطلاعات و دانش شناسی، گروه علوم ارتباطات و دانش‌شناسی، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران

3 دانشیار، مهندسی کامپیوتر، گروه مهندسی کامپیوتر و فناوری اطلاعات، واحد دانشگاه آزاد اسلامی مشهد، مشهد، ایران

4 استاد، علم اطلاعات و دانش شناسی، گروه علوم ارتباطات و دانش‌شناسی، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران

5 دانشیار، ریاضی کاربردی، گروه ریاضی، واحد تهران جنوب، دانشگاه آزاد اسلامی، تهران، ایران

10.30484/nastinfo.2024.3496.2246

چکیده

هدف: هدف این مطالعه، تحلیل و بررسی کاربرد فن داده‌کاوی در سامانۀ توصیه‌گر (پیشنهاددهنده) کتابخانه‌های دیجیتالی و مراکز اطلاعاتی بود. رویکرد داده‌کاوی در این سامانه، از طریق تحلیل الگوهای رفتاری کاربران کتابخانه‌های دیجیتال و ارائۀ پیشنهادهای دقیق، آنان را از مرور داده‌های غیر مرتبط در حین جستجو بی‍نیاز می‌سازد که منجر به افزایش درخواست‌های اطلاعاتی کاربران و جلب و جذب رضایتمندی آنان از ارائۀ خدمات کتابخانه‌های دیجیتالی می‍شود.
روش: پژوهش حاضر یک مطالعۀ تحلیلی از نوع پیمایشی مقطعی و تحلیل محتوا بود. در این روش طی چهار مرحله، داده‌های موردنیاز، جمع‌آوری و خروجی آن با استفاده از فن داده‌کاوی مورد تجزیه وتحلیل قرار گرفت. در مرحلۀ اول، با تحلیل محتوا، سیا‌هه‌ای از تعداد تراکنش درخواست‌های کاربران از کتاب، شامل شناسۀ کاربران، عناوین نسخ، شمارۀ کد شناسایی نسخ در سامانۀ کتابخانۀ دیجیتال (پایگاه نسخ خطی)، سازمان کتابخانه‌ها، موزه‌ها و مرکز اسناد آستان قدس رضوی مورد بررسی قرار گرفت و داده‌ها به‌صورت ستون کاربر و سطر آیتم (کتاب) مرتب شد. مرحلۀ دوم، داده‌های خام پیش‌پردازش شده به ماتریس کاربر-آیتم که همان صفر و یک است، تبدیل شد. مرحلۀ سوم، خروجی داده‌ها با کمک فناوری داده‌کاوی و اجرای کاوش قوانین انجمنی و الگوریتم FP-Growth بر روی نرم‌افزار رپیدماینر پیاده‌سازی و اجرا شد. خروجی به‌دست‌آمده، در این نرم‌افزار با تغییر درجۀ پارامترهای پشتیبان (میزان پشتیبانی از تکرار شدن منابع درخواستی) و اطمینان (میزان اعتماد به نتیجۀ موردنظر) مورد آزمون قرار گرفت. مرحلۀ چهارم، صحت و درستی طرح پیشنهادی سامانه ارائه شد.
یافته‌ها: برونداد این پژوهش نشان داد که قواعد انجمنی با درجۀ اطمینان بالای 50% بوده و قادر به تعیین الگوهای دسترسی کاربر است که بهترین حالت دسترسی به مجموعۀ داده‍های تولیدشده با تنظیم درجۀ حداقل پشتیبانی 2% و حداقل اطمینان 95% است که منجر به ایجاد 1081 قوانین جدید با الگوریتم‌های شرطی (اگر – آنگاه) شد. چنانکه اگر کاربری در زمان جستجوی در نرم‌افزار کتابخانۀ دیجیتال موضوعاتی همچون (علم اصول، اجتهاد، سنت و...) را انتخاب نماید، به دلیل سابقۀ جستجوهای پرتکرار کاربران پیشین با همین موضوعات، از سوی سامانۀ توصیه‌گر، آنگاه عناوین مرتبطی با موضوع اصول فقه پیشنهاد خواهد شد. همین‍طور، اثبات درستی الگوی پیشنهادی نشان داد که مقدم و مؤخرهای ایجادشده از قوانین جدید با یکدیگر مشابهت موضوعی داشته است.
نتیجه‌گیری: این مطالعه نشان داد، فنون مختلف داده‌کاوی با کاربرد قوانین انجمنی و اجرای الگوریتم FP-Growth  دارای کارایی و دقت بالا بوده و در تجزیه‌و تحلیل داده‌های کتابخانه‌های دیجیتالی و مراکز اطلاع‌رسانی برای ایجاد سامانه‌های توصیه‌گر به‌منظور پیش‌بینی درخواست‌های کاربران و پیشنهاددهی مؤثر، مناسب است و از مفاهیم کاربردی آن، فراهم نمودن بستری برای بهبود کیفیت تعامل دوسویه میان کتابداران و کاربران در جهت ارائۀ خدمات بهینه و سودمند است و همچنین ایجاد فرصت مناسبی برای ارتقاء نگرش و دیدگاه مدیران در جهت تأمین منابع اطلاعاتی موافق با نیازهای واقعی کاربران خواهد بود.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Application of Data Mining in the Recommender System of Digital Libraries Based on Association Rules (Case Study: Astan Quds Razavi Digital Library)

نویسندگان [English]

  • Samaneh Ghafarian 1
  • Fahimeh Babalhavaeji 2
  • Mehrdad Jalali 3
  • Nadjla Hariri 4
  • Maryam Khademi 5
1 Ph.D. Candidate, Knowledge and Information Science, Science and Research Branch, Islamic Azad University, Tehran, Iran
2 Associate Professor, Knowledge and Information Science, Communication and Knowledge Sciences Group, Science and Research Branch, Islamic Azad University, Tehran, Iran
3 Associate Professor, Computer Engineering , Computer Engineering and Information Tecnology Group , Mashhad Islamic Azad University, Mashhad, Iran
4 Professor, Knowledge and Information Science, Communication and Knowledge Sciences Group, Science and Research Branch, Islamic Azad University, Tehran, Iran
5 Associate Professor, Applied Mathematics, Mathematics Group, South Tehran Branch, Islamic Azad University, Tehran, Iran
چکیده [English]

Purpose: This study aimed to analyze and examine the use of data mining techniques in the recommender system of digital libraries and information centers. By analyzing the behavioral patterns of digital library users and providing detailed suggestions, the data mining approach in this system makes it unnecessary for them to review unrelated data during the search. This not only leads to an increase in users' information requests but also significantly enhances their satisfaction with the provision of digital library services.
Method: The current research was an analytical study of cross-sectional survey type and content analysis. This method collected the required data in four stages, and its output was analyzed using a data mining technique. Using content analysis, as in the first stage, a list of the number of transactions of user requests for books, including user IDs, manuscript titles, manuscript identification code numbers in the digital library system (manuscript database), the organization of libraries, Museums and Documents Center of Astan Quds Razavi were investigated. The data were arranged as a user column and an item (book) row. In the second step, the preprocessed raw data was further transformed into a user-item matrix, which is zero and one. In the third stage, the data output was implemented and executed using data mining technology and the implementation of association rules and FP-Growth  algorithm on RapidMiner software) and confidence (the confidence level in the desired result) were tested. In the fourth stage, the accuracy and correctness of the proposed system plan were presented.
Findings: The output of this research revealed that the association rules have a confidence level above 50% and can determine the user's access patterns, which is the best way to access the generated datasets by setting the minimum support level of 2% and the minimum confidence level of 95%, leading to 1081 new rules with conditional algorithms (if-then). If a user selects topics such as (the science of principles, Ijtihad, tradition, etc.) during the search in the digital library software, due to the history of repeated searches by previous users with the same topics by the recommender system, then titles related to the subject of principles of jurisprudence will be suggested. Also, the proof of the correctness of the proposed model showed that the first and last ones created from the new laws had thematic similarities with each other.
Conclusion: This study showed that various data mining techniques with the application of association rules and the implementation of the FP-Growth algorithm have high efficiency and accuracy and are suitable for analyzing the data of digital libraries and information centers to create recommender systems in order to predict user requests and make effective suggestions. One of its practical concepts is to provide a platform to significantly enhance the quality of two-way interaction between librarians and users, thereby providing optimal and beneficial services, and also to create a suitable opportunity to improve the attitude and perspective of managers in order to provide information resources that meet the real needs of users.

کلیدواژه‌ها [English]

  • Recommender System
  • Association Rules in Data Mining
  • Astan Quds Razavi Digital Library
  • Data Mining
  • Digital Library
  • FP-Growth Algorithm
حسین، مهرداد (1395). به‌کارگیری توازن برای افزایش کارایی داده‌کاوی. پایان‌نامه کارشناسی ارشد مهندسی کامپیوتر، دانشکده فنی مهندسی، دانشگاه شهید بهشتی، تهران.
درزی، محمد، مرادی منش، زهرا و حسینی، سیدمهدی (1389). بررسی و تحلیل تکنولوژی سامانه‌های توصیه‌گر در کسب‌وکارهای الکترونیکی و پیاده‌سازی یک نمونه از آن‌ها. تهران، ایران: مراکز جهاد دانشگاهی. در: sid.ir/paper/786310
شمس‌الدینی، شیما، شمسی، محبوبه و حیدرپور، سمیه (1391). بهبود کارایی الگوریتم FP-Growth در کاوش قواعد انجمنی. کنفرانس مهندسی برق الکترونیک ایران 1391 در خراسان رضوی، گناباد، 22-28. https://civilica.com/doc/164247/
قاسمیان، امیر و حاجی زین‌العابدینی، محسن (1400). داده‌کاوی در کتابخانه دیجیتال. نشریه علمی و تخصصی ادکا، 6 (6): 1-52.
غربی، پویا (1395، 28 مرداد ).‌ سیستم‌های توصیه‌گر (Recommender Systems) چیست؟. مدیا سافت (الکترونیکی). https://mediasoft.ir B2n.ir/y98170
غفاریان، سمانه، جلالی، مهرداد، باب‌الحوائجی، فهیمه، حریری، نجلا و خادمی، مریم (1399). طراحی مدل خدمات شخصی‌سازی‌شده با رویکرد سامانه‌های توصیه‌گر در کتابخانه دیجیتال آستان قدس رضوی. فصلنامه کتابداری و اطلاع‌رسانی، 23 (2): 5-24.
 DOI: 10.30481/lis.2019.192234.1599
کریم‌پور‌آذر، آسیه (1390). ارائه مدلی برای شخصیسازی نتایج جست‌وجو در کتابخانههای دیجیتال تحت وب با استفاده از تکنیکهای دادهکاوی. پایان‌نامه کارشناسی ارشد علم اطلاعات و دانش شناسی، دانشکده علوم تربیتی، دانشگاه اصفهان، اصفهان.
نوروزی، یعقوب، غلامی، طاهره و جعفری فر، نیره (1396). وضعیت کتابخانه‌های ‌دیجیتالی ایران بعد از گذشت یک دهه چگونه است؟ فصلنامه مطالعات ملی کتابداری و سازماندهی اطلاعات، 28(4): 148-170.
یزدان‌پناهی، بهنام و مصلی‌نژاد، احمد (1395). کاربرد سیستمهای توصیهگر در تجارت الکترونیک. کنفرانس بین‌المللی مهندسی کامپیوتر، برق و الکترونیک 1395 در  کوالالامپور، 4-10.
References
Aniko Mislove, H. (2016). Personalization in Online Services Measurement, Analysis, and Implications. Doctoral Dissertation, The College of Computer and‌ Information Science, Northeastern University, Boston, Massachusetts. Available in: http://axon.cs.byu.edu/~martinez/classes/478/readings/DataPrep.pdf
Ansari, N., Vakilimofrad, H., Mansoorizadeh, M., and Amiri, M.R. (2021). Using data mining techniques to predict user’s behavior and create recommender systems in the libraries and information centers. Global Knowledge, Memory and Communication, 70 (6/7): 538-557. DOI:10.1108/GKMC-04-2020-0058
Burke, R., Felfernig, A., & Göker, M. H. (2011). Recommender Systems: An Overview. AI Magazine, 32 (3): 13.
Chen, S., & Liu, X. (2009). Evaluation of a personalized digital library based on cognitive styles: Adaptivity vs. adaptability. The International Journal of Information Management, 29(1): 48–56.
Darzi, M., Moradi Manesh, Z., & Hosseini, S. M. (1389). Reviewing and analyzing the technology of recommender systems in electronic businesses and implementing an example of them. Tehran, Iran: Academic Jihad Centers. https://sid.ir/paper/786310/fa] In Persian [
Dey, A.k. & Sharma, R. (2021). A Comparative Book Recommendation System using Apriori & FP Growth Algorithm Removing the Barriers of Time & Memory Constraint. research square, (5): 1-26.
   .available at: https:// 10.21203/rs.3.rs-245630/v1.
Girija, N., & Srivatsa, S.K., (2006). A Research Study: Using Data Mining in Knowledge Base Business Strategies. Information Technology Journal, 5 (3): 590-600.
Gharbi, P. (18 August,2016). What are recommender systems? Soft media (electronic). https://mediasoft.ir B2n.ir/y98170 [ In Persian]
Xu, Ch., & Bai, J. (2022). Massive-Scale Data Mining to Enhance Digital Library with Applications in College Education. Applied Bionics and Biomechanics, 2022. pp 1-7. DOI: 10.1155/2022/9698477.
Ghafarian, S., Jalali, M., Babalhavaeji, F., Hariri, N., & Khademi, M. (2019). Designing a Personalized Service Model with an Approach to Recommender System in Astan-e Quds-e Razavi Digital Library Software. Librarianship and Information Quarterly, 23 (2): 4-25.  [ In Persian]
Ghasemian, A., & Haji Zain al-Abidini, M. (1400). Data mining in the digital library. Decca scientific and specialized journal, 6 (6): 1-52. [ In Persian]
Li., J., XU, Y., Wang, yun-feng, & CHU, Ch. H. (2009). Strongest association Rules Minig for Personalized Recommenadation. Systems Engineering - Theory & Practice, 29 (8): 144-152.
Hand, D. J. (1998). Data Mining: Statistics and More? The American Statistician, 52(2): 112-118.
Hossein, M. (2015). Using balance to increase the efficiency of data mining. Master's thesis in computer engineering, Faculty of Engineering, Shahid Beheshti University, Tehran. [ In Persian]
Huang, Ch. M., Kang, Sh. H., Chang, Ch. Ch., & Lu, Sh. H. (2023). Apply Data Mining Techniques to Library Circulation Records and Usage Patterns Analysis. avaiable in: https://www.researchgate.net/scientific-contributions/Ching-Che-Chang-2163221064
Jomsri, P. (2017). Book recommendation system for digital library based on user profiles by using association rule. Innovative computing technology (INTECH), Fourth International Conference  on the Innovative Computing Technology (INTECH), IEEE, Luton, pp. 130-134.
Kardan, A. & Ebrahimi, M. (2012). A novel approach to hybrid recommendation systems based on association rules mining for content recommendation in asynchronous discussion groups. Information Sciences, 219, 93-110. Available at: https://www.researchgate.net/publication/256721095_A_novel_approach_to_hybrid_recommendation_systems_based_on_association_rules_mining_for_content_recommendation_in_asynchronous_discussion_groups
Khademizadeh, S., & Rafieinasab, F. (2023). Data Mining in Academic Libraries: A Systematic review. International Journal of Information Science and Management, 21(3): 255-271.
         DOI: 10.22034/ijism.2023.1977879
Karimpour-Azar, A. (2018). Presenting a model for personalizing search results in online digital libraries using data mining techniques. Master thesis of information science and epistemology, Faculty of Educational Sciences, Isfahan University, Isfahan. [ In Persian]
Leino, J. (2014). User Factors in Recommender Systems: Case Studies in e-Commerce, News Recommending, and e-Learning. Dissertations in Interactive Technology, School of Information Sciences, University of Tampere FINLAND.
Liu, Y. (2018). Data Mining of University Library Management Based on Improved Collaborative Filtering Association Rules Algorithm. Wireless Personal Communications, 102 (4): 3781–3790
Mathew. P., Kuriakose, B., & Hegde, V. (2016). Book Recommendation System through content based and collaborative filtering method. 2016 International Conference on Data Mining and Advanced Computing (SAPIENCE), Ernakulam, India, pp. 47-52. DOI: 10.1109/SAPIENCE.2016.7684166.
Mishra, R. N., & Mishra, A. (2013). Relevance of data mining in digital library. International Journal of Future Computer and Communication, 2(1): 10-14. DOI.org/10.7763/IJFCC.2013.V2.110
Nowrozi, Y., Gholami, T., & Jafari Far, N. (2016). What is the status of digital libraries in Iran after a decade? Quarterly Journal of National Library Studies and Information Organization, 28 (4): 148-170. [ In Persian]
Pang, N., & Yan, F. (2012). The research on personalized service of digital library based on data mining. Proceedings of the 2012 National Conference on Information Technology and Computer Science. Advances in Intelligent Systems Research. 10.2991/citcs.2012.221
Prehanto, D. R., Indriyanti, A. D., Permadi, G. S., Vitadiar, T. Z., & Jayanti, F. D. (2020). Library book modeling data using the association rule method with apriori algorithm in determining book placement and analysis of book loans. International Journal of Advanced Science and Technology, 29(5): 1244 -1250. Retrieved from http://sersc.org/journals/index.php/IJAST/article/view/9786
Puritat, K., & Intawong, K . (2020).  Development of an Open Source Automated Library System with Book Recommedation System for Small Libraries.  Joint International Conference on Digital Arts, Media and Technology with ECTI Northern Section Conference on Electrical, Electronics, Computer and Telecommunications Engineering (ECTI DAMT & NCON), Pattaya, Thailand, pp. 128-132.
 DOI: 10.1109/ECTIDAMTNCON48261.2020.9090753.
Shamsaldini, Sh., Shamsi, M., & Heydarpour, Sh. (2011). Improving the efficiency of FP-Growth algorithm in exploring association rules. Iran Electrical and Electronic Engineering Conference . Razavi Khorasan, Gonabad, pp. 22-28. https://civilica.com/doc/164247/. ]In Persian[
Suresh, R., Anand, I., Vianesh, B., & Mohammad, H. R. (2018). Study of clustering algorithms for library management system. In 2018 International Conference on Computation of Power, Energy, Information and Communication (ICCPEIC), pp. 221-224. DOI.org/10.1109/ICCPEIC.2018.852518
Tewari., A. SH., Kumar, A., &‌ Barman, A.‌G. (2014). Book recommendation system based on combine features of content‌ based filtering, collaborative filtering and association rule mining. Computing Conference (IACC), IEEE International, Gurgaon, India, pp. 500-503.
Uppal, V., & Chindwani, G. (2013). An empirical study of application of data mining techniques in library system. International Journal of Computer Applications, 74 (11): 42-46.
Verma, Ch. K.(2015). Enabling Automated and Efficient Personalization Systems. Doctoral Dissertation, University  of California, SAN DIEGO.
Wang, X., & Huang, H. (2020). Research on Library Personalized Recommendation System Based on Restricted Boltzmann Machine. 5 th International Confernce on Education and  Social Development . pp 293-297 . available at: https://  10.12783/dtssehs/icesd2020/34428
Yazdan Panahi, B., & Moslinejad, A. (1395). Application of recommender systems in e-commerce .International Computer, Electrical and Electronics Engineering Conference 2015 in Kuala Lumpur, pp. 4-10.
Yi, K., Chen, T., & Cong, G. (2018). Library personalized recommendation service method based improved association rules. Library Hi Tech, 36 (3): 443-457.
Zhang, W., Xu, Y., Zhang, S., &. Huang, X (2018). Association Rule Mining for Selecting Proper Students to Take Part in Proper Discipline Competition: A Case Study of Zhejiang University of Finance and Economics. International Journal of Emerging Technologies in Learning (iJET), 13(03): 100–113. https://doi.org/10.3991/ijet.v13i03.8382
CAPTCHA Image