تحلیل موضوعی و روند تولیدات علمی سلامت در حوزۀ سواد اطلاعاتی با استفاده از تکنیک های متن کاوی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشگاه علوم پزشکی شهید صدوقی

2 گروه علم اطلاعات و دانش شناسی، دانشکده علوم تربیتی، دانشگاه اصفهان

3 اداره کل کتابخانه‌های عمومی استان یزد، یزد

10.30484/nastinfo.2025.3676.2307

چکیده

هدف: وجود تحقیقات متنوع در زمینه سواد اطلاعاتی، نیاز به تحلیل موضوعات این مطالعات را برای داشتن چشم‌اندازی روشن و جامع از این حوزه ضروری می‌سازد. پژوهش حاضر با هدف مدل‌سازی موضوعی مقالات منتشر شده در زمینه سواد اطلاعاتی متون سلامت با استفاده از پایگاه PubMed انجام شده است.

روش: این پژوهش با رویکرد توصیفی و با استفاده از متن‌کاوی انجام شد. مقالات در زمینه سواد اطلاعاتی مبتنی بر سرعنوان موضوعی مش و با استفاده از فرمول جستجوی"information literacy"[Majr] بدون محدودیت زمانی از پایگاه PubMed استخراج شدند. در مجموع 8407 رکورد بازیابی شد. پس از پاکسازی داده‌ها، چکیده‌ و عناوین این مقالات با استفاده از کتابخانه‌های Pandas، PyLDAvis، sklearn، PyLDAvis، numpy، Setuptools، NLTK، Gensim، Wordcloud، Seaborn، مورد تجزیه و تحلیل قرار گرفت و مدل‌سازی موضوع انجام شد.

یافته‌ها: در مدل‌سازی موضوعی سواد اطلاعاتی در متون سلامت هفت خوشه موضوعی شامل"اطلاع‌جویی سلامت آنلاین و سواد سلامت دیجیتال"؛ "تاثیر سواد سلامت در تصمیم‌گیری"؛ "خوانایی منابع آموزش به بیمار"؛ "سواد سلامت در همه‌گیری کووید19 "؛ "سواد سلامت روان"؛ "سواد سلامت دهان ودندان"؛ و "ارتباطات در مراقبت‌های بهداشتی" شناسایی شد. بالاترین روند انتشار در خوشه موضوعی "ارتباطات در مراقبت‌های بهداشتی" و بعد از آن "خوشه اطلاع‌جویی سلامت آنلاین و سواد سلامت دیجیتال" مشاهده شد. بالاترین فراوانی با روش کیسه کلمات، کلیدواژه "سواد سلامت" بود و با روش فراوانی وزنی کلمات کلیدی (TF_IDF) ، کلمات "بیماران" و "روان" بالاترین وزن را داشتند.

نتیجه‌گیری: خوشه‌های موضوعی استخراج شده از تولیدات علمی سواد اطلاعاتی انسجام مناسب و روابط موضوعی قوی را نشان دادند. بنابراین این پژوهش می‌تواندکمک شایانی به پژوهشگران در راستای ارتقای تولیدات علمی حوزه سواد اطلاعات سلامت کند.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Analysis of Topics and Trends in Scientific Productions in the Field of Health Information Literacy Using Text Mining Techniques

نویسندگان [English]

  • Samaneh Khavidaki 1
  • Fezzeh Ebrahimi 2
  • Amir Zakipoor 3
1 Shahid Sadooghi University
2 University of Isfahan
3 Public Libraries Foundation of Iran
چکیده [English]

Purpose: Diverse research in information literacy necessitates analyzing the topics of these studies to gain a clear and comprehensive understanding of this area. The current research aims to apply topic modeling to published scientific productions related to health information literacy using the PubMed database.
Method: This study employed a quantitative approach with an applied focus, utilizing text-mining techniques. Scientific publications in information literacy were extracted from the PubMed database using the MeSH term "information literacy" [Majr] without any time constraints. A search on August 5, 2024, yielded 8407 records from 1519 journals and books. Subsequently, the abstracts and titles of the articles were saved in text format and then converted into a structured Excel format for analysis. After removing null records, 6811 records with abstracts were used for analysis. The process involved tokenization, removal of punctuation and stop words, stemming, and conversion of text data into numerical vectors to apply machine learning techniques. Finally, topic modeling was performed using the Latent Dirichlet Allocation (LDA) algorithm. After data cleaning, the abstracts and titles of these articles were analyzed and topic modeled using the Pandas, PyLDAvis, sklearn, PyLDAvis, numpy, Setuptools, NLTK, Gensim, Wordcloud, and Seaborn libraries.
Findings: Analysis of the retrieved articles using the TF-IDF algorithm revealed that the terms "patients," "mental," "mental health," "information," and "care" had the highest term frequency-inverse document frequency weights.
 Using Latent Dirichlet Allocation, seven thematic clusters were identified, including "Online Health Information Seeking and Digital Health Literacy"; "Impact of Health Literacy on Decision-Making"; "Readability of Patient Education Materials"; "Health Literacy in the COVID-19 Pandemic"; "Mental Health Literacy"; "Oral Health Literacy"; and "Communication in Healthcare."
In terms of the percentage of research productions in the field of information literacy, it was found that the topic of "Mental Health Literacy" had the highest percentage with 22%, followed by "Impact of Health Literacy on Decision-Making" with 19%. On the other hand, "Health Literacy In The COVID-19 Pandemic" had the lowest percentage of scholarly output with only 2%. The growth trend of scientific production in each of the extracted topics showed that the highest growth rate was observed in the topic cluster " Communication in Healthcare," followed by the " Online Health Information Seeking and Digital Health Literacy " topic.
Conclusion: The extracted thematic clusters from the scientific productions on information literacy demonstrated good coherence and strong thematic relationships; therefore, this research can significantly contribute to researchers in improving scientific production in the field of health information literacy.

کلیدواژه‌ها [English]

  • Topic Modeling
  • Information Literacy
  • Health Literacy
  • Health Information Literacy
  • Text Mining
CAPTCHA Image

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از تاریخ 21 فروردین 1404
  • تاریخ دریافت: 16 آذر 1403
  • تاریخ بازنگری: 04 بهمن 1403
  • تاریخ پذیرش: 21 فروردین 1404