خوشه‌بندی اطلاعات

نوع مقاله: مقاله پژوهشی

نویسندگان

1 عضو هیئت علمی دانشگاه آزاد اسلامی واحد رودهن

2 دکتری کتابداری و اطلاع‌رسانی سازمان اسناد و کتابخانة ملی ایران

چکیده

خوشه‌بندی، فرایند سازماندهی عناصر به گروه‌هایی است که اجزای آن به هم شبیه هستند. یک خوشه، مجموعة‌ عناصری است که با هم مشابهت دارند و با اجزای دیگر خوشه‌ها ناهمگون می‌باشند. هدف خوشه‌بندی، دستیابی سریع و مطمئن به اطلاعات همبسته، و شناسایی ارتباط منطقی میان آنهاست. بنابراین، الگوریتم‌های خوشه‌بندی می‌تواند دربسیاری از حوزه‌های موضوعی به‌کار گرفته شود. از آنجا که نتایج خوشه‌بندی می‌تواند با تعداد اصطلاح‌های مورد استفاده تغییر یابد، روش‌های تجربی متعددی برای تشخیص تعداد تقریبی اصطلاح‌هایی که می‌توان انتظار داشت تا توزیع متناسب داده‌ها را در میان خوشه‌ها فراهم سازد و حدود بالا و پایین  الگوریتم خوشه‌بندی را تعیین کند، ارائه شده است. یکی از کاربردهای خوشه‌بندی، سازماندهی اصطلاحنامه‌هاست. در این مقاله، با بهره‌گیری از روش مطالعة کتابخانه‌ای، ضمن بررسی مفهوم خوشه‌بندی اطلاعات، روش‌های مؤثر خوشه‌بندی اطلاعات و کاربرد آن در ساختار تزاروس (اصطلاحنامه) بیان شده است. از جمله روش‌های عمدة خوشه‌بندی چهار شیوة خوشه‌‌بندی دسته‌‌ای، تک‌پیوندی، ستاره‌‌ای، و رشته‌‌ای است. نتیجة این مطالعه نشان می‌دهد که بهره‌گیری از الگوریتم‌های متناسب و روش‌های سودمند خوشه‌بندی اطلاعات می‌تواند نقشی مهم در سازماندهی بهینة اصطلاحنامه داشته باشد.

کلیدواژه‌ها


عنوان مقاله [English]

Information Clustering

نویسندگان [English]

  • N. Mohammadalipoor 1
  • F. Doroudi 2
1 Ph.D. in Library and Information Science; Islamic Azad University, Roudehen Branch, Tehran, Iran
2 Ph.D. in Library and Information Science; National Library and Archives of Islamic Republic of Iran
چکیده [English]

Clustering is a process of organizing objects into groups whose elements are similar to each other. A cluster is therefore a collection of objects which are similar to each other and dissimilar to the objects belonging to other clusters. The goal of clustering is to quickly access interconnected information and identify logical relationships between them. Clustering algorithms can be applied in many fields. As clustering results would be affected by the number of terms used, various experimental methods are used to find the approximate number of terms expected to produce a balanced distribution of data among clusters, and set upper and lower boundaries for the clustering algorithm. One of the applications of clustering is the organization of thesauri. The main objective of this paper is to have an accurate and appropriate explanation of the information clustering concept and its application in thesaurus structure. This research utilized library study to explain effective information clustering methods and their application in thesaurus structure. Some of the main methods of clustering are cliques clustering, single link, star and string clustering. The findings show that utilization of appropriate algorithms and useful methods of information clustering play an important role in optimum thesaurus organization

کلیدواژه‌ها [English]

  • Data clustering
  • Thesaurus
  • Information Retrieval Systems (IRS)
  • document clustering