<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE ArticleSet PUBLIC "-//NLM//DTD PubMed 2.7//EN" "https://dtd.nlm.nih.gov/ncbi/pubmed/in/PubMed.dtd">
<ArticleSet>
<Article>
<Journal>
				<PublisherName>سازمان اسناد و کتابخانه ملی جمهوری اسلامی ایران</PublisherName>
				<JournalTitle>مطالعات  کتابداری و سازماندهی اطلاعات</JournalTitle>
				<Issn>2783-4646</Issn>
				<Volume>30</Volume>
				<Issue>3</Issue>
				<PubDate PubStatus="epublish">
					<Year>2019</Year>
					<Month>10</Month>
					<Day>23</Day>
				</PubDate>
			</Journal>
<ArticleTitle>A Study of the Effect of Summarization Techniques on Persian Texts Classification</ArticleTitle>
<VernacularTitle>تأثیر تکنیک‌های خلاصه‌سازی بر دسته‌بندی متون فارسی</VernacularTitle>
			<FirstPage>8</FirstPage>
			<LastPage>23</LastPage>
			<ELocationID EIdType="pii">2331</ELocationID>
			
<ELocationID EIdType="doi">10.30484/nastinfo.2019.2331</ELocationID>
			
			<Language>FA</Language>
<AuthorList>
<Author>
					<FirstName>فاطمه زهرا </FirstName>
					<LastName>عرب احمدی</LastName>
<Affiliation>کارشناس ارشد کامپیوتر، ‌دانشگاه گلستان، ‌گرگان</Affiliation>

</Author>
<Author>
					<FirstName>سهیلا </FirstName>
					<LastName>کرباسی</LastName>
<Affiliation>استادیار گروه کامپیوتر، ‌دانشگاه گلستان، ‌گرگان</Affiliation>

</Author>
</AuthorList>
				<PublicationType>Journal Article</PublicationType>
			<History>
				<PubDate PubStatus="received">
					<Year>2019</Year>
					<Month>01</Month>
					<Day>15</Day>
				</PubDate>
			</History>
		<Abstract>The purpose of this study is to verify combination of some classification and summarization techniques and to examine evaluation metrics of classification. The proposed framework implemented in seven main stages. First, 1,000 documents collected from yjc.ir website. The selection of documents is based on the appropriate content and a minimum of 100 and a maximum of 350 words. These documents divided into three categories: document title, document summary and original text of the document. Summary text and the original text grouped into 250, 500 and 1000 documents in two stages, with a 100% growth in the number of documents. The pre-processing of text performed and the stop-words deleted from the sentences. Next, the TF-ISF summarizer techniques implemented. A variety of classification algorithms such as Decision trees, Support vector machine, Bayesian and Rule implemented by the RapidMiner software, which provided 120 Excel outputs from the results of the evaluation criteria (accuracy, precision, and recall). Finally, five comparisons between the results considered. The results of this study indicate that the superiority of 1,000 documents, the ISF summarizer method versus TF, Bayesian and SVM classification versus Rule and Decision tree classifications, the original text versus summary text with highest of 96.67% of accuracy in SVM classification, 1000 documents and ISF summarizer technique.</Abstract>
			<OtherAbstract Language="FA">هدف این پژوهش، استفاده از ترکیب تکنیک های دسته بندی و خلاصه سازی و بررسی تاثیر افزایش تعداد اسناد می باشد که تأثیر پارامترهای خلاصه سازی TF وISF و چهار تکنیک دسته بندی بیزین، درخت تصمیم، قانون و بردار پشتیبان و سه معیار ارزیابی دقت، صحت و فراخوان بر روی 1000 سند متن اصلی و خلاصه محاسبه و تفاوت ها بررسی شدند. نتیجه ی این پژوهش حاکی از برتری اسناد 1000 تایی، روش خلاصه ساز ISF نسبت به TF، روش های دسته بندی بیزین و بردار پشتیان نسبت به روش قانون و درخت تصمیم، متن اصلی نسبت به متن خلاصه می باشد که بیشترین مقدار %96.67 از معیار صحت در دسته بندی SVM و اسناد 1000 تایی متن اصلی از تکنیک خلاصه ساز ISF حاصل شد.</OtherAbstract>
		<ObjectList>
			<Object Type="keyword">
			<Param Name="value">دسته‌بندی متون فارسی</Param>
			</Object>
			<Object Type="keyword">
			<Param Name="value">خلاصه‌ساز TF-ISF</Param>
			</Object>
			<Object Type="keyword">
			<Param Name="value">الگوریتم های دسته‌بندی</Param>
			</Object>
			<Object Type="keyword">
			<Param Name="value">معیارهای ارزیابی دسته‌بندی</Param>
			</Object>
		</ObjectList>
<ArchiveCopySource DocType="pdf">https://nastinfo.nlai.ir/article_2331_60712f159e7d201cf0db4dab4009095d.pdf</ArchiveCopySource>
</Article>
</ArticleSet>
