-
آرشیو :
نسخه پاییز 1399
-
نوع مقاله :
پژوهشی
-
شناسه دیجیتال (DOI) :
-
کد پذیرش :
1372
-
موضوع :
سایر شاخه های علوم رایانه
- نویسنده/گان : آرزو حمیدی، عبدالرضا حاتم لو
-
چکیده :
امروزه با توجه به فراوانی اسناد در اینترنت که بیشتر آنها محتوی اطلاعات غیر ضروری می باشند، اهمیت خلاصه سازی متون به منظور کاهش زمان مطالعه از اهمیت خاصی برخوردار است. افزایش چشمگیر این نوع اطلاعات، اهمیت وجود ابزارهایی برای خلاصه سازی خودکار منابع متنی را بیش از هر زمان دیگری آشکار می کند. خلاصه سازی در اصل، فرآیند فشرده سازی یک منبع بوده، به نحوی که نتیجه کار شامل اطلاعات مهم آن منبع باشد. به عبارت دیگر، استخراج قسمت های مهم از یک یا چند متن را خلاصه سازی می گویند. با وجود تکنیک های متعددی که برای خلاصه سازی متون وجود دارد، هنوز یک راه حل بهینه که برای تمامی کاربردها مناسب باشد وجود ندارد. در این مقاله با بکارگیری الگوریتم جستجوی فاخته و ترکیب آن با تحلیل احساسات، دقت خلاصه های استخراجی افزایش یافته است. فرآیند تحقیق شامل مراحل پیش پردازش، توزیع گوسی، تابع برازش و اجرای الگوریتم خلاصه سازی متن می باشد. مرحله پیش پردازش شامل تقسیم بندی جملات، توکنیزاسیون یا نشانه گذاری، حذف کلمه توقف و زیر وظایف شامل حذف ریشه لغات می باشد. الگوریتم پیشنهادی این تحقیق بر روی 10 سند متفاوت جمع آوری شده از مجموعه داده های DUC2007، مورد ارزیابی قرار گرفته است. داده های DUC2007 در مجموع شامل ۴۵ موضوع بوده که هر کدام شامل ۲۵ سند می باشد. بسته ROUGE-1.5.5 برای ارزیابی خلاصه متن با معیارهای ارزیابی مورد استفاده قرار گرفته است. سیستم خلاصه سازی پیشنهادی در مقایسه با سایر سیستم های خلاصه سازی با استفاده از بسته ROUGE-1.5.5 در معیارهای Recall, Precision وF-measure نتایج بهتری را نشان می دهد.
-
کلید واژه :
خلاصه سازی متن، تحلیل احساسات، الگوریتم بهینه سازی فاخته، ابزار ارزیابی .ROUGE
-
Title :
-
Abstract :
-
key words :
-
مراجع :
[1] Rajabioun, Ramin. "Cuckoo optimization algorithm." Applied soft computing 11, no. 8 (2011): 5508-5518.
[2] Richmond, W. K. (1965). Teachers and machines: an introduction to the theory and practice of programmed learning. Collins.
[3] Shaikh, M. A. M., Prendinger, H., & Mitsuru, I. (2007, September). Assessing sentiment of text by semantic dependency and contextual valence analysis. In International conference on affective computing and intelligent interaction (pp. 191-202). Springer, Berlin, Heidelberg.
[4] Zheng, H., & Zhou, Y. (2012). A novel cuckoo search optimization algorithm based on Gauss distribution. Journal of Computational Information Systems, 8(10), 4193-4200.
[5] Rautray, R., & Balabantaray, R. C. (2018). An evolutionary framework for multi document summarization using Cuckoo search approach: MDSCSA. Applied computing and informatics, 14(2), 134-144.
[6] Sarkar, K. (2013). Automatic Single Document Text Summarization Using Key Concepts in Documents. JIPS, 9(4), 602-620.
[7] Nenkova, A. (2005). Automatic text summarization of newswire: Lessons learned from the document understanding conference
[8] Mosa, Mohamed Atef, Arshad Syed Anwar, and Alaa Hamouda. "A survey of multiple types of text summarization based on swarm intelligence optimization techniques." (2018).
[9] Rouane, Oussama, Hacene Belhadef, and Mustapha Bouakkaz. "Combine clustering and frequent itemsets mining to enhance biomedical text summarization." Expert Systems with Applications 135 (2019): 362-373.
- صفحات : 42-54
-
دانلود اصل مقاله
( 1.06 MB )