-
آرشیو :
نسخه زمستان 1402
-
کد پذیرش :
1426
-
موضوع :
مهندسی برق
-
نویسنده/گان :
| محمد میراحمدی، محبوبه شمسی، عبدالرضا رسولی کناری
-
زبان :
فارسی
-
نوع مقاله :
پژوهشی
-
چکیده مقاله به فارسی :
هرزنامه یا هرزنامههای الکترونیکی در اصطلاحات علم کامپیوتر به ارسال یا دریافت پیامهای ناخواسته الکترونیکی با استفاده از پست الکترونیکی، پیامرسان آنی، وبلاگها، گروههای خبری، شبکههای اجتماعی، جستجوی وب، تلفنهای همراه و غیره اشاره دارد. براى شناسايي هرزنامه در سطح توييت، اغلب ويژگيهاى تعريف شده اى وجود دارد و الگوريتمهاى يادگيرى ماشين مناسب بكار برده ميشوند. تنها استفاده از ويژگي هاى حساب كاربرى براى تشخيص مي تواند ضعف هايي داشته باشد. لذا در روش پيشنهادى ويژگي هاى احساسي نيز مورد استفاده قرار گرفته و از يك روش تلفيقی به منظور هم افزايي نتايج حاصل از چند روش و دستيابي به نتايج دقيق تر استفاده شده است. در اين پژوهش از مدل مبتني بر ويژگي به همراه يك مدل مبتني بر تحليل احساسات در تركيب با الگوريتم هاى يادگيرى ماشين استفاده شد. بهبود عملکرد روش پیشنهادی به دلیل استفاده از ویژگیهای احساسی در تلفیق با ویژگی¬های در سطح کاربر در روش پیشنهادی میباشد. انتخاب ویژگیهای احساسی پیشنهادی نسبت به ویژگیهای کلاسیک مبتنی بر کاربر و یا متن توییت که در مقاله پایه بررسی شده از کارایی بالاتری برخوردار بود. حداکثر دقت در تحقیق ذکر شده 93 درصد ذکر شده است درحالیکه در روش پیشنهادی و با استفاده از شبکه عصبی مصنوعی که در این تحقیق بکار گرفته شد، دقت تا 98 درصد برآورد گردید.
-
لیست منابع :
[1] Alom, Z., Carminati, B., & Ferrari, E. (2020). A deep learning model for Twitter spam detection. Online Social Networks and Media, 18, 100079.
[2] Androutsopoulos, I., Koutsias, J., Chandrinos, K. V., Paliouras, G., & Spyropoulos, C. D. (2000). An evaluation of naive bayesian anti -spam filtering. arXiv preprint cs/0006013. differentiation for combating link-based Web spam,” ACM Trans. Web, vol. 8, no. 3, 2014, Art. no. 15 pp. 37-40.
[3] Baccianella, Stefano, Andrea Esuli, and Fabrizio Sebastiani. "Sentiwordnet 3.0: an enhanced lexical resource for sentiment analysis and opinion mining." In Lrec, vol. 10, no. 2010, pp. 2200-2204. 2010.
[4] Chen, C., Zhang, J., Xie, Y., Xiang, Y., Zhou, W., Hassan, M. M., & Alrubaian, M. (2015). A performance evaluation of machine learning-based streaming spam tweets detection. IEEE Transactions on Computational social systems, 2(3), 65-76.
[5] Chen, C., Zhang, J., Chen, X., Xiang, Y., & Zhou, W. (2015, June). 6 million spam tweets: A large ground truth for timely Twitter spam detection. In 2015 IEEE international conference on communications (ICC) (pp. 7065-7070). IEEE.
[6] Chu Z, Gianvecchio S, Wang H, Jajodia S. Detecting automation of twitter accounts: are you a human, bot, or cyborg? IEEE Trans Dependable Secure Comput 2012;9(6):811-24.
[7] Davidson, T., Warmsley, D., Macy, M., & Weber, I. (2017). Automated hate speech detection and the problem of offensive language. arXiv preprint arXiv: 1703.04009.
[8] Drucker, H., Wu, D., & Vapnik, V. N. (1999). Support vector machines for spam categorization. IEEE Transactions on Neural networks, 10(5), 1048-1054.
[9] Dustin Hillard, N-gram Language Modeling Tutorial, Lecture notes courtesy of Prof. Mari Ostendorf. http://ssli.ee.washington.edu/WS07/notes/ngrams.pdf
[10] Esuli, A., & Sebastiani, F. (2006, May). Sentiwordnet: A publicly available lexical resource for opinion mining. In LREC (Vol. 6, pp. 417-422).
[11] Gheewala, S., & Patel, R. (2018, February). Machine learning based Twitter Spam account detection: a review. In 2018 Second International Conference on Computing Methodologies and Communication (ICCMC) (pp. 79-84). IEEE.
[12] Grier, C., Thomas, K., Paxson, V., & Zhang, M. (2010, October). spam: the underground on 140 characters or less. In Proceedings of the 17th ACM conference on Computer and communications security (pp. 27-37).
[13] Gupta, S., Khattar, A., Gogia, A., Kumaraguru, P., & Chakraborty, T. (2018, April). Collective classification of spam campaigners on Twitter: A hierarchical meta-path based approach. In Proceedings of the 2018 World Wide Web Conference (pp. 529 -538).
[14] Jorge Rodríguez-Ruiz, Javier Israel Mata-Sánchez, Raúl Monroy, Octavio Loyola-González, Armando López-Cuevas (2020) A one-class classification approach for bot detection on Twitter, Computers & Security, Volume 91, 101715, ISSN 0167-4048, https://doi.org/10.1016/j.cose.2020.101715.
[15] Kim, Y. (2014). Convolutional neural networks for sentence classification. arXiv preprint:1408.5882.
[16] Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2017). Imagenet classification with deep convolutional neural networks. Communications of the ACM, 60(6), 84-90.
[17] Lakshmana Phaneendra Maguluri; R. Ragupathy; Sita Rama Krishna Buddi; Vamshi Ponugoti Tharun Sai KalimilAdaptive Prediction of Spam Emails: Using Bayesian Inference, 2019 3rd International Conference on Computing Methodologies and Communication (ICCMC).
[18] Le, Q., & Mikolov, T. (2014, January). Distributed representations of sentences and documents. In International conference on machine learning (pp. 1188-1196).
[19] LeCun, Y., Bottou, L., Bengio, Y., & Haffner, P. (1998). Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11), 2278-2324.
[20] Lee, B. D. Eoff, and J. Caverlee, “Seven months with the devils: A long-term study of content polluters on Twitter,” in Proc. ICWSM, 2011, pp. 185-192.
[21] Maâli Mnasri, How to train word embeddings using small datasets?. 2019. https://medium.com/opla/how-to-train-word-embeddings-using-small-datasets-9ced58b58fde
[22] Madisetty, S., & Desarkar, M. S. (2018). A neural network-based ensemble approach for spam detection in Twitter. IEEE Transactions on Computational Social Systems, 5(4), 973-984.
[23] Martinez-Romo, J., & Araujo, L. (2013). Detecting malicious tweets in trending topics using a statistical analysis of language. Expert Systems with Applications, 40(8), 2992-3000.
[24] Niculescu-Mizil, A., Perlich, C., Swirszcz, G., Sindhwani, V., Liu, Y., Melville, P & Shang, W. X. (2009, December). Winning the KDD cup orange challenge with ensemble selection. In KDD-Cup 2009 Competition (pp. 23-34).
[25] Ohana, B., & Tierney, B. (2009, October). Sentiment classification of reviews using SentiWordNet. In 9th. it & t conference (Vol. 13, pp. 18-30).
[26] oriented spam research. In Proceedings of the 38th International ACM SIGIR Conference on Research and Development in Information Retrieval (pp. 223-232).
[27] Patil, D. R., & Patil, J. B. (2018). Malicious URLs detection using decision tree classifiers and majority voting technique. Cybernetics and Information Technologies, 18(1), 11-29.
[28] Perveen, N., Missen, M. M. S., Rasool, Q., & Akhtar, N. (2016). Sentiment based twitter spam detection. International Journal of Advanced Computer Science and Applications (IJACSA), 7(7), 568- 573.
[29] Santos, I., Miñambres-Marcos, I., Laorden, C., Galán-García, P., Santamaría-Ibirika, A., & Bringas, - -CISIS’ P. G. (2014). Twitter content-based spam filtering. In International Joint Conference SOCO’ (pp. 449-458). Springer, Cham. ICEUTE.
[30] Sedhai, S., & Sun, A. (2017). Semi-supervised spam detection in Twitter stream. IEEE Transactions on Computational Social Systems, 5(1), 169-175.
[31] Shen, H., Ma, F., Zhang, X., Zong, L., Liu, X., & Liang, W. (2017). Discovering social spammers from multiple views. Neurocomputing, 225, 49-57.
[32] Töscher, A., Jahrer, M., & Bell, R. M. (2009). The bigchaos solution to the netflix grand prize. Netflix prize documentation, 1-52.
[33] Valerie Niechai, How to Use TF -IDF for SEO, 2019, How to use TF-IDF tools for semantic SEO (link-assistant.com).
[34] Van de Vegte, J. (1990). Feedback Control Systems (2nd ed.). Prentice Hall.
[35] Wang, A. H. (2010, July). Don't follow me: Spam detection in twitter. In 2010 international conference on security and cryptography (SECRYPT) (pp. 1 -10). IEEE.
[36] Wang, B., Zubiaga, A., Liakata, M., & Procter, R. (2015). Making the most of tweet-inherent features for social spam detection on Twitter. arXiv preprint arXiv:1503.07405.
[37] X. Zhang, Y. Feng, H. Shen, and W. Liang, “Differential trust propagation with community discovery for link-based Web spam demotion,” in Proc. Int. Conf. Web- Age Inf. Manage. Cham, Switzerland: Springer, 2015, pp. 452-456.
[38] Yang C, Harkreader R, Gu G. Empirical evaluation and new design for fighting evolving twitter spammers. IEEE Trans InfForensics Secur 2013;8(8):1280-93.
-
کلمات کلیدی به فارسی :
هرزنامه، اسپم، تحلیل احساسات، توییت، یادگیری ماشین، شبکه عصبی مصنوعی.
-
چکیده مقاله به انگلیسی :
-
کلمات کلیدی به انگلیسی :
- صفحات : 1-18
-
دانلود فایل
( 1.69 MB )