ЕКОНОМІЧНА ВАРТІСТЬ ФІНАНСОВИХ ФЕЙКОВИХ НОВИН НА ЄВРОПЕЙСЬКИХ РИНКАХ КАПІТАЛУ
Ключові слова:
великі дані, європейські ринки капіталу, економічна вартість, маніпулювання ринком, обробка природної мови, прийняття фінансових рішень, фінансова дезінформація.Анотація
Дезінформація у фінансових новинах – це системний ризик, який спотворює механізм виявлення цін та алокацію капіталу, збільшуючи інформаційну асиметрію та послаблюючи довіру інвесторів. У цьому дослідженні розроблено придатний до масштабування рамковий підхід, що поєднує обробку природної мови (NLP) та машинне навчання для виявлення оманливих фінансових наративів у великих цифрових корпусах текстів з використанням великих даних. Після нормалізації тексту, лематизації та вилучення стопслів, у рамках такого підходу виконано порівняння методів TF-IDF та Word2Vec і проведено навчання класифікаторів Logistic Regression, Random Forest та Gradient Boosting. Ефективність підходу оцінено метриками Accuracy (точність), Precision (влучність), Recall (повнота), F1-score (F1-міра) та ROC-AUC (площа під ROC-кривою). У всіх моделях TF-IDF забезпечує кращу дискримінаційну здатність, ніж Word2Vec. TF-IDF у поєднанні з Random Forest показує майже ідеальні результати (ROC-AUC 0,9999; влучність 0,9977). Сфокусованість на прозорих, заснованих на ознаках моделях забезпечує кращу аудитабельність (наприклад, через важливість ознак) і допомагає обмежити кількість шкідливих хибно позитивних результатів, які можуть подавляти справжні сигнали. Результати показують, що високоточні, придатні до інтерпретації, NLP-конвеєри можуть скоротити верифікаційний розрив у швидкозмінних інформаційних середовищах, зменшити макроекономічні втрати від неправдивих наративів та забезпечувати інформацією процеси ринкового нагляду відповідно до вимог Закону про цифрові послуги (Digital Services Act) та Європейського управління з цінних паперів і ринків (European Securities and Markets Authority, ESMA). Такий підхід призначений для розгортання на потокових новинних стрічках і великих архівах платформ.
Класифікація за JEL: G14, D82, C55.
Посилання
Ahmad, I., Yousaf, M., Yousaf, S., & Ahmad, M. O. (2020). Fake news detection using machine learning ensemble methods. Complexity, Article 8885861. https://doi.org/10.1155/2020/8885861
Alghamdi, J., Luo, S., & Lin, Y. (2024). A comprehensive survey on machine learning approaches for fake news detection. Multimedia Tools and Applications, 83, 51009–51067. https://doi.org/10.1007/s11042-023-17470-8
Alshuwaier, F. A., & Alsulaiman, F. A. (2025). Fake news detection using machine learning and deep learning algorithms: A comprehensive review and future perspectives. Computers, 14(9), Article 394. https://doi.org/10.3390/computers14090394
Cheng, L.-C., Lu, W.-T. & Yeo, B. (2023). Predicting abnormal trading behavior from internet rumor propagation: A machine learning approach. Financial Innovation, 9, Article 3. https://doi.org/10.1186/s40854-022-00423-9
Du, K., Xing, F., Mao, R., & Cambria, E. (2024). Financial sentiment analysis: Techniques and applications. ACM Computing Surveys, 56(9), 1–42. https://doi.org/10.1145/3649451
D’Ulizia, A., Caschera, M. C., Ferri, F., & Grifoni, P. (2021). Fake news detection: A survey of evaluation datasets. PeerJ Computer Science 7, Article e518. https://doi.org/10.7717/peerj-cs.518
European Parliament & Council of the European Union. (2014). Regulation (EU) No. 596/2014 of the European Parliament and of the Council of 16 April 2014 on market abuse (market abuse regulation) and repealing Directive 2003/6/EC of the European Parliament and of the Council and Commission Directives 2003/124/EC, 2003/125/EC and 2004/72/EC and Commission Decision 2004/693/EC. Official Journal of the European Union, L 173, 1–142. https://eur-lex.europa.eu/eli/reg/2014/596/oj
European Parliament & Council of the European Union. (2022). Regulation (EU) 2022/2065 of the European Parliament and of the Council of 19 October 2022 on a Single Market for Digital Services and amending Directive 2000/31/EC (Digital Services Act). Official Journal of the European Union, L 277, 1–102. https://eur-lex.europa.eu/eli/reg/2022/2065/oj
Hu, L., Wei, S., Zhao, Z., & Wu, B. (2022). Deep learning for fake news detection: A comprehensive survey. AI Open, 3, 133–155. https://doi.org/10.1016/j.aiopen.2022.09.001
kaggle.com. (n.d.). Fake and real news dataset [Data set]. Retrieved July 17, 2025, from https://www.kaggle.com/datasets/clmentbisaillon/fake-and-realnews-dataset
Larcker, D. F., & Zakolyukina, A. A. (2012). Detecting deceptive discussions in conference calls. Journal of Accounting Research, 50(2), 495–540. https://doi.org/10.1111/j.1475-679X.2012.00450.x
Loughran, T., & McDonald, B. (2011). When is a liability not a liability? Textual analysis, dictionaries, and 10‐Ks. The Journal of Finance, 66(1), 35–65. https://doi.org/10.1111/j.1540-6261.2010.01625.x
Lyzun, M., Desyatnyuk, O., Savelyev, Y., Kuryliak, V., Sachenko, S., Lishchynskyy, I. (2023). Architectonics of the European Currency Integration: Cluster and Gravity Modeling. 2023 IEEE 12th International Conference on Intelligent Data Acquisition and Advanced Computing Systems: Technology and Applications (IDAACS), Dortmund, Germany, 2023, pp. 661–664. https://doi.org/10.1109/IDAACS58523.2023.10348652
Lyzun, M., Lishchynskyy, I., Savelyev, Y., Kuryliak, V. and Kurylyak, Y. (2019). Modeling Evaluation of Dollarization Economic Efficiency. International Conference on Advanced Computer Information Technologies (ACIT). Ceske Budejovice, Czech Republic: 366–370.
Majumdar, A., & Bose, I. (2018). Detection of financial rumors using big data analytics: The case of the Bombay Stock Exchange. Journal of Organizational Computing and Electronic Commerce, 28(2), 79–97. https://doi.org/10.1080/10919392.2018.1444337
Mishra, S., Shukla, P., & Agarwal, R. (2022). Analyzing machine learning enabled fake news detection techniques for diversified datasets. Wireless Communications and Mobile Computing, Article 1575365. https://doi.org/10.1155/2022/1575365
Nghiem, H., Muric, G., Morstatter, F., & Ferrara, E. (2021, November). Detecting cryptocurrency pump-and-dump frauds using market and social signals. Expert Systems with Applications, 182, Article 115284. https://doi.org/10.1016/j.eswa.2021.115284
Rangapur, A., Wang, H., Jian, L., & Shu, K. (2025, April 28-May 2). Fin-Fact: A benchmark dataset for multimodal financial fact-checking and explanation generation. In WWW Companion’25: Companion Proceedings of the ACM Web Conference 2025 (pp. 785–788). ACM. https://doi.org/10.1145/3701716.3715292
Selyukh, A. (2013, April 24). Hackers send fake market-moving AP tweet on White House explosions. Reuters. https://www.reuters.com/article/technology/hackerssend-fake-market-moving-ap-tweet-on-white-house-explosions-idUSBRE93M12Y/
Theodorakopoulos, L., Theodoropoulou, A., Tsimakis, A., & Halkiopoulos, C. (2025). Big Data-driven distributed machine learning for scalable credit card fraud detection using PySpark, XGBoost, and CatBoost. Electronics, 14(9), Article 1754. https://doi.org/10.3390/electronics14091754
Отримано: 7 листопада 2025 р.
Рецензовано: 10 березня 2026 р.
Рекомендовано до друку: 20 березня 2026 р.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:
- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).





