СЕГМЕНТАЦІЯ ТЕКСТУ В БАГАТОСТОРОННІХ ДІАЛОГАХ

Автор(и)

  • Надія Вікторівна Бабкова Національний технічний університет «Харківський політехнічний інститут», Україна https://orcid.org/0000-0002-2200-7794
  • Діна Олександрівна Гулієва Національний технічний університет «Харківський політехнічний інститут», Україна https://orcid.org/0000-0001-8310-745X
  • Зоя Анатоліївна Кочуєва Національний технічний університет «Харківський політехнічний інститут», Україна https://orcid.org/0000-0002-4300-3370
  • Наталія Сергіївна Угольнікова Національний технічний університет «Харківський політехнічний інститут», Україна https://orcid.org/0000-0003-2322-0922

DOI:

https://doi.org/10.20998/2227-6890.2025.1.11

Ключові слова:

сегментація тексту, BERT-ембедінги, обробка природної мови, лінгвістичні ознаки, автоматичне розпізнавання мовлення

Анотація

У статті йдеться про повноцінний відкритий інструмент, що дозволяє виконувати сегментацію діалогів кількох учасників з використанням мінімального обсягу навчальних текстів або без його використання; доведено, що основною проблемою існуючих рішень є неповноцінність їх інструментів, які виступають лише демонстрацією можливих способів решения; запропоновано гібридну модель сегментації, що базується на використанні ембедінгів BERT та деяких лінгвістичних ознак, унікальних для діалогів кількох учасників; представлено хороші результати моделі, які можна порівняти з провідними результатами, описаними в роботах за цією тематикою; підсумком роботи стало створення повноцінного інструменту, що дозволяє автоматично відтворювати сегментацію.

Біографії авторів

Надія Вікторівна Бабкова, Національний технічний університет «Харківський політехнічний інститут»

Кандидат технічних наук, доцент, завідувач кафедри інтелектуальних комп’ютерних систем

Діна Олександрівна Гулієва, Національний технічний університет «Харківський політехнічний інститут»

Кандидат філологічних наук, доцент, доцент кафедри інтелектуальних комп’ютерних систем

Зоя Анатоліївна Кочуєва , Національний технічний університет «Харківський політехнічний інститут»

Кандидат технічних наук, доцент, доцент кафедри інтелектуальних комп’ютерних систем

Наталія Сергіївна Угольнікова, Національний технічний університет «Харківський політехнічний інститут»

Кандидат філологічних наук, доцент кафедри інтелектуальних комп’ютерних систем

Посилання

Zeng, Y., Li, J., Zhao, L., Kang, Y., Sun, C., Zhang, Q., & He, X. (2021). Unsupervised dialogue summarization with topic-aware ranking and context modeling. In Proc. of AAAI 2021, 35(16), 14674–14682.

Inan, H., Rungta, R., & Mehdad, Y. (2022). Structured summarization: Unified text segmentation and segment labeling as a generation task. In Findings of EACL 2022 (pp. 883–893). Association for Computational Linguistics.

Zhang, Y., Liu, Y., Xu, Y., Zhu, C., & Zeng, M. (2022). DialogLM: Pre-trained model for long dialogue understanding and summarization. In Proc. of AAAI 2022, 36(10), 10965–10973.

Xing, L., & Carenini, G. (2021). Improving unsupervised dialogue topic segmentation with utterance-pair coherence scoring. In Proc. of SIGDIAL 2021 (pp. 167–177). Association for Computational Linguistics.

Solbiati, A., Yvon, F., & Joly, A. (2021). Dialogue topic segmentation for meeting transcripts using BERT embeddings. In Proc. of IEEE SLT 2021 (pp. 757–764). IEEE.

Matsumoto, K., Sasayama, M., & Kirihara, T. (2022). Topic break detection in interview dialogues using sentence embedding of utterance and speech intention based on multitask neural networks. Sensors, 22(2), 694.

Nair, I., Garimella, A., Srinivasan, B. V., Modani, N., Chhaya, N., Karanam, S., & Shekhar, S. (2023). A neural CRF-based hierarchical approach for linear text segmentation. In Findings of ACL 2023 (pp. 883–893). Association for Computational Linguistics.

Wu, C.-S., Hoi, S., Socher, R., & Xiong, C. (2020). TOD-BERT: Pre-trained natural language understanding for task-oriented dialog. In Proc. of EMNLP 2020 (pp. 917–929). Association for Computational Linguistics.

Das, R., Goyal, P., Kale, D., & Hakkani-Tür, D. (2024). Structured open-domain dialogue segmentation and state tracking. (Preprint arXiv:2403.00027).

Feng, S., et al. (2021). MultiDoc2Dial: Modeling dialogues grounded in multiple documents. In Proc. of EMNLP 2021 (pp. 5847–5860). Association for Computational Linguistics.

##submission.downloads##

Опубліковано

2025-08-07