Domain-Independent Extraction of Insights from User Comments

Häring, Marlo Atib

Titel:	Domain-Independent Extraction of Insights from User Comments
Sprache:	Englisch
Autor*in:	Häring, Marlo Atib
Schlagwörter:	Data Analytics; User comment analytics; Online Journalism; Software engineering; App store analytics; Natural language processing; Deep learning; Software repositories
GND-Schlagwörter:	Maschinelles LernenGND DatenanalyseGND Qualitative MethodeGND Quantitative MethodeGND Social Media Natürliche Sprache Deep learningGND InhaltsanalyseGND Online-MedienGND
Erscheinungsdatum:	2021
Tag der mündlichen Prüfung:	2021-07-07
Zusammenfassung:	Nowadays, user comments are an essential part of online platforms. Users submit their comments to express their opinions, provide feedback, or discuss the online platform's products. This thesis focuses on user comments in the two domains, online journalism and app development. In online journalism, users comment on diverse articles on news sites. In the app development domain, users submit user comments as app reviews in app stores. Although user comments are primarily associated with destructive contributions such as hate speech, research showed that domain experts clearly understand the potential of constructive user comments to improve their product. However, domain experts are often overwhelmed by the vast number and diverse comments, for which a manual analysis is barely feasible. In this thesis, we first identified the domain experts' challenges with user comments and identified requirements to provide tool-support for the comment analysis. One particular feature that supports domain experts to extract insights is the automatic detection of aspect addressings in user comments. We designed a domain-independent machine learning pipeline, which combines the domain expert's knowledge with state-of-the-art text embeddings, deep learning methods, and natural language processing techniques. We used our pipeline in four different studies, two in the online journalism domain and two in the app development domain, to validate its applicability. With these studies, we contributed to the state-of-the-art in user comment mining and extracted insights for the respective domain experts. Finally, we developed a domain-independent comment analysis prototype (DICAP) based on our pipeline. DICAP provides machine learning support for domain experts to identify addressings to custom aspects in user comments. DICAP's source code is published under the Apache License 2.0. We evaluated DICAP's classification performance in the online journalism and app development domain. We achieved promising results in both domains already after a few annotations (n >= 100) with a short training time (t = 0.1s). Our evaluation time measurements show that DICAP is also applicable at a larger scale with millions of user comments. Our work enables the domain-independent extraction of insights from user comments to support domain experts in improving their products. Heutzutage sind Nutzerkommentare ein wichtiger Bestandteil von Online-Platt\-formen. Nutzer schreiben ihre Kommentare, um ihre Meinung zu äußern, Feedback zu geben oder über das Produkt der Online-Plattform zu diskutieren. Diese Dissertation untersucht die Nutzerkommentare in der Online-Journalismus- und der App-Entwicklungs-Domäne. Im Online-Journalismus kommentieren Nutzer diverse Artikel auf Online-Nachrichtenseiten. In der App-Entwicklungs-Domäne schreiben Nutzer Kommentare in Form von App-Rezensionen in App-Stores. Obwohl Nutzerkommentare in erster Linie mit destruktiven Beiträgen wie Hassreden in Verbindung gebracht werden, haben Studien gezeigt, dass Domänenexperten das Potenzial konstruktiver Nutzerkommentare nutzen können um ihre Produkte zu verbessern. Allerdings sind Domänenexperten oft wegen der großen Anzahl und Vielfalt an Kommentaren überfordert und eine manuelle Analyse wird oft als nicht rentabel angesehen. In dieser Dissertation haben wir zunächst die Herausforderungen der Domänenexperten im Umgang mit Nutzerkommentaren identifiziert und Anforderungen an eine Software-Plattform für die Kommentaranalyse ermittelt. Ein besonderes Feature, das Domänenexperten bei der Gewinnung von Erkenntnissen unterstützt, ist die automatische Erkennung von Aspektadres\-sierungen in Nutzerkommentaren. Wir haben eine domänenunabhängige Machine-Learning-Pipeline entworfen, die das Wissen der Domänenexperten mit modernsten Texteinbettungen, Deep-Learning-Methoden und Techniken zur Verarbeitung natürlicher Sprache kombiniert. Wir haben unsere Pipeline in vier verschiedenen Studien eingesetzt, zwei in der Domäne Online-Journalismus und zwei in der Domäne App-Entwicklung, um die Anwendbarkeit zu validieren. Innerhalb dieser Studien leisteten wir einen Beitrag zum Stand der Technik in der Kommentaranalyse und extrahierten Erkenntnisse für die Experten in der jeweiligen Domäne. Schließlich entwickelten wir, basierend auf unserer Pipeline, einen domänenunabhängigen Prototyp zur Kommentaranalyse (DICAP). DICAP unterstützt Domänenexperten mit maschinellem Lernen bei der Erkennung von benutzer\-definierten Aspektadressierungen in Nutzerkommentaren. Den Quellcode von DICAP haben wir unter der Apache License 2.0 veröffentlicht. Wir haben DICAP's automatische Klassifizierungen im Online-Journalismus und der App-Entwicklung evaluiert. In beiden Domänen erreichten wir bereits mit wenigen Annotationen (n >= 100) vielversprechende Ergebnisse mit einer kurzen Trainingszeit (t = 0.1s). Unsere Zeitmessungen der Evaluation zeigen, dass DICAP auch für eine Anwendung in größerem Maßstab mit Millionen von Nutzerkommentaren einsetzbar ist. Unsere Arbeit ermöglicht die domänenunabhängige Extraktion von Erkenntnissen aus Benutzerkommentaren, um Domänenexperten bei der Verbesserung ihrer Produkte zu unterstützen.
URL:	https://ediss.sub.uni-hamburg.de/handle/ediss/9100
URN:	urn:nbn:de:gbv:18-ediss-93858
Dokumenttyp:	Dissertation
Betreuer*in:	Maalej, Walid
Enthalten in den Sammlungen:	Elektronische Dissertationen und Habilitationen

Dateien zu dieser Ressource:

Datei	Beschreibung	Prüfsumme	Größe	Format
Dissertation_Haering_2021.pdf		5d25800328335be270b16eed6c78f939	8.22 MB	Adobe PDF	Öffnen/Anzeigen

Zur Langanzeige

Info

Seitenansichten

536

Letzte Woche

Letzten Monat

geprüft am 15.08.2025

Download(s)

1.651

Letzte Woche

Letzten Monat

geprüft am 15.08.2025

Werkzeuge

Google Scholar^TM

Prüfe

Dateien zu dieser Ressource:

Seitenansichten

Download(s)

Google ScholarTM

Google Scholar^TM