Dissertation: Computerlinguistische Methoden in Community-basierten Anwendungen

Computerlinguistische Methoden in Community-basierten Anwendungen

INTERNET – Praxis und Zukunftsanwendungen des Internets, Band 16

Hamburg 2014, 208 Seiten
ISBN 978-3-8300-8076-3 (Print & eBook)

ARTigo, Bildannotation, Clustering, Crowdsourcing, Games with a Purpose, Kunstwerktagging, Rechtschreibkorrektur, Semantische Relationen

Zum Inhalt

Community-basierte Anwendungen gewinnen zunehmend an Popularität. Kollaboratives Arbeiten wird zur Erstellung von vielseitigen Datenbeständen genutzt. Zu den Einsatzbereichen zählen Online-Enzyklopädien, Wörterbücher, Dokumentsammlungen, Annotationsplattformen für Bilder, Musikstücke oder Dokumente. Und es entstehen immer neue Ideen und Ansätze um ein breites Publikum für kollaboratives Arbeiten zu gewinnen.

Die Online-Plattform ARTigo gehört zu den Anwendungen dieser Art. Im spielerischen Umfeld werden hier Kunstwerke annotiert. Am Beispiel dieser Plattform werden in dieser Studie die Möglichkeiten, computerlinguistische Ressourcen und Methoden gewinnbringend für die Datenerzeuger und Datennutzer einzubinden, aufgedeckt und bewertet.

Die über 3.000.000 Schlagworte enthaltende Datensammlung wird auf semantische und morphologische Verbindungen untersucht und das Verhalten der Spieler bezüglich dieser Merkmale beobachtet. Es wird auf die Fragen eingegangen, welche Begriffe aus der Sicht der Nutzer und der Forscher besonders wertvoll sind und wie die Erzeugung solcher Daten gefördert werden kann.

Neben den theoretischen Untersuchungen wird die Umsetzung und Bewertung von praktischen Anwendungen beschrieben. So wird die Entwicklung der Rechtschreibkorrektur für die Plattform sowie die Implementierung der tagbasierten Ähnlichkeitssuche für Kunstwerke erörtert. Das Thema Ähnlichkeit von Kunstwerken nimmt eine besondere Position in der Arbeit ein. In mehreren Studien wird die Wichtigkeit von verschiedenen Merkmalen für das Ähnlichkeitsempfinden untersucht. Auf dieser Basis wird der optimale Berechnungsalgorithmus ermittelt. Ein weiterer großer Forschungsbereich ist dem Thema komplexe Annotationen gewidmet. Einfache Schlagworte werden durch automatisierte Zusammensetzung auf Phrasen und ganze Sätze ausgebaut. Auch die Verwendungsmöglichkeiten von produzierten Phrasen werden diskutiert.

Nebenbei wird im Laufe der Abhandlung erörtert, welche frei zugänglichen Ressourcen sich für den Einsatz in Community-basierten Anwendungen gut eignen.



Informationen über das Veröffentlichen wissenschaftlicher Arbeiten.

nach oben