Wikipedia:WikiProjekt KI und Wikipedia
Essentials |
Diskussion |
Hintergrund |
Texte |
Übersetzung |
Bild/Video/Musik |
Qualitätssicherung |
Interesse |
Ziele des Projektes… sind offen und hängen von den Herausforderungen, vom Interesse der Beteiligten, den vorhandenen zeitlichen Ressourcen und den Kompetenzen ab. Vielleicht braucht es zukünftig für Themen Arbeitsgruppen.
Wir wollen auch das Format des Digitalen Themenstammtisches als Stammtisch und Forum mit nutzen, um zukünftig Veranstaltungen zu einzelnen konkreten Themen dort durchzuführen. Struktur der Darstellung ("Reiter" oben):
|
KI verstehen[Quelltext bearbeiten]Die Auswahl erfolgt so sparsam wie möglich, um einen Überblick zu erhalten. Mehr in „Hintergrund“ und der zahlreichen anderen Literatur zum Thema. Eines der Standardwerke für die Einführung in die KI samt ihrer Geschichte und ethischer Überlegungen ist Artificial Intelligence: A Modern Approach (AIMA, enwiki). Einführungen[Quelltext bearbeiten]Glossare[Quelltext bearbeiten]Fachbegriffe und ihre Beziehungen korrekt verstehen:
Einführende Info[Quelltext bearbeiten]
Generative KI[Quelltext bearbeiten]
→ Man unterscheidet bei generativen KI-Chatbots beispielsweise textbasierte Chatbots (ChatGPT u.a.), bildgenerierende Chatbots (Text to image, oft in erstere integriert, brauchen auch das Sprachverstehen), Video-Chatbots (ähnlich für Videos), Chatbots für Musik,... und sprachbasierte Chatbots (Voicebots mit gesprochener Sprache bei Frage und Antwort) Die Unterschiede verschwimmen auch deshalb, weil die meisten hybrid sind und mehrere dieser Funktionen integrieren und das Sprachverstehen (Large Language Models LLM) brauchen (subjektive Zusammenfassung mehrerer Quellen).
Wie es weitergehen kann[Quelltext bearbeiten]Hinter dem "Hype" geht die Entwicklung weiter.
Kurse (online und Auswahl, weitere siehe Hintergründe)[Quelltext bearbeiten]
|
Probleme[Quelltext bearbeiten]Was macht generative KI problematisch? Die heuristische Herangehensweise, die zu Falschaussagen führen kann[Quelltext bearbeiten]→ Man unterscheidet 2 Fehler-Typen, „Halluzination“ und Bias als Verzerrungen (Analogie: Kognitive Verzerrung).
→ Für die korrekte Wissensdarstellung (Wikipedia) als begründbare, wahre Überzeugung ist bei generativen KI-Modellen problematisch, dass weder der Wahrheitsgehalt ihrer Aussagen noch ihre Begründetheit ohne externe Prüfung nachvollziehbar ist (siehe Evaluation).
→ Beim Trainingprozess eines generativen KI-Modells wird lediglich eine statistische Analyse der Häufigkeit und Nähe von Wortfragmenten zueinander analysiert. Selbst die Verwendung des Wikipedia-Wissens für das Training von KI bedeutet nicht, dass das Modell automatisch das gesicherte Wissen der Wikipedia deterministisch abrufen und wiedergeben kann. Die Modelle sind daraufhin optimiert, für Menschen überzeugende Ausgaben zu generieren, ein reines Sprachmodell kann von sich aus aber keine logischen Schlüsse ziehen (siehe z.B. Mirzadeh, Iman, et al. 2024.) Hinzu kommt das Problem der Selbstreferenzialität. Wenn der Inhalt z.B. von Wikipedia für das Sprachmodelltraining verwendet wird, pflanzen sich die Fehler als "gesichertes kuratiertes" Wissen fort, wofür Wikipedia immer noch steht. Wie im Cartoon dargestellt (AI Hackathon Oktober 2024) wird das als "Whirlpool" (auch mit Strudel übersetzbar) bezeichnet und die "Verdünnung" kuratierten Wissens würde fortschreiten. Wikipedia ist zwar keine Quelle für Wikipedia, es würde z.B. über Primärquellen einfliessen können, die bei der Erstellung generative KI nutzen und die dann wiederum in Wikipedia zitiert werden können. Strudel scheint daher recht zutreffend. Bias (Verzerrung) und Fairness[Quelltext bearbeiten]entspricht in Analogie den menschlichen Urteilsfehlern, die über die Trainingsdaten und die Entwicklung der KI selber Eingang finden.
Evaluation der Modelle hinsichtlich der Güte/Fehlerfreiheit[Quelltext bearbeiten]Wichtig sind objektive Studien zur Evaluation der generativen KI und der Erkennungsgüte von KI-generierten Inhalten. Wegen der Dynamik sollte man immer die neuesten Daten nehmen.
Vergleiche verschiedener Modelle[Quelltext bearbeiten]
Kritischer Umgang mit KI ist ausreichend?[Quelltext bearbeiten]Die "gesamtgesellschaftliche" Perspektive ist hier zu berücksichtigen, insofern es auch den Umgang mit Wissensinhalten betrifft. Können wir auf den kritischen Autor und Leser verlassen? → Hier bestehen Bedenken, dass ein kritischer Einsatz tatsächlich vorhanden ist und vor allem in jüngeren Generationen scheint man das deutlich gelassener zu sehen.
|
Wikiversum[Quelltext bearbeiten]Wir sind nicht die Enzigen im Wikiversum, die sich mit dem Thema beschäftigen. Zahlreiche Initiativen arbeiten schon länger an diesem Thema, haben die Tragweite erkannt und erarbeiten Konzepte, wie man den Herausforderungen begegnen kann. Einschätzungen der Lage[Quelltext bearbeiten]
Initiativen zu KI[Quelltext bearbeiten]Erfahrungsaustausch scheint wichtig auch weil wir hier vielleicht diesen Einfluss noch nicht so deutlich spüren wie andere, etwa die englischsprachige Wikipedia.
AI Cleanup (englischsprachige WP)[Quelltext bearbeiten]Systematische Suche und Behandlung KI-erstellter Texte sowie Hinweise an die erstellenden Autoren, rund 100 Mitarbeiter, Erarbeitung von Kriterien zur Identifikaton und einheitliche Hinweise, Benutzeransprachen und Wartungskategorien:
Wie verbreitet ist KI bereits in Wikipedia?[Quelltext bearbeiten]
Auf dem Weg zum richtigen Umgang mit KI in Wikipedia[Quelltext bearbeiten]In einer Chronik des Projektes hat diese Umfrage einen herausragenden Platz, die Initative von Karsten11 hat verbunden mit der Fortführung der Diskussion in seinem BNR und durch den Impuls des Zukunftskongresses zur Gründung des Projektes geführt. Es hat auch früher und anderswo Stimmen und Veranstaltungen zu diesem Thema gegeben, die nicht vergessen werden sollten. Sie können nun im Projekt sichtbarer dokumentiert und eingeordnet werden. Umfrage (nicht verbindlich)[Quelltext bearbeiten]
Regelsuche in Schwesterprojekten[Quelltext bearbeiten]
Rechtsfragen Wikiversum[Quelltext bearbeiten]siehe auch: Rechtsfragen und Rechtsstreit auf Hintergründe
|
Tools und Tipps[Quelltext bearbeiten]Die Auswahl erfolgt aufgrund des recherchierten Wissensstandes mit dem Ziel, wichtige Tools aufzulisten, mit denen man Erfahrungen sammeln kann - ohne Bevorzugung Einzelner. ACHTUNG: Fehler (Halluzinationen) können auch bei Recherchen bzw. dem Einsatz als Hilfsmittel auftreten. Einige Tools sind kostenpflichtig in den neuesten und nicht nutzungsbegrenzten Versionen. In dieser Tabelle sieht man, dass bei geeigneter Auswahl auf die neusten Modelle kostenfrei zurückgegriffen werden kann, wenn die dort genutzten Quellen stimmen. Spezifische Tools für Bilder/Video und Musik stehen nicht hier, ggf. auf den Themenseiten. KI-basierte Chatbots (generative KI)[Quelltext bearbeiten]Einzelne Chatbots nutzen gleiche oder unterschiedliche Large Language Models (LLM), siehe Tabelle auf "Hintergründe" ganz unten. Die Zahl der Chatbots nimmt aktuell zu, die Übersicht wird schwerer. Textbasierte sind Schwerpunkt der Auswahl. Einige davon können nicht nur Texte erzeugen, sondern auch Medien (Bilder). Einige greifen neben den "gelernten" Inhalten auch aktuell auf das Internet zurück und bereiten Echtzeitdaten mit in ihren Antworten mit auf.[1] Von den meisten gibt es auch Apps. Wenn man genau liest, kommt man auch zu einer kostenfreien Version - entweder mit begrenzten Aufrufen in einem Zeitraum oder nicht mit dem vollen Funktionsumfang. Anmeldung ist oft notwendig oder sinnvoll, um die Ergebisse zu speichern), es wird eine E-Mail-Adresse verlangt, die bestätigt werden muss.
Siehe auch: Hintergrundinformation zu generativen Chatbots Voicebots (Sprachbots)[Quelltext bearbeiten]als Sprachassistenten, die in gesprochener Sprache interagieren und KI verwenden. Allgemein sind z.B. verwendbar:
Darüber hinaus setzen viele Unternehmen, besonders in den Bereichen Kundenservice, Finanzdienstleistungen und E-Commerce, zunehmend auf Voicebots in ihren Telefonhotlines. Diese sind zwar nicht allgemein aufrufbar, aber für Kunden dieser Unternehmen zugänglich.
Tools zum Umschreiben, Vereinfachen, Zusammenfassen und Korrigieren von Text[Quelltext bearbeiten]Hier kann man prüfen, ob diese Verbesserungen durch KI zu falschpositiven Ergebnissen in den Erkennungstools führen, weil bestimmte Formulierungen als typisch für KI angesehen werden. Ein kuratierter Ausgangs-Text kann auch sinnentstellend verändert werden, er muss daher genau geprüft werden.
Siehe auch: Hintergrundinformation zu KI als Hilfsmittel Tools für die Übersetzung[Quelltext bearbeiten]Eine genaue Überprüfung ist notwendig, wird als en:Postediting bezeichnet. Siehe auch: Hintergrundinformation Übersetzungstools Einsatz von Modellen auf einem lokalen Rechner[Quelltext bearbeiten]Eine Reihe von Modellen steht auf Plattformen wie Hugging Face zu bestimmten Bedingungen (analog zu Freeware) zum Download zur Verfügung. Sie können mit passenden Werkzeugen damit lokal auf dem eigenen Rechner ausgeführt und getestet werden.
Tools für das Erkennen KI-generierter Inhalte[Quelltext bearbeiten]Einige Tools kann man hinsichtlich der Sensibilität einstellen.
... ---
Tools und Tipps zum Umgehen der Erkennung als KI-generiert[Quelltext bearbeiten]Das Problem der KI-Nutzung haben viele Bereiche, einfache Plagiate waren gestern. Alle Prüfungs- und Qualifizierungsarbeiten können betroffen sein, wenn diese nicht mehr ausreichend den eigenen Kenntnisstand repräsentieren, sondern von KI (mit)geschrieben wurden. Es gibt zahlreiche Tools und Tipps, diese Erkennung zu verhindern. Sie sind für Wikipedia insofern auch relevant, dass sie die Erkennbarkeit als KI-generiert beeinträchtigen.
... |
Anmerkungen
[Quelltext bearbeiten]- ↑ Bobachtung: Der neue Artikel Günter Trost von mir brauchte eine Woche, ehe er in den Google-Suchergebissen erschien. Nachfragen in diversen Chatbots , ob es in der Wikipedia zu ihm einen Artikel gibt, wurden verneint und auch die Info von dort wurden nicht verwendet (aber andere aus dem Internet, die schon länger drin sind und auch durch "Training" reingekommen sein könnten). Am gleichen Tag wo es in Google Search erschien, kannte auch Perplexity den und fasst den perfekt zusammen. Gibt es da "Wechselbeziehungen"? Wo
Medien wie Bilder, Grafiken und andere stammen in der Regel aus Wikimedia:Commons, wenn nichts anderes angegeben ist. Die Autoren und Lizenzbedingungen sind ersichtlich, wenn man das Medium anclickt (vergrössert) und dann "Weitere Einzelheiten" aufruft. Die Lizenzbedingungen sind insbesondere dann zu beachten, wenn eine Verwendung ausserhalb der Wikipedia erfolgen soll.
Zitate sind kursiv dargestellt, "→" kennzeichnet redaktionelle Zusammenfassungen