Hilfe Diskussion:Suche/Cirrus/Archiv/1

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 1 Jahr von Plozessor in Abschnitt Suche nur in Unterkategorien
Zur Navigation springen Zur Suche springen

Dokufehler

Anders als in der Doku angegeben, findet insource:"index php title" genau das, was es nicht finden soll. Die Suche geschieht wohl nicht Zeichen für Zeichen. Ich wollte gerade insource:/index php title/ dort einarbeiten, was das wirklich leistet, aber das scheint eine teure Operation zu sein. Gibt es eine billigere Alternative? -- Druckversion (Diskussion) 09:37, 16. Nov. 2014 (CET)

Die Doku wurde im September geschrieben; damals stimmte das.
Vielleicht stimmt es bald wieder.
Keine Hektik; die Server sind seit Einführung überrannt worden. Die MediaWiki-Leute kämpfen mit der Masse der realen Abfragen.
Vielleicht gibt es nach der Weihnachts-Spendenaktion ein paar mehr Server. Im September waren nur wenige Leute im Probebetrieb drauf, und die Ergebnisse waren weitgehend plangemäß.
Nein; Alternativen zu insource:/RegExp/ gibt es dann leider nicht.
LG --PerfektesChaos 16:04, 16. Nov. 2014 (CET)

Doppeltes Suchergebnis

UC Browser wird zweimal gefunden. --Diwas (Diskussion) 15:38, 16. Nov. 2014 (CET)

Temporärer Hamster-Schluckauf.
Die Seite wurde im Lauf der Generierungsmonate zweimal im Suchbaum abgelegt; mutmaßlich verschwindet die Dublette sogar wieder, wenn du ein purge auf die Seite machst.
LG --PerfektesChaos 15:59, 16. Nov. 2014 (CET)
War das im Frühjahr? Im Mai gab es eine Verschiebung. Das erste ist offensichtlich Benutzer:Silver-tm-/UC_Browser. Den Text im Suchergebnis konnte ich in der Versionsgeschichte des Artikels im Artikelnamensraum nicht finden, aber sie stimmt mit der Baustelle überein. Ich habe beide Varianten gepurged, mal schauen. --Diwas (Diskussion) 18:39, 16. Nov. 2014 (CET)
Interessantes Phänomen.
Damit, dass der Artikel ihm aus dem ANR geschoben wurde, aber die Seitenkennnummer noch existiert, hat der Aktualisierungsalgorithmus wohl nicht gerechnet. Fieserweise gibt es ja auch noch weiterhin den alten Seitentitel.
Kurios, dass dann offenbar nicht nur die Seitenkennnummer der Trefferseite hinterlegt wurde, sondern auch der Seitentitel. Nicht ganz so verwunderlich hingegen, weil ja auch der Seitentitel nach Schlagwörtern durchsucht werden kann.
Derartige Artefakte werden wohl noch eine Weile nachleben, bis man sich irgendwann entschließt, Wiki für Wiki den Suchbaum komplett neu aufzubauen. Das würde insbesondere bei einer Änderung an einer Software erforderlich. Ist aber eine sehr aufwändige Angelegenheit, weshalb immer nur inkrementell der alte Baum mit jedem Edit aktualisiert wird.
Vermutlich verzichtet man aus Performancegründen darauf, in der Trefferliste für jede Seite auch noch zu kontrollieren, ob der Namensraum zu der Seitenkennnummer immer noch mit dem übereinstimmt, mit dem er mal in den Baum einsortiert wurde.
LG --PerfektesChaos 09:32, 19. Nov. 2014 (CET)

Kein Unsinn – Es spiegelt wider, oder etwas spiegeln

Es ist kein Unsinn, sondern beide Wortzusammenhänge sind möglich

  1. wider ist immer im Sinne von gegen bzw. entgegen
  2. wieder bezieht sich immer auf etwas noch einmal, erneut ...

Gerade mit einem Spiegel sind beide .. möglich: Wenn ich in einem Spiegel sehe, dann sehe ich mein Gesicht seitenverkehrt (mein Gesicht sieht mir entgegen); wenn ich aber im Spiegel Dinge sehe, dann sehe ich diese noch einmal: Die Dinge spiegeln sich wieder!
Beweis für die Unterscheidung, siehe im DUDEN unter wieder u. wider
HubPfalz (Diskussion) 00:28, 19. Nov. 2014 (CET)

Du hast etwas gesehen, ohne Spiegel, und dann siehst du es im Spiegel wieder, denn der Spiegel spiegelt es wider, und morgen spiegelt er es wieder wider. Diese Bedeutungen und diese Ausdrucksweise wird sicher auch ein eingehendes Duden-Studium bestätigen. Grüße --Diwas (Diskussion) 01:00, 19. Nov. 2014 (CET)
Es geht um diesen Revert von mir. Das Wort "wieder" gibt es, klar, und das Wort "spiegeln" auch. Natürlich kannst du dann einen Satz konstruieren, in dem sich etwas wieder spiegelt. Hier ist aber kein Spiegel im Einsatz, schon gar nicht zweifach, sondern die Suchergebnisse widerspiegeln einfach die tatsächlichen Daten. --YMS (Diskussion) 08:26, 19. Nov. 2014 (CET)
Der Suchindex ist ja ein Spiegel des Inhalts, aber ein Spiegel spiegelt halt wider. Dass er das wieder und wieder tun kann, hat ja mit dem Hilfetext nichts zu tun, in dem selbstverständlich vorher und jetzt richtigerweise nur ein wider und kein wieder steht. Grüße --Diwas (Diskussion) 13:45, 19. Nov. 2014 (CET)

Bindestriche und Klammern

Übersehe ich etwas, oder hat da jemand gewaltig Mist gebaut? Wenn ich in der alten Suche Sachsen Anhalt eingegeben habe, bekam ich den entsprechenden Artikel Sachsen-Anhalt sofort vorgeschlagen, bei der neuen bekomme ich nichts angezeigt, dafür muss ich erst einen Bindestrich einfügen... Kann das nicht entfernt werden? --BHC (Disk.) 15:40, 23. Nov. 2014 (CET)

Gilt auch für Klammerlemma, da müssen mit der neuen Suche die Klammern mit eingegeben werden, früher ging das ohne, da führte Flint Michigan noch zu Flint (Michigan). Wenn Klammern und Bindestriche ignoriert werden würden, wäre die Suche deutlich angenehmer, zumal man ja nicht immer weiß, ob die enthalten sind. --BHC (Disk.) 15:29, 28. Nov. 2014 (CET)
Man könnte sich angewöhnen immer den Ungenauigkeitsoperator ~ an das Suchwort zu hängen. Vielleicht sollte auf der Ergebnisseite ein Link zur Wiederholung der Suche mit angehängter Tilde angeboten werden. Beides bietet aber nicht die Vorschlagsliste unter dem Suchfeld. Möchte man sich gerade die Klammerlemmas vorschlagen lassen, ist das neue Verhalten besser. Ist es machbar die Wildcard * und den Ungenauigkeitsoperator ~ auch bei den Vorschlägen wirksam werden zu lassen? Grüße --Diwas (Diskussion) 16:02, 28. Nov. 2014 (CET)

@BHC:

  • Nur flint und etwas Geduld bringt dich auf Vorschläge mit deinem Begehren an fünfter Stelle.
  • flint ( liefert vier Vorschläge, dein Ziel auf Platz 1.
  • flint (m gibt einen Treffervorschlag.
  • Sachsen-A liefert dir alles, was du brauchst, oder?

@Diwas:

  • Beim interaktiven Befüllen des Suchfeldes wird automatisch immer ein * hinten angehängt, bis man auf der Spezialseite den Suchen-Button anklickt. Sie macht die Vorschläge auch im intitle-Modus.
  • Diese zeichenweise interaktive Abfrage in der Suchbox nimmt das allerdings wörtlich und ist für einen anderen Zweck ausgelegt, als die Gesamtsuche.

VG --PerfektesChaos 00:56, 29. Nov. 2014 (CET)

Ja, es ist eher so ein Bequemlichkeitsding, der Bindestrich liegt so unhandlich, den tippe ich (und wohl auch andere) nicht mit, früher hat das eben funktioniert. Ich weiß, wer keine größeren Beschwerden hat, meckern ist nunmal des Deutschen liebster Zeitvertreib. ;-) --BHC (Disk.) 01:31, 29. Nov. 2014 (CET)

Intitle-Suche funktioniert nicht richtig

Unter Vorlage_Diskussion:Index#Intitle-Suche funktioniert nicht richtig sind wir auf folgendes Probleme mit der Suche-Funktion intitle gestoßen:

a) nicht nachvollziehbares Wildcard-Verhalten:

Unter Einschränkzúng auf den ANR erhält man nicht logisch nachvollziehbare Suchergebnisse:

b) Nichtanzeige von Weiterleitungsseiten:

Anders als bei Spezial:Präfixindex werden Weiterleitungsseiten nicht angezeigt, wie an folgendem Beispiel sieht:

c) Nicht wirklich sauber beschreibbares Verhalten insbesondere auch, wenn der Suchbegriff einen Umlaut enthält.

Für Vorlage:Index bräuchten wir im Grunde genommen genau das, was die Beschreibung von intitle verspricht: alle Seiten (der angeklickten Namespaces), die den Suchbegriff enthalten (einschließlich Weiterleitungen!), wobei "eloponnes" in "Peloponnes" auch enthalten ist. Wann wird das wieder funktionieren? --Dogbert66 (Diskussion) 10:21, 1. Dez. 2014 (CET)

Meine ersten Kommentare:
  • Es ist Absicht, dass bei intitle die Weiterleitungsseiten nicht berücksichtigt werden.
  • Der peloponnes wird gemäß Stemming auch für eine Pluralform gehalten.
  • Es ist keine exakte zeichenweise Suche, sondern der Seitentitel wird in eine Normalform gebracht (Umlaute aufgelöst) und Plural und Beugung berücksichtigt. Damit sind dann die -esische erstmal draußen.
  • Ob die Lucene-Suche hier sehr viel glücklicher gewesen war, wüsste ich jetzt nicht. Die Algorithmen für Umlaute, Stemming usw. sind eigentlich immer noch die gleichen oder sehr ähnlich.
  • Für den Seitennamen und dessen Beginn würde ich eher prefix: empfehlen.
  • Am Parameter intitle steht ein Hinweis: „im Herbst 2014 wird dies [noch] nicht unterstützt“ – die Suchmaschine ist noch in Weiterentwicklung anhand der Rückmeldungen aus den Fremdsprachen aller Welt. Die Entwicklung geschah auf Englisch; da ist Vieles einfacher. Man konnte aber alle neuen Features nicht noch länger der Welt vorenthalten, bis es am Sankt-Nimmerleinstag alle erdenklichen Wünsche erfüllen würde; Cirrus konnte ein Dreivierteljahr im Beta-Test von allen Benutzern erprobt werden, die vorab schon derartige Rückmeldungen geben konnten.
VG --PerfektesChaos 11:14, 1. Dez. 2014 (CET)
Danke für die schnelle Antwort! Zunächst mal: ich habe das "wieder" in meiner Frage gestrichen, da ich tatsächlich nicht weiß, ob das in Lucene "besser" war, und das dann doch vielleicht in den falschen Hals kommen könnte. Hier selektive Rückantworten auf Deine Punkte:
  • Der Hinweis auf Herbst 2014 steht nur an einem Teilsatz, das habe ich tatsächlich nicht auf intitle bezogen. Aber dann ist die Frage: ab wann soll denn intitle in seiner Endversion funktionieren?
  • Ein Ausblenden der Weiterleitungen ist für mich unverständlich - kann das nicht zumindest über eine Check-Box ein- und ausgestellt werden?
  • Code Präfix hilft uns bei der Fragestellung nicht weiter, da ja gerade auch Pinios (Peloponnes) gefunden werden soll. Außerdem gibt es ja bereits die Spezial:Präfixindex.
  • Danke für den Hinweis, dass ein Teil der geschilderten Probleme meiner Unkenntnis der griechischen Sprache entsprungen sind und ich nicht erkannt habe, dass Peloponnes ein Plural ist. Auch ist das "in Normalform bringen" ein möglicher Grund für das Verhalten bei Umlautanfragen. Dennoch: wirklich nachvollziehbar sind die Ergebnisse nicht - was waren denn die Argumente gegen die viel einfacherer textuelle Suche?
--Dogbert66 (Diskussion) 12:02, 1. Dez. 2014 (CET)
  • „wann soll denn intitle in seiner Endversion funktionieren?“ – So fertig, dass alle damit zufrieden sind, wird es voraussichtlich nie. Es ist ein Prozess, der von englischsprachigem Umfeld gesteuert wird.
    • Gegenüber Lucene gab es schon viele Verbesserungen und viele neue Features; man denke nur an die Aktualiserung binnen einer Minute nach Seitenbearbeitung.
    • Es wird weiter entwickelt; momentan liegt der Fokus auf dem Durchsuchen auch von allen Seiten in Unterkategorien.
  • „Ausblenden der Weiterleitungen“ – man könnte sicher einen zusätzlichen Parameter/Schalter redirect: einführen.
    • Es war aber auch gerade Benutzerwunsch gewesen, nicht mit Weiterleitungen belästigt zu werden.
  • Der Plural „Peloponnes“ rührt von einem simplen englisch-deutschen Regelsatz her, der von den Buchstaben am Wortende auf mögliche Beugungsformen und Pluralbildungen schließt und daraus ein Grundwort bildet, das dann im Suchbaum abgelegt wird. Nur die Grundwörter (sowohl im Wiki wie auch in der Suchanfrage) werden hier verglichen. Vergleiche auch das oben von mir in gleichem Kontext verlinkte Stemming.
  • Argumente gegen die viel einfachere textuelle Suche sind, dass in der Regel viel mehr naheliegende Treffer gefunden werden, auch wenn die Notation nicht völlig übereinstimmt. Die Suchenden können ja nicht ahnen, was ihnen entgeht, weil eine Kleinigkeit anders geschrieben wäre.
    • Die Modernisierung läuft weiter unter dem Oberbegriff Spezial:Suche/ElasticSearch, wobei auch unsere Lucene sich bereits in dieser Richtung Mühe gegeben hatte.
  • Umlaute sind generell ein Problem bei englischsprachigen und vor allem amerikanischen Entwicklern; die haben diesen europäischen Schnickschnack wie Akzente und Háček nämlich nicht auf der Tastatur.
VG --PerfektesChaos 12:57, 1. Dez. 2014 (CET)
Ok, das mögen teilweise berechtigte Gründe sein. Was schlägst Du denn als Lösung für das Vorlage:Index-Thema vor? Ich finde Chianandas Idee nicht schlecht, in manchen "Siehe auch"s eine Liste der Artikel zu haben, die den Begriff enthalten. Und bei Lemmas wie "Resonanz" möchte ich da eben nicht nur mit "Resonanz" beginnende Themen finden, sondern wirklich die "Resonanz" enthaltenden Lemmas (und dabei eben insbesondere auch die Begriffe, die es nur als Weiterleitung gibt. --Dogbert66 (Diskussion) 21:12, 1. Dez. 2014 (CET)
  1. Warten.
    • In einem halben Jahr mal schauen, wie dann die Ergebnisse aussehen.
    • Der Suchbaum (und damit die Suchergebnisse) ändert sich auch nicht schlagartig nach irgendeiner Softwareänderung, sondern er muss alte Zweige vergessen und neue dazulernen.
  2. Nimm Kontakt zu den Entwicklern auf und schildere ihnen deine Feststellungen.
    • Oder lies dich dort in den bekannten Diskussionsstand und die Absichten ein.
  3. Im Übrigen ist es nicht ungewöhnlich, dass es bei einzelnen Abfragen mal nicht so herauskommt, wie man das gern theoretisch hätte. Entscheidend ist, dass der Algorithmus in den meisten Fällen das findet, was die Menschen trotz im Nebel stochernder Suchanfrage wissen wollten; und darauf ist er ausgelegt.
  4. Was die BKS angeht, so ist das ein zusätzliches Angebot; und keine Garantie, auf allen BKS immer sämtliche im Prinzip bekannten Seiten zu finden und zu liefern. Weiterleitungen bekommt du über die normale Suche, nebst Vorkommen im Inhalt; auf dieses Szenario ist diese Suchart ausgelegt. Das ist halt der Weg, wenn man möglichst umfassend Artikel finden möchte, die einen deutlichen Bezug zu einem Schlagwort haben.
VG --PerfektesChaos 00:51, 2. Dez. 2014 (CET)
Kontakt zu den Cirrus-Entwicklern aufnehmen? Ich dachte, da wäre ich hier richtig?? --Dogbert66 (Diskussion) 07:08, 2. Dez. 2014 (CET)
Nein, hier ist die Betreuung der umseitigen Hilfeseite. VG --PerfektesChaos 10:13, 2. Dez. 2014 (CET)
Na dann <Würmer-aus-der-Nase-saug>, wo ist denn dann die richtige Seite, um die Entwickler anzusprechen?? Viele Grüße--Dogbert66 (Diskussion) 22:17, 2. Dez. 2014 (CET)
Der Startpunkt, um nicht von einer box of worms zu sprechen, wäre Phabricator; damit kommt man an die Entwickler. Wiki-mäßig parlieren lässt sich auf den talk pages der umseitigen weiteren Informationen; die lesen aber die Entwickler nicht. Enjoy --PerfektesChaos 22:58, 2. Dez. 2014 (CET)

@PerfektesChaos: Als Mitdiskutant bei "Vorlage Diskussion:Index #Intitle-Suche funktioniert nicht richtig" verstehe ich die Sache mit dem Stemming noch nicht ganz (war selber mal Programmierer). Du schreibst oben:

  • „Der peloponnes wird gemäß Stemming auch für eine Pluralform gehalten.
    Es ist keine exakte zeichenweise Suche, sondern der Seitentitel wird in eine Normalform gebracht (Umlaute aufgelöst) und Plural und Beugung berücksichtigt. Damit sind dann die -esische erstmal draußen.“

Also wird dann nach im Hintergrund nach peloponn gesucht? Warum findet die Suche dann komischerweise nur peloponnesischer ? Und wenn das Suchwort im Hintergrund manipuliert wird – sollte nicht das Ergebnis der Wortreduzierung auch i.d. Suchmaske angezeigt werden? Wirkt sonst sehr irreführend.
Als BKS-Bearbeiter setze ich im Bearbeitungsmodus in fast jede BKS die Index-Vorlage, um zu schauen, was es alles für Artikel (und erweiterte Stichworte) dazu gibt. Dabei ist mir ziemlich egal, ob das BKS-Stichwort (in irgendeiner Sprache) einen Plural, ein Adjektiv oder sonstwas ist: Ich will eine Auflistung zum Stichwort, die ich dann auswerten kann. Und warum funktioniert die intitle-Suche bei Willkür überhaupt nicht, ebensowenig bei Willkur ?
Lässt sich aus deinen Aussagen schließen, dass man der Vorlage:Index bei der intitle-Suche im Prinzip nicht trauen kann? Irgendwas stimmt hier ganz und gar nicht… :-(  --Chiananda (Diskussion) 21:28, 3. Dez. 2014 (CET)

  • „Peloponnes“ sieht genauso aus wie „Pommes frites“; also ist das alles Plural.
  • Richtig; im Suchbaum liegt nach meiner Kenntnis peloponn im einen Fall und peloponnesisch im anderen. Im ersten Fall mag er dann nicht, dass du wieder „-es*“ haben möchtest. Nachweis: Spezial:Suche/intitle:Peloponn*.
  • Die Methodik hat sich hier meines Wissens beim Umstieg von Lucene auf Cirrus nicht geändert.
  • Umlaute sind für amerikanische Programmierer immer schwierig; aber ich glaube, das kommt irgendwann von selbst. Mit der englischsprachigen Wikipedia hatte das aber wohl alles schon ganz gut geklappt.
  • Ich würde für das nächste halbe Jahr wenig auf die absolute Zuverlässigkeit von intitle geben. Das ist dort noch nicht so relaxed wie bei der Suche im Volltext; aber perspektivisch sollen analoge Strategien greifen.
VG --PerfektesChaos 21:48, 4. Dez. 2014 (CET)

Sonderzeichen

Wie sucht man nach Zeichenketten, die das Zeichen "<" oder ">" enthalten? 85.212.21.163 00:16, 11. Dez. 2014 (CET)

Ein \ davor setzen (Beispiel). --Leyo 00:19, 11. Dez. 2014 (CET)

Hatte ich sonst immer falsch gesucht oder das Falsche?

spezial:suche/Conrad Veidt incategory: "Britischer Film" Filmtitel. Das ist doch mal ein präzises und informatives Suchergebnis. Ob es das mit Lucene auch schon so gegeben hätte? Alle Kategorien sollten so ähnlich aufgebaut (benannt) sein. Wie auch immer, wenn Wikidata eines Tages voll befüllt sein wird und komfortable Abfragewerkzeuge bereitstehen, könnte schon vieles so schön funktionieren. Besser, denn dann sieht man wohl auch, wo er mitgespielt, wo Regie geführt, aber nichts wenn er nur erwähnt wird. --Diwas (Diskussion) 22:56, 22:59, 11. Jan. 2015 (CET)

incategory gab es bei Lucene einen Tag alt; ob die Verkettung so lief, weiß ich nicht. Könnte schon sein, vielleicht hatte man mit dem Ding aber auch einfach weniger experimentiert als jetzt mit dem neuen Spielzeug. LG --PerfektesChaos 23:18, 11. Jan. 2015 (CET)
Mag sein, aber ich vermuten jetzt, dass die unvollständige Angabe eines Kategorienamens bei Lucene zum keinem Suchergebnis führte. Kann aber auch sein, dass ich nie nach solchen Kategorienamensteilen (Pseudoeigenschaften) gesucht habe. Wenn ich richtig liege, ist Cirrus sehr viel restriktiver, was die einzelnen Worte angeht (man muss immer, wenn man sich der Schreibweise nicht sicher ist, eine Tilde dranhängen) aber vielleicht offener, was etwa Kategorienamenskombinationen angeht. Grüße --Diwas (Diskussion) 00:15, 12. Jan. 2015 (CET)

Case-sensitive

Case-sensitive ist die neue Suche wohl immer noch nicht, oder? 85.212.17.252 22:00, 12. Nov. 2014 (CET)

Mit regulären Ausdrücken sollte es funktionieren: https://de.wikipedia.org/w/index.php?title=Spezial%3ASuche&profile=default&search=insource%3A%2F%22Vereint%22%2F&fulltext=Search --2A02:810D:1080:23D8:5448:C280:281C:70A0 19:41, 14. Nov. 2014 (CET)
und z. B. die Suche nach "Anschluß" liefert immer noch Anschluss. Mike Krüger, ?! 08:45, 14. Nov. 2014 (CET)
Sollte das nicht so gehen: https://de.wikipedia.org/w/index.php?title=Spezial%3ASuche&profile=all&search=Anschlu%C3%9F~0&fulltext=Search ? --2A02:810D:1080:23D8:5448:C280:281C:70A0 18:54, 14. Nov. 2014 (CET)
Danke, geht so leider nicht, also ist abwarten angesagt. Mike Krüger, ?! 13:57, 15. Nov. 2014 (CET)
  • Es ist Absicht, dass die normale Suche case-insensitive ist, und auch diakritische Zeichen ignoriert.
  • Beim Auswerten der Seitentexte wird eine Baumstruktur angelegt, in die das Blatt anschluss als Wort geklebt wird.
  • Die Idee der IP mit dem ~0 war schon nicht schlecht, aber genauer als anschluss wird es so nicht mehr.
  • Was ginge, ist die Suche mittels regulärer Ausdrücke, wie 19:41 richtig angemerkt; ohne ein i (für ignore case) dahinter auch case-insensitive:
    • insource:/Anschluß/
    • Problem: Es gibt weltweit nur einen Server, der alle Wikis durchsucht. Im September war es noch schön ruhig. Jetzt antwortet er überhaupt nicht mehr, oder phantasiert was von anderthalb Millionen Treffern. Wahrscheinlich muss erst die Weihnachts-Spendenaktion durch, damit Geld für ein paar Geschwisterchen da ist.

LG --PerfektesChaos 21:20, 14. Nov. 2014 (CET)

Die Suche ist definitiv zu blöde für Case-insensitiv, ich habe gerade gesucht nach "der letzte countdown" und erhielt als Anwort "Die Seite existiert nicht"! Darunter stand der Link auf die Seite "Der letzte Countdown" --Hartmut.krummrei (Diskussion) 21:14, 27. Feb. 2015 (CET)

Wildcard kaputt?

Spezial:Suche/*ozid liefert kein Ergebnis. Grüße --Diwas (Diskussion) 01:49, 7. Mär. 2015 (CET)

phab:T91666 --Diwas (Diskussion) 02:12, 7. Mär. 2015 (CET)
Duplikat von phabricator:T90090. -- FriedhelmW (Diskussion) 14:35, 22. Mär. 2015 (CET)

Sonderzeichen (2)

nach Sonderzeichen kann nicht gesucht werden. Eine Aufzählung der damit gemeinten Sonderzeichen wäre hilfreich. Gruß -- Dr.cueppers - Disk. 10:50, 22. Mär. 2015 (CET)

  1. Es läst sich im Quelltext suchen (Hilfe:Suche/Cirrus #insource).
    • Das fordert zeichenweise exakte Übereinstimmung ein.
  2. Ggf. mit einem Regulären Ausdruck (in / einschließen).
    • Dabei sind eine Reihe von Sonderzeichen bedeutungstragend; ggf. mit \ escapen, siehe oben: #Sonderzeichen.
  3. Die genaue Syntax würde ich auch gern wissen, bin aber noch privat am Sammeln, Erproben und Aufbereiten der Erfahrungen.
Schönen Sonntag --PerfektesChaos 11:28, 22. Mär. 2015 (CET)
In diesem Zusammenhang meint "Sonderzeichen" wohl alle außer Buchstaben und Ziffern. -- FriedhelmW (Diskussion) 11:38, 22. Mär. 2015 (CET)
Naja; aber Umlaute werden im laufenden Text gefunden wie die zugehörigen Grundbuchstaben. VG --PerfektesChaos 12:03, 22. Mär. 2015 (CET)

Wie erzwingt man ein exakte Suche?

"Fuzzy"-Suche ist ja nett, aber wenn man nach einer exakten Schreibweise sucht, z.B. einer Falschschreibung, will man ja gerade keine "ähnlichen" Schreibungen finden. Beispiel: Ich suche nach "aussen" und finde "außen". :-( --RokerHRO (Diskussion) 17:18, 24. Mär. 2015 (CET)

Als Näherungslösung:
aussen insource:/aussen/
-- FriedhelmW (Diskussion) 17:43, 24. Mär. 2015 (CET)
Tja, oder:
insource:/ aussen /
und Variationen dazu.
Gruß an die Schweizer Kollegen; sieht aus, als ob da schon jemand vor dir dran war. --PerfektesChaos 17:47, 24. Mär. 2015 (CET)
Etwas verbessert:
aussen insource:/[^a-z]aussen[^a-z]/
-- FriedhelmW (Diskussion) 18:10, 24. Mär. 2015 (CET)
Puh, wie aufwändig und unintuitiv. :-( Mein Versuch mit einem angehängten ~0 hatte leider nicht geklappt.
Jetzt wär es toll, wenn die Antwort auf der hilfeseite stünde, nicht in der DS, die eh bald gelöscht/archiviert wird. ;-) --RokerHRO (Diskussion) 19:30, 24. Mär. 2015 (CET)
Wer es einfach möchte ist mit Google besser bedient. -- FriedhelmW (Diskussion) 19:45, 24. Mär. 2015 (CET)
Die Hilfeseite ist schon mit Details geflutet; allein das Inhaltsverzeichnis füllt mit dem Einleitungsabschnitt eine Bildschirmseite. Es sind zukünftig noch mehr Dokumentationsteile zu erwarten, wenn das alles etwas robuster ist. Das wird nicht dadurch besser und übersichtlicher, dass außerdem jede erdenkliche Nutzungsmöglichkeit einzeln und mit explizitem Beispiel und mit einer ausführlichen Erklärung zu jedem Beispiel versehen wird. Es gibt keine vorgekaute Antwort auf alle erdenklichen Fragen.
Google liefert 8000 Trefferseiten; das kann auch kein sinnvoller Ansatzpunkt für die gewünschte Rechtschreibkontrolle sein. Ich vergaß übrigens oben anzuhängen: -insource:schweizbezogen – da kommen 8–18 Trefferartikel raus.
VG --PerfektesChaos 20:25, 24. Mär. 2015 (CET)

Negative insource-Suche

Wie lautet die korrekte Syntax für eine Suche, bei der eine bestimmte Zeichenfolge im Quelltext gesucht werden soll bei gleichzeitigem Ausschluss einer anderen Zeichenfolge im Quelltext? 85.212.31.76 00:21, 24. Apr. 2015 (CEST)

Ob das korrekt ist, weiß ich nicht, aber

  • insource:"{{Infobox Fluss | NAME= Rhein" insource:"LAGE= [[Niederlande]], [[Deutschland]], [[Belgien]]" liefert mir einen Artikel.
  • insource:"{{Infobox Fluss | NAME= Rhein" -insource:"LAGE= [[Niederlande]], [[Deutschland]], [[Belgien]]" liefert mir einen anderen.
  • insource:"{{Infobox Fluss | NAME= Rhein" liefert mir beide.

Ob das aber allgemeingültig ist, bei anderen Suchmustern, Tageszeiten und Jahreszeiten kann ich nicht sagen. Grüße --Diwas (Diskussion) 04:17, 24. Apr. 2015 (CEST)

Funzt, danke! 85.212.31.76 09:43, 24. Apr. 2015 (CEST)

Satzzeichen suchen

Hallo, wie stelle ich es an, um den ANR nach Lemmata mit Schrägstrichen zu durchsuchen? Gruß, XanonymusX (Diskussion) 20:30, 15. Jun. 2015 (CEST)

Du suchst Wikipedia:Technik/Labs/Tools/grep. Es gibt 34319 solche Seiten. -- FriedhelmW (Diskussion) 21:20, 15. Jun. 2015 (CEST)

Gibt es auch ein Tool das dies kann, und gleichzeitig auf bestimmte Kategorie beschränkt werden kann? Oder ein Tool das dies kann in Kombination mit Quelltextsuche? --Distelfinck (Diskussion) 20:34, 22. Jun. 2015 (CEST)

Vielleicht mal in der Wikipedia:Technik/Werkstatt fragen. Gruß -- FriedhelmW (Diskussion) 21:18, 22. Jun. 2015 (CEST)

Auf lokale Dateien einschränken

Ich möchte eine Suche auf lokale Dateien einschränken, also Commons-Dateien ausschliessen. Mittels hastemplate:Information klappt es zwar (Beispiel), aber lokale Dateien ohne Vorlage:Information werden ebenfalls ausgeschlossen. --Leyo 01:13, 29. Dez. 2014 (CET)

  • Was auf Commons steht und [[Kategorie: enthält, ist aber auch recht interessant.
  • Die Inhalte der Commons-Seiten werden im Dateinamensraum identisch der lokalen Dateien dargestellt und genauso mit insource durchsucht.
  • Es gibt deshalb offenbar kein Unterscheidungsmerkmal zu deiner Anfrage, das sich zur Filterung nutzen ließe.
  • Eher müssten die Dateiwarter Wert darauf legen, dass die Information überall eingebunden ist.
  • Allenfalls kannst du dir selbst ein kleines CSS programmieren, das auf der Spezial:Suche alle Bilder ausblendet, deren img[src*="upload.wikimedia.org/wikipedia/commons/thumb"]
    • Du hast dann zwar immer noch alle 801 Ergebnisse, aber die mit ohne Bilder kannst du ignorieren.
    • Das kann ja für alle möglichen Suchergebnisse im Dateinamensraum hilfreich sein; wenn es zuviel in anderen Situationen ausblendet, dann nur die Ergebnisse per .page-Spezial_Suche #mw-content-text img[src*="upload.wikimedia.org/wikipedia/commons/thumb"]
    • Nicht mit CSS, nur mit JS könntest du auch noch den Texteintrag dazu entfernen.
LG --PerfektesChaos 12:06, 29. Dez. 2014 (CET)
Danke für die ausführliche Antwort und die Bestätigung, dass es mit Bordmitteln nicht geht. Lokal (Ergänzung von Vorlage:Information) und bei Commons (Beispiel) sind Bestrebungen im Gange, die obigen Punkte zu verbessern. Ich werde versuchen, die Ausblendung temporär mittels Firefox-Add-on Web Developer hinzukriegen. --Leyo 12:23, 29. Dez. 2014 (CET)

local:

Kann man local: mit der Negierung von hastemplate: kombinieren? Konkret ginge es um lokale Dateien ohne Vorlage:Information. Aktuell sollte eine Datei gefunden werden. --Leyo 11:05, 26. Mär. 2015 (CET)

Was stellst du denn uns eine Frage? Go ahead, experimentiere damit wie es einem Chemiker ziemt, und schreibe deinen Laborbericht halt umseitig mit dazu.
Die Dateiwärter sind ohnehin die wesentliche Zielgruppe des neuen Parameters.
LG --PerfektesChaos 11:29, 26. Mär. 2015 (CET)
Ich hatte es nicht geschafft. Die Frage war insbesondere an Thgoiter gestellt, der den Abschnitt auf der Vorderseite ergänzt hatte. --Leyo 11:35, 26. Mär. 2015 (CET)
Keine Ahnung. --тнояsтеn 12:30, 26. Mär. 2015 (CET)
file:local:* -hastemplate:... sollte gehen. -- FriedhelmW (Diskussion) 11:42, 26. Mär. 2015 (CET)
Leider negativ. --Leyo 11:45, 26. Mär. 2015 (CET)
Ist das denn überhaupt schon für uns live? In den Nachrichten kam bislang nichts.
Chemiker ins LABor!
RumprobierenExperimentieren; mit einer Zeichenkette, die wir sowohl lokal wie auf Commons haben; wie verändern sich die Treffer?
LG --PerfektesChaos 11:51, 26. Mär. 2015 (CET)
Das local funktioniert, nur nicht in Kombination mit anderen. -- FriedhelmW (Diskussion) 12:02, 26. Mär. 2015 (CET)
FriedhelmW, file:local: -hastemplate:information -hastemplate:Exzellentes_Bild -hastemplate:Geschützt -hastemplate:Geschützt-Ungeklärt scheint (nun?) zu funktionieren. --Leyo 18:53, 16. Aug. 2015 (CEST)
Danke für den Hinweis! local mit insource funktioniert auch. -- FriedhelmW (Diskussion) 18:58, 16. Aug. 2015 (CEST)

Fehlt da ein Anker oder was ist da los? --Diwas (Diskussion) 22:28, 29. Aug. 2015 (CEST)

Nein, das ist die Suchbox selbst. Bei nichtexistentem Ziel würden Webbrowser auch nicht hochscrollen, schon gar nicht nicht ganz hoch ;-) --nenntmichruhigip (Diskussion) 23:47, 29. Aug. 2015 (CEST)

Interwiki-Suche

Die Suche nach Wiktionary-Eintraegen, beispielsweise wikt:Suche, oder die Suche in anderen Wikipedias, z. B. nach en:Eviction, findet nichts.
Warum ? Gibt es eine Alternative ?
Nach meiner Erinnerung hatte das mit der vorherigen Suchfunktion noch funktioniert. -- Juergen 95.223.27.91 14:11, 22. Mär. 2015 (CET)

Was meinst du? Wenn ich in der Suche z.B. en:school eingebe, lande ich auf der entsprechenden en-Seite. --BHC (Disk.) 14:13, 22. Mär. 2015 (CET)
Ich nicht: Zu deiner Suchanfrage wurden keine Ergebnisse gefunden.
Geht das vielleicht nur mit JavaScript ? -- Juergen 95.223.27.91 14:15, 22. Mär. 2015 (CET)
Ich gebe es immer oben rechts im Suchfeld ein und lande direkt im entsprechenden Artikel und nicht bei den Suchergebnissen. Wenn ich das bei der Suchergebnisse-Seite mache, funktioniert es jedoch auch nicht (und es hat früher meiner Erinnerung nach auch nicht funktioniert). Ob dafür JavaScript benötigt wird, weiß ich nicht. Könnte vielleicht Benutzer:PerfektesChaos sagen. --BHC (Disk.) 14:21, 22. Mär. 2015 (CET)
Ohne JavaScript geht es nicht (eben ausprobiert). -- FriedhelmW (Diskussion) 14:26, 22. Mär. 2015 (CET)
Genau (habe es auch eben ausprobiert). Ging aber frueher.
Wo kann ich eine entsprechende Ergaenzung (das kann doch eigentlich nur eine Kleinigkeit in der Konfiguration sein) fuer JavaScript-Gegner beantragen ? -- Juergen 95.223.27.91 14:28, 22. Mär. 2015 (CET)
  • Du kannst zumindest eins machen: In der Adresszeile des Browsers nach /wiki/ drübertippen: fr:Paris.
  • Warum das mit ohne JavaScript nicht gehen soll, ist mir grad nicht klar. Eigentlich wird dann die Suchanfrage direkt an den Server geleitet, wie jedes deutsche Lemma, und der wertet das dann aus. Sollte gehen. Oder würde mit JavaScript auch nicht laufen.
  • Da wir hier eigentlich alle mit JavaScript arbeiten, wirst du dich gedulden müssen, bis ich das mal in einer anonymen Session ohne JavaScript genauer analysiere.

VG --PerfektesChaos 12:40, 23. Mär. 2015 (CET)

Ich habe das mal gemacht, und kann das Problem bestätigen.
  • Es gibt in dem Formular zwei Absende-Buttons
    • Der zuerst stehende setzt den Parameter Search=fulltext
    • Der zweite den Parameter Artikel=go (auf enwiki go=Go)
  • Wenn ich einenden ersten von ihnen per Webdevelopertools entferne oder ihre Reihenfolge ändere funktioniert es.
  • Die beiden Buttons liegen rechts im Suchfeld übereinander. Da sind also zwei Lupen, nicht nur eine. Der obere ist der, der auch im DOM weiter oben steht.
    • Das heisst den unteren kann man eh nie erreichen, da er auch keinen accesskey hat.
HTH --nenntmichruhigip (Diskussion) 16:00, 23. Mär. 2015 (CET)
Aber wie kann ich erreichen, dass es bereits im ersten Schritt allein durch Eingabe oben rechts im Suchfeld auf jeder normalen Wikiseite funktioniert und nicht erst im zweiten Schritt durch erneute Suche auf der Suchergebnisseite ? Hier gibt es ja gar keinen Button, sondern nur ein Submit an "/w/index.php" durch die Enter-Taste. -- Juergen 95.223.27.91 06:02, 2. Apr. 2015 (CEST)
Das Lupen-Symbol ist technisch ein Absende-Button, auch wenn er nicht so aussieht. Durch Drücken der Entertaste in einem Feld eines Formulars (hier: das Texteingabefeld der Suche) wird der erste Absende-Button des Formulars ausgelöst.
@PerfektesChaos: Mir sieht das danach aus, als wäre eine feste Entfernung des ersten Buttons (#mw-searchButton) seitens MediaWiki die passende Lösung. Momentan wird er durch ein JS von bits.wikimedia.org entfernt. Nebenwirkungen (z.B. Unerreichbarkeit der Volltextsuche) scheint es keine zu geben. Könntest du dich ggf. um die Erstellung/Auffindung eines Bugreports kümmern? --nenntmichruhigip (Diskussion) 14:47, 4. Apr. 2015 (CEST)
Uaaarggh, ausgerechnet dieses UI-Formular-Zeugs wird momentan nicht sehr glatt entwickelt; Mobilkram und Design und allsowas spielen mit rein und sind im Umbruch. Wenn da zwei Knöpfe übereinanderliegen und einer dann mit JS entfernt wird oder wie sich das anhört, dann erinnert mich das an ein kürzliches Drama mit dem UI und einem abgestürzten Hack. Bevor ich mich an einen Bug-Report machen würde, müsste ich erstmal in einem Browser ohne JS aber mit Werkzeugkasten intensiv erforschen und verstehen, was da los ist. @Se4598: Aber vielleicht buddelt ein Kollege? Wird schon irgendwann von irgendwem geklärt werden. LG --PerfektesChaos 15:21, 4. Apr. 2015 (CEST)

Die Insource-Suche mittels Reg-Ex funktioniert nicht. Die Suche nach beliebigen zweibuchstabigen Interwiki-Links findet 180 Artikel, sucht man dezidiert nach en-Interwikis, bekommt man jedoch mehr als 7000 Resultate. 129.13.72.196 09:05, 15. Sep. 2015 (CEST)

Siehe phab:T106685 und phab:T103289. --тнояsтеn 09:23, 15. Sep. 2015 (CEST)

Case-sensitive

Wie kann man z.B. "Aufschluß" mit "ß" finden? Ausgeben wird immer "Aufschluss". Danke und Gruß Mike Krüger, ?! 18:27, 16. Dez. 2015 (CET)

Trotz viel Herumprobieren habe ich nur eine Möglichkeit gefunden: https://de.wikipedia.org/wiki/Spezial:Suche?search=insource:/Aufschlu%5B^s%5D/ Schade, das sollte einfacher sein. --TMg 19:10, 16. Dez. 2015 (CET)
Das liefert aber keine Treffer mit "ß". --2A02:810D:1180:108:6053:F98B:5232:9EEA 19:42, 16. Dez. 2015 (CET) P.S. Case sensitivity ist was anderes.
Da hatte sich ein Tippfehler eingeschlichen. Klick nochmal. --TMg 15:27, 17. Dez. 2015 (CET)

In Benutzer-Seite suchen, ohne Unterseiten

Hallo, ich würde gerne in den Hauptseiten der Benutzer suchen, aber nicht in deren Unterseiten. Ist das möglich? Wenn ich in Benutzer-Seiten suche, werden immer auch die Unterseiten durchsucht, was natürlich erheblich mehr Treffer zur Folge hat und das Ergebnis unübersichtlich macht. --Berlinschneid (Diskussion) 19:11, 27. Mai 2016 (CEST)

Mal ins Unreine gedacht: -intitle:/ + prefix:Benutzer: LG --PerfektesChaos 19:49, 27. Mai 2016 (CEST)
Danke, das hat geholfen. Es wurden zwar auch Unterseiten angezeigt, aber die waren dem Suchwort sehr ähnlich, so dass es viel weniger Treffer gab und ich das gefunden habe, was ich suchte. Danke. --Berlinschneid (Diskussion) 22:05, 27. Mai 2016 (CEST)

Geboren am ...

Hallo WP-Team, wie kann ich zum Beispiel alle Personen finden, die am 1. Januar geboren wurden? Wenn ich als Suche "(* 1. Januar " eingebe, sieht die Suche das * als Platzhalter an und gibt mir unzählige Ergebnisse, die ich nicht haben möchte ...
Suche nach (* 1. Januar ergibt 296.471 Ergebnisse,
Suche nach "(* 1. Januar " ergibt 96.972 Ergebnisse, aber kaum ein "reines Geburtsdatum" ...
Kann ich die Suche weiter spezifizieren, wer kann mir weiterhelfen? Danke & Gruß, ANKAWÜ (Diskussion) 07:07, 17. Nov. 2016 (CET)

Ohne Verlinkung des Datums insource:/\(\* 1. Januar /, mit Verlinkung insource:/\(\* \[\[1. Januar\]\] / --тнояsтеn 08:37, 17. Nov. 2016 (CET)
Oder du lässt die Personendaten auswerten: https://tools.wmflabs.org/templatetiger/tt-table4.php?template=Personendaten&lang=de&where=GEBURTSDATUM&is=1._Januar (dauert bisschen). --тнояsтеn 08:39, 17. Nov. 2016 (CET)
"SUPER!", Thorsten, "DANKESCHÖN!" - ANKAWÜ (Diskussion) 09:54, 17. Nov. 2016 (CET)
@ANKAWÜ: Oder schau mal, was du hier rausbekommst:
Erwischt die Personen, die Artikelgegenstand sind, nicht aber solche, die irgendwo (vielleicht als Kinder oder Eltern) erwähnt sind.
LG --PerfektesChaos 10:12, 17. Nov. 2016 (CET)
Das wird ja immer besser! Ein herzliches "Dankeschön" an Alle! Die Seite "Wichtige Leut" kenne ich ..., die wollte ich ergänzen, aber wer entscheidet, wer wichtig ist? ;-) ANKAWÜ (Diskussion) 11:39, 17. Nov. 2016 (CET)
Wikipedia:Formatvorlage Tag#Geboren schreibt lapidar: „An dieser Stelle sollen enzyklopädisch relevante Geburtstagskinder notiert werden.“ --тнояsтеn 12:58, 17. Nov. 2016 (CET)

Beispiele für insource mit regulären Ausdrücken

Mag jemand ein paar Beispiele für die Suche mit Regex in den Abschnitt Hilfe:Suche/Cirrus#Beispiele einfügen? Beispielsweise nicht die Suche nach insource:/(hatte) in den letzten zwei Jahren (ihres|ihrer|seines|seiner|vor|bis|der|des)/ sondern nach in den letzten zwei Jahren ohne ein vorgestelltes hatte und ohne folgendes ihres, ihrer, seines, seiner, vor, bis, der oder des. --Diwas (Diskussion) 18:49, 21. Dez. 2016 (CET)

In diesen Abschnitt sicher nicht; sonst explodiert die Seite, wird für alle unbrauchbar, und aus ein paar Beispielen wird auch niemand schlauer, der es nicht schon vorher gewusst hatte.
Ich bin mir der Problematik bewusst.
Was es braucht, ist eine eigene Parallel-Seite ausschließlich zum Thema insource:.
Ich bin seit Monaten völlig überlastet, habe längst konkrete Pläne für eine derartige Seite.
Was es erstmal braucht, ist eine Darstellung der speziellen Syntax, soweit sie bislang bekannt oder aus Erfahrung zu erlernen war. Diese ist weder bei MediaWiki noch bei der Upstream-Herkunft vollständig und ganz stimmig dokumentiert.
Wer Routine mit RegExp hat, und die Besonderheiten des analysierten Textformates mitbekommen hatte, für den ist es nicht so arg schwer, eine konkrete Suchaufgabe zu lösen.
Die Tücke ist vielmehr, das dann auch für Normalbenutzer verständlich darzustellen. Ein wirrer Haufen spezieller Beispiele hilft niemanden, macht es nur schlimmer.
VG --PerfektesChaos 19:23, 21. Dez. 2016 (CET)
Wäre es erfolgversprechend, die Darstellung der speziellen Syntax auf einer Baustelle von erfahrenen insource:regexlern zu erabeiten (unter Wikipedia:Technik/Baustellen oder bei Meta:, Mediawiki:, ...?) oder wäre es doch besser, du machst das (soweit es dir bekannt ist) irgendwann einmal aus einem Guss? --Diwas (Diskussion) 20:51, 21. Dez. 2016 (CET)
Es gibt relativ wenige Leute, die sowohl den Sachverhalt beherrschen als auch einigermaßen verständliche Hilfeseiten schreiben können; ich hoffe, mich auch zu letzteren zählen zu können.
Baustelle wäre WP:BETA; dort müsste zunächst die insource- und spezifische RegExp-Syntax (soweit bekannt und verstanden) präzise dokumentiert werden. Anschließend kann man drangehn und sich Beispiele ausdenken; für diese reicht es aber nicht aus, einfach ein Konstrukt mit Code hinzuknallen, sondern man muss jeweils erklären, welche Suchaufgabe man lösen möchte, dann den Code dazu angeben, und dann auf Besonderheiten in dem Konstrukt hinweisen, wobei sich der Schwierigkeitsgrad von Beispiel zu Beispiel steigert. Damit das auch verständlich wird, braucht es relativ viel Platz und eine gute Struktur; weshalb das Reindrücken in den Abschnitt der allgemeinen Cirrus-Seite nur Bruch bringen würde.
Für Dateien und Deepcat gibt es bereits ausgelagerte Schwesterseiten.
Ich habe zwei Dutzend offene Baustellen; und die werden davon auch nicht besser und ich immer konfuser, auf je mehr Hochzeiten ich gleichzeitig tanze. Ich fange deshalb keine nicht-dringlichen Aufgaben mehr an, die sich nicht binnen eines Tages beenden ließen, bis ich das nicht auf einen stabilen Zwischenzustand heruntergearbeitet hätte.
VG --PerfektesChaos 21:20, 21. Dez. 2016 (CET)
@Diwas: Frohes Neues.
Du könntest jetzt mal HD:Suche/insource einweihen und in einem Abschnitt deine Vorschläge auflisten für didaktisch kommentierte Beispiele. Zwei sehr einfache Fälle habe ich an den Anfang gestellt; ein ziemlich komplexes steht am Ende und mag die Krönung bilden. Dazwischen wären stufenweise immer schwierigere Fälle zu diskutieren.
VG --PerfektesChaos 14:04, 2. Jan. 2017 (CET)

prefix vs intitle

Hallo zusammen, warum klappt intitle, aber nicht prefix bei dieser Suche? Grüße, --Ghilt (Diskussion) 11:03, 6. Mai 2018 (CEST)

Weil prefix: immer der letzte Parameter sein muss, weil alles, was danach kommt, der Beginn des Seitennamens (einschließlich Namensraums, korrekt) wäre.
Ständig beschäftigt, auch mit der anderen Angelegenheit …
VG --PerfektesChaos 11:13, 6. Mai 2018 (CEST)
Super, vielen Dank und Grüße, --Ghilt (Diskussion) 11:21, 6. Mai 2018 (CEST)

Cirrus mit API abfragen

Gibt es eine Möglichkeit Sucheanfragen per Cirrus über die API abzufragen? Also z.B. Suche nach nearcoord:50000km,51.049259,13.73836 incategory:All_media_needing_categories_as_of_2018 in einer API-Abfrag wie Bilder einer Kategorie. Über die ApiSandbox fand ich nur die Umkreissuche nach z.B. Kategorien, aber keine Möglichkeit der Verschneidung von Umkreis und incategory wie bei Cirrus. -- sk (Diskussion) 12:31, 1. Aug. 2018 (CEST)

mw:API:Search – LG --PerfektesChaos 12:38, 1. Aug. 2018 (CEST)
@PerfektesChaos: Also so kriege ich mit der Search-Abfrage alle Bilder einer Kategorie hin. Aber wie kann man das mit der oben gezeigten "&list=geosearch&search=nearcoord" verknüpfen? Gibt es eine logisches AND? Also "&list=search" + "AND" + "&list=geosearch". Stehe gerade auf dem Schlauch. So hier geht es leider nicht. Dannke für deine Hilfe. -- sk (Diskussion) 13:22, 1. Aug. 2018 (CEST)
Nicht bei über dreißig Grad.
mw:API:Showing nearby wiki information und das dort angegebene Beispiel; suche dort nach generator=geosearch, was dir eine Auswahl an Seiten liefert, und innerhalb derer mit Cirrus nach einem beliebigen Text suchen; oder wenn du bereits eine Kategorie kennst, dann eher mit mw:API:Categories unter Angabe von clcategories= – was diejenigen mit Resultaten ausstattet, die die geosearch-Bedingung erfüllen und entsprechend kategorisiert sind.
Beachte generell mw:API:Query #Generators für die erfragte UND-Verknüpfung.
Viel Erfolg --PerfektesChaos 13:45, 1. Aug. 2018 (CEST)
Danke. Muss ich mir mal anschauen. Bin aber schon selber zu einer Lösung gekommen. Das man einfach das Suchmuster in srsearch reinwirft, war bei 32,6 Grad zu viel. :-) -- sk (Diskussion) 13:50, 1. Aug. 2018 (CEST)

Fragen zu deepcat und OR

Hi, ich versuche jetzt seit Stunden, der Cirrus-Suche folgende Infos zu entlocken, ausgehend von der folgenden Oberkategorie:

Kategorie Transgender-Person wurde nicht gefunden

00 = incategory:"Transgender-Person"

189 = deepcat:"Transgender-Person"

Der 2. Aufruf zeigt nur 66 Einträge – genau wie der erste (1 Weiterleitung wird nicht als "Seite" gezählt). Warum funktioniert deepcat nicht?

Ich bekomme kein OR-Ergebnis hin:

Im Endergebnis suche ich einen Aufruf, der folgende Schnittmenge prüfen soll:

  • Mann (und Frau oder unbekannt oder nichtbinär)?
incategory:Mann incategory:Frau OR incategory:"Geschlecht unbekannt" OR incategory:"Nichtbinäre Person"

Ergebnis: 0
Aber 1 Mann ist auch Frau (temporär falsch zugeordnet): incategory:Mann incategory:Frau

Kann jemand helfen? Gruß --Chiananda (Diskussion) 03:06, 16. Jun. 2020 (CEST)

Vielleicht hilft https://www.mediawiki.org/wiki/Help:CirrusSearch/Logical_operators#Converting_AND_and_OR. Gruß --FriedhelmW (Diskussion) 13:59, 16. Jun. 2020 (CEST)
Oh, bei Cirrus bedeutet OR also nicht "und/oder", sondern entspricht einem SHOULD im Sinne von "nach Möglichkeit auch". Könnte vielleicht in der umseitigen Doku angemerkt werden…
Liefert im vorliegenden Fall also keine brauchbaren Ergebnisse. Stattdessen braucht es 3 Einzelaufrufe, um Schnittmengen einer Kategorie mit einer von drei anderen zu suchen.
Warum deepcat: keine Seiten aus Unterkategorien der 1. Ebene liefert, verstehe ich weiterhin nicht (5 Ebenen wären laut Doku möglich).
Warum deepcat: und incategory: nur 66 der Seiten 0 aus der Kategorie:Transgender-Person liefert, konnte ich aufklären: Die 1 Weiterleitung (mit PA) wird nicht als "Seite" gezählt. Damit erweist sich Cirrus als nicht geeignet für mein Projekt, muss weiterhin PetScan nutzen.
Gruß --Chiananda (Diskussion) 15:11, 16. Jun. 2020 (CEST)

linkedfrom:

Gibt es das Gegenteil von linksto: auch bzw. kann man dieses ggf. indirekt erreichen? Anwendungsfall ist z.B. dass alle in einer Liste verlinkten Artikel gefunden werden sollen. --Leyo 11:23, 27. Aug. 2020 (CEST)

Das geht über die API. Gruß --FriedhelmW (Diskussion) 13:52, 27. Aug. 2020 (CEST)
Danke für die Antwort! Ich auch eine Kombination mit -hastemplate: möglich? --Leyo 15:04, 27. Aug. 2020 (CEST)
Da passt PetScan besser. --FriedhelmW (Diskussion) 16:03, 27. Aug. 2020 (CEST)

Nein, es gibt nur das, was ohnehin in der Datenbank in der einschlägigen Tabelle steht und bei jeder Abspeicherung aktualisiert wird; Cirrus greift auf diese einzelne Datenbanktabelle zu.

  • linksto: ist nichts anderes als die Spezial:Linkliste und auch die ist nur ein Abfallprodukt.
  • Tatsächlich muss der Wiki-Server für die Seitengenerierung wissen, wenn eine Seite gelöscht wird oder ein bisheriges Rotlink neu angelegt wird, damit von Blau auf Rot bzw. Rot auf Blau umgeschaltet werden kann. Aus gleichem Grund muss bei Änderung einer eingebundenen Vorlage die Seitendarstellung als unrein markiert werden, und eine angelegte oder wegfallende Weiterleitung ändert ebenfalls die Seitendarstellung. Nur deshalb führt der Server Buch darüber, was welche andere Seite beeinflusst. Die Spezialseite und Cirrusfunktion sind nur Mitesser.
  • PetScan & Co. (Quarry) machen eine eigenständige Auswertung mehrerer miteinander verknüpfter Datenbanktabellen.

VG --PerfektesChaos 17:22, 27. Aug. 2020 (CEST)

Ergänzung zu hastemplate

Auf beta hab ich das nachgestellt: Die Vorlage hat zwei Einbindungen, die entsprechende Suche mit "hastemplate" findet aber nur ein Vorkommen, das zweite in einer Weiterleitungsseite wird ignoriert.

Hier ist ähnliches mit der Vorlage Personendaten zu beobachten, diese wird 2.323 mal in Weiterleitungen eingebunden, und genau diese 2.323 ist die Differenz zwischen Suche mit "hastemplate" und tatsächlicher Anzahl an Einbindungen. Siehe dazu auch Benutzer_Diskussion:Wurgl#Anzahl_Personenartikel

Ich schlage daher vor, einen Satz wie "Die Suche mit "hastemplate" findet kein Vorkommen der Vorlage in Weiterleitungsseiten" zu ergänzen. --Wurgl (Diskussion) 09:41, 19. Feb. 2021 (CET)

Das lässt sich noch allgemeiner formulieren: Nichts von dem, was auf einer Weiterleitungsseite steht, wird irgendwie in den Suchbaum und die Treffer aufgenommen, ausgenommen ihr Weiterleitungsziel und der Seitentitel.
Ich denke mal drüber nach wohin damit.
LG --PerfektesChaos 14:47, 19. Feb. 2021 (CET)
Ja, das sollte als grundsätzlicher Hinweis wiederholt angemerkt werden.
Ich habe paar nette Sachen mit incategorie: und deepcategorie: zusammengestellt – da musste immer beistehen, dass keine Weiterleitungen gelistet werden.
Kleine Nebenfrage: Wie suche ich nach dem Lattenkreuz # innerhalb eines Suchtextes in Anführungszeichen? Das hilft bei der Suche nach Wikilinks auf Abschnittstitel.
Und überhaupt: Wie kann Cirrus so schnell ein neu zugefügtes Wort innerhalb des Textkorpus der WP-Artikel finden? Hatte mich letztens vertippt und fand das Vorkommen bei einer Suche im Anschluss sofort… Gruß --Chiananda (Diskussion) 02:47, 20. Feb. 2021 (CET)

prefer-recent:

Gibt es da auch das Gegenteil davon, also, dass lange nicht mehr bearbeitete Seiten priorisiert werden? --Leyo 16:52, 5. Jan. 2022 (CET)

In der offiziellen Beschreibung wird nichts erwähnt.
Eine boolesche Negation mit - scheidet auch aus.
Aber geeignete Zahlenwerte müssten das bewirken. 0.99 und 9999
Musst du selbst experimentieren, und Laborprotokoll nicht vergessen.
Seit ich die Hilfeseite geschrieben hatte, habe ich mich nie wieder mit diesem Feature befasst.
VG --PerfektesChaos 18:24, 5. Jan. 2022 (CET)
Besten Dank! Ich habe basierend auf deinen Angaben etwas rumprobiert, kriegte aber das Gewünschte nicht hin. Allgemein ergaben sich ziemlich wenige Änderungen in der Reihenfolge. --Leyo 21:55, 5. Jan. 2022 (CET)

Anmerkung: Wenn ich mir eine Suche bastle und die lange nicht bearbeiteten Seiten zuerst aufrufen oder ändern möchte, dann setze ich im Suchformular das sort=last_edit_desc auf sort=last_edit_asc = Beispiel: verlinkt Halloween also „Sortieren nach zuletzt bearbeitet – älteste zuerst“. Vielleicht kannst du damit arbeiten, muss allerdings direkt in der URL umgeschrieben werden. Ich habe das auch hier Hilfe:Suche/Formular#Sortierreihenfolge beschrieben. --Liebe Grüße, Lómelinde Diskussion 10:49, 6. Jan. 2022 (CET)

Besten Dank! Das ist genau, wonach ich gesucht habe. Ich habe umseitig einen kleinen Hinweis auf diese Möglichkeit hinterlassen.
Für mich ist es unverständlich, dass im Dropdown-Menü der erweiterten Suche nicht auch die Optionen Letzte Bearbeitung – älteste zuerst bzw. Erstelldatum – älteste zuerst existieren. --Leyo 11:41, 6. Jan. 2022 (CET)
Ja das finde ich auch doof, aber zumindest habe ich irgendwann diese Möglichkeit gefunden und gesehen, dass die beiden Systemnachrichten im November 2020 von Raymond erstellt wurden. Vielleicht kommt es noch irgendwann als normale Option hinzu. --Liebe Grüße, Lómelinde Diskussion 12:17, 6. Jan. 2022 (CET)

Weiterleitungen ausschliessen

Können Weiterleitungen von den Treffern ausgeschlossen werden, insbesondere im Zusammenhang mit intitle:? Beispiel: hastemplate:Personendaten intitle:/[A-Z]\.[A-Z]/ --Leyo 20:29, 25. Jul. 2022 (CEST)

Nein, das ist nicht vorgesehen. Vergleiche auch phab:T204089 und How to exclude redirects from search results? — Speravir – 01:36, 16. Aug. 2022 (CEST)
Danke! Die Ablehnungsgründe scheinen mir wenig überzeugend zu sein. --Leyo 02:02, 16. Aug. 2022 (CEST)
Geht mir genauso. — Speravir – 01:16, 17. Aug. 2022 (CEST)

Suche nur in Unterkategorien

Mit deepcategory: bekomme ich in Commons ja alle Bilder, die in der genannten Kategorie oder einer Unterkategorie enthalten sind. Ich würde aber gerne nur die Unterkategorien durchsuchen. Gibt es dafür irgendeine Möglichkeit, die ich übersehen habe?
(Oder gibt es eine andere Möglichkeit, mein eigentliches Ziel zu erreichen: Aus einer Kategorie alle Bilder zu entfernen, die in einer ihrer Unterkategorien enthalten sind?) --Plozessor (Diskussion) 13:38, 15. Mai 2023 (CEST)

Den endgültigen Plan habe ich noch nicht so ganz verstanden.
Aber wenn du von dem deepcategory:-Ergebnis mit -incategory: die Start-Kat abziehst, bekommst du: „nur die Unterkategorien durchsuchen“
Weil jedoch deepcategory: immer auch incategory: enthalten würde, sehe ich keine Möglichkeit, mit einem einzigen Cirrus-Ausdruck zu erreichen: „alle die sowohl in einer Kategorie als auch einer ihrer Unterkategorien enthalten“
Das ginge indirekt mit WP:API, WP:Quarry oder möglicherweise trickreichem petscan; oder für jede direkte Unterkategorie einzeln (deren einzelne deepcategory und gleichzeitig die incategory der Basis-Kategorie).
Generell wüsste ich kein Werkzeug, das diese Aufgabe fertig zur Verfügung stellt.
Weil aber Mehrfachkategorisierung eine Standard-Aufgabe ist, kennt Kategorie-Personal vielleicht einen Weg.
Um für das gesamte Commons-Projekt regelmäßig und systematisch nach derartigen Mediendateien zu suchen, müsste das dortige Wartungspersonal eine stundenlang wühlende Methodik bauen, oder hat ggf. bereits eine solche Prozedur (sofern Mehrfachkategorisierung offiziell unerwünscht wäre).
Es ist eine extrem ressourcenfressende Aktion, alle Treffer eines Kategoriebaums mit allen Einträgen in der jeweiligen Basis-Kategorie zu vergleichen. Es bedarf für jede Basis-Kategorie einer Liste aller ihrer direkten Einträge plus einer Liste aller Einträge aller Unterkategorie-Untiefen, und diese beiden müssten dann zusammengeführt, sortiert und auf Dubletten untersucht werden.
VG --PerfektesChaos 15:20, 15. Mai 2023 (CEST)
Ja, genau ;) ... Ich habe mich ja ein wenig der Schutzgebiete und Denkmäler in meiner Umgebung (und deren Kategorien in Commons) angenommen. Und da gibt's halt immer wieder Bilder, die sind sowohl in "Pfarrweisach" als auch in "Cultural heritage monuments in Pfarrweisach" und dann nochmal unterhalb von "Cultural heritage monuments in Pfarrweisach" in "Marktstraße 8 (Pfarrweisach)". Bei den Schutzgebieten gibt's Bilder in "Naturpark Steigerwald", die sind auch in "Buchbrunnen bei Fatschenbrunn", was eine Unterkategorie von "Landschaftsschutzgebiet innerhalb des Naturparks Steigerwald" ist, was eine Unterkategorie von "Naturpark Steigerwald" ist.
Die gröbsten Themen hab ich aber bereits händisch erledigt, ist also nicht so dringend. Und ob es in allen Fällen gewünscht ist, die Kategorien derart aufzuräumen, ist nochmal eine andere Frage. Für gewisse Kategorien, in denen die meisten Bilder von mir sind, könnte ich es aber verantworten ;) --Plozessor (Diskussion) 16:13, 15. Mai 2023 (CEST)
Naja, je nach Situation darf ein Bildchen durchaus in benachbarten Unterkategorien stehen; nicht aber auf demselben Pfad oben und unten.
Nehmen wir einen Icon mit einem blauen Dreieck.
  • Das darf eingeordnet werden in „Icon“ → „Icon mit einem blauen Symbol“.
  • Das darf eingeordnet werden in „Icon“ → „Icon mit einem Dreieck“.
  • In „Icon“ darf es jedoch nicht eingeordnet sein.
Die Struktur von Pfarrweisach und Steigerwald durchschaue ich zu wenig, um das beurteilen zu können. Aber auch da würde man nach hiesigen Regeln nicht gleichzeitig in einer Oberkat ein Bild haben wollen, sofern der Kategoriebaum nicht verheddert ist.
VG --PerfektesChaos 16:54, 15. Mai 2023 (CEST)
Genau, es geht mir um Kategorien, die klar strukturiert sind. Also z. B.

  • Naturpark XX
    • Landschaftsschutzgebiet innerhalb des Naturparks XX
      • Naturschutzgebiet YY (liegt vollständig im Landschaftsschutzgebiet innerhalb des Naturparks XX)
        • Naturdenkmal ZZ (liegt im Naturschutzgebiet YY)

oder

  • Ort
    • Ortsteil
      • Gebäude in Ortsteil
        • Gebäude in Straße XY
          • Gebäude Straße Hausnr. 5

Es gibt auch (obwohl mich das nicht direkt interessiert):

  • Werke des 16. Jahrhunderts
    • Werke der 1560er Jahre
      • Werke von 1562

Natürlich gibt es auch Kategorien, die nicht so streng hierarchisch sind, um die geht es mir nicht. --Plozessor (Diskussion) 18:31, 15. Mai 2023 (CEST)