Benutzer Diskussion:Mabschaaf/Quelltextfehler
Diskussion zu den RegEx-Ausdrücken
[Quelltext bearbeiten]@Mfb: Sollten wir die von Dir eingefügte letzte Spalte nicht hierher verlagern, dann werden Kommentare dazu einfacher. Mein Vorschlag wäre: Vorne alle Suchlinks entfernen, die noch nicht optimal sind oder noch diskutiert werden sollten, die Vorschläge hierher umziehen, dafür vorne die Zeilen durchnummerieren, damit man den Bezug leichter herstellen kann. --Mabschaaf 17:03, 10. Dez. 2014 (CET)
- Können wir auch machen. Suchstrings->HTML sollte mit Tools wie diesem gehen - aber nur den Suchstring nehmen, sonst wird zu viel umgewandelt.--mfb (Diskussion) 17:19, 10. Dez. 2014 (CET)
chemi* insource:/[0-9]ß-/
findet noch einen.--Mabschaaf 17:26, 10. Dez. 2014 (CET)
#12
[Quelltext bearbeiten]n-Butan: Suchstring chemi* insource:/ n-[A-Z]/
gibt viele false positives (n-Eck, n-Halbleiter, ...), ohne dass ich eine gute Trennmöglichkeit sehe. Insgesamt 150 Treffer. Mit Infobox Chemie noch 80 Treffer, davon aber 30 durch eine Navileiste bei der das sinnvoll ist. --mfb (Diskussion) 17:19, 10. Dez. 2014 (CET)
- Letztere Treffen können ja mittels
chemi* insource:/[^(sleiste)] n-[A-Z]/
oder ähnlich entfernt werden. --Leyo 18:54, 10. Dez. 2014 (CET)- So funktionieren Charakterklassen ( [ ] ) nicht. Im Prinzip gibt es lookbehind dafür, aber das unterstützt die Suche wohl nicht. Was die Hilfe noch verrät:
< > "
haben besondere Funktionen.- Naja, das scheint nicht so schlecht zu passen. Publikationstitel kriegt man wohl fast nicht raus. --Leyo 00:24, 14. Dez. 2014 (CET)
- So funktionieren Charakterklassen ( [ ] ) nicht. Im Prinzip gibt es lookbehind dafür, aber das unterstützt die Suche wohl nicht. Was die Hilfe noch verrät:
zu allen
[Quelltext bearbeiten]Das einschränkende chemi*
oder insource:"{{Infobox Chemikalie"
sollte generell weggelassen werden, wenn dadurch keine Massen an false-positives entstehen.--Mabschaaf 17:33, 10. Dez. 2014 (CET)
- Teilweise kann ich mir diese Massen vorstellen, ansonsten ist es aber auch einfach schonender für den Server. Reguläre Ausdrücke auszuwerten kostet Zeit, wenn das nur für xx.xxx Chemie-Artikel geschehen muss ist das viel schneller als wenn es für 1,8 Millionen Artikel geschieht. --mfb (Diskussion) 23:17, 10. Dez. 2014 (CET)