Wikipedia Diskussion:Technische Wünsche/Topwünsche/Tabellen in PDFs darstellen
Bitte achtet auf einen freundlichen Umgangston.
Das Projekt Technische Wünsche lebt vom Austausch. Alle Beiträge sind willkommen, solange sie konstruktiv sind. Das Projektteam bittet von persönlichen Angriffen oder beleidigenden Kommentaren abzusehen. Siehe dazu auch: Wikiquette, Wikiliebe, Keine persönlichen Angriffe |
Wunsch Tabellen in PDF darstellen - Stimmungsbild zum Lösungsvorschlag
[Quelltext bearbeiten]Hallo ireas, MGChecker, тнояsтеn, Michi, 'Man77, Morten Haan, APPER, Atamari, Cirdan, XenonX3, Arnd, Raymond, hgzh, Daniel749, dcb, Torana, Schnark, Furfur, DerHexer, Freddy2001, DJ und alle Interessierten -
Bei der Wikimania 2016 hat sich das Team der Softwareentwicklung nochmal intensiv mit dem PDF-Wunsch beschäftigt und mit einigen Entwicklern von der WMF sowie mit Leuten hier aus der Wikipedia (v.a. mit Raymond und Michi) Ansätze überlegt und diskutiert. Nachdem es zunächst so aussah, als dass der Wunsch aufgrund der hohen Komplexität und des Aufwands nicht adressiert werden kann, gibt es jetzt eine mögliche machbare Alternative und damit einen Vorschlag zum Vorgehen. Es wäre super, wenn sich alle den Vorschlag mal ansehen, und ein pro/contra Kommentar abgeben könnten (möglichst bis zum 07.08.). Vielen Dank! --Lea Voget (WMDE) (Diskussion) 15:51, 1. Aug. 2016 (CEST)
Zur aktuellen Situation
[Quelltext bearbeiten]Aktuell werden PDFs mithilfe der Software Latex erstellt. Latex sorgt dafür, dass Dokumente automatisch ein gutes Layout erhalten. Allerdings ist es sehr schwer, mit Latex Tabellen einzufügen, da diese in ihrer Breite, Größe und anderen Eigenschaften unberechenbar sein können. Aus diesem Grund wurden Tabellen bisher im PDF nicht mit ausgeliefert. Das Team hat den Hackathon der Wikimania dazu genutzt, zu evaluieren, ob es in einer angemessenen Zeit machbar sein würde, Tabellen sinnvoll bei Latex einzufügen. Leider ist das nicht der Fall.
Lösungsvorschlag
[Quelltext bearbeiten]Angeboten werden kann, hinter dem Link "Als PDF herunterladen" nicht nur die aktuelle schöne, aber teilweise unvollständige Latex-PDF-Version anzubieten, sondern eine weitere, die einen sogenannten “Browser-based Rendering Service” verwendet. Diese Version sieht so ähnlich aus wie die Darstellung, die man erhält, wenn wann über "Druckversion" geht und anschließend die PDF-Funktion im Browser nutzt.
Der Vorteil: Diese Version ist auf jeden Fall vollständig und kann mit allen Arten von Tabellen umgehen.
Der Nachteil: Sie ist nicht so kompakt und behandelt Seitenumbrüche nicht immer elegant (siehe Beispiel).
Zu beachten ist, dass die neue Version parallel zur Latex-PDF-Version angeboten werden soll. Nicht alle Artikel haben Tabellen, und die Latex-Darstellung ist optisch eleganter. Beide Alternativen müssten dann auf der Download-Seite entsprechend gekennzeichnet und kurz erklärt werden.
Beispiele
[Quelltext bearbeiten]Artikel: Fußball-Europameisterschaft 2016.
Die beiden Beispiel-PDFs sind auf der rechten Seite abgebildet. Sie stammen von einer älteren Version der Seite.
Das Beispiel zeigt typischen den Anwendungsfall, der verbessert werden könnte:
- Einzelner Artikel
- Viele Tabellen im Artikel, teilweise auch für Layout-Zwecke benutzt, anstatt zur Darstellung tabellarischer Daten (wie hier im Abschnitt “Finalrunde”)
Fragen
[Quelltext bearbeiten]- Soll der Lösungsvorschlag implementiert werden für den Download/PDF-Druck einzelner Artikel?
- hgzh 16:08, 1. Aug. 2016 (CEST) PS: Der Ping wurde mir nicht zugestellt, ich habe dies rein zufällig gesehen. Ja. Gerade bei dem Beispielartikel war die bisherige PDF-Ausgabe reiner Hohn. Der Vorschlag macht zwar Abstriche bei der Form, ist aber inhaltlich vollständig. --
- Auch bei mir gab es keinen Ping, ich bin über den Kurier hierher gekommen. Die Ausgabe ohne Tabellen ist insbesondere bei Listenartikeln völlig unbrauchbar, bei der neuen Ausgabe kann ich keinen Vorteil gegenüber der bisherigen Druckversion feststellen. Wenn ihr das also machen wollt, solltet ihr die neue PDF-Ausgabe als Druck- und nicht als Exportversion kennzeichnen. Ich träume ja immer noch von einer Exportausgabe, die alles unter einen Hut bekommt, ggf. im Querformat. --Morten Haan 🍹 Wikipedia ist für Leser da • Skin-Entwurf 17:14, 1. Aug. 2016 (CEST)
- Auch von mir ein Print.css berücksichtigt werden wird/kann. Das ermöglicht dann projektspezifische Anpassungen im Druckstylesheet. — Raymond Disk. 17:43, 1. Aug. 2016 (CEST) Ja für diese Lösung. Hinweis: Bitte prüfen, ob die lokale
- Klares Sänger ♫ (Reden) 17:52, 1. Aug. 2016 (CEST) Was das Ping angeht: Mehr als 5 Pings sind pro Beitrag nicht drin, dann werden afaik alle ignoriert. Ja, der Artikel zeigt deutlich, das ein Auslassen der als Tabelle formatierten Elemente das PDF in diesem Falle komplett unbrauchbar macht, da die wesentlichen Fakten fehlen. Grüße vom
- Nur kurz zur Aufklärung: Wir haben nachgeguckt, und die Pings wurden nicht geschickt, weil ich mehr als einen Abschnitt angelegt hatte. Wir arbeiten ja auch gerade an dem Wunsch, beim Speichern über abgegebene Benachrichtigungen informiert zu werden. In dem Zuge werden wir die eben genannte Regel auch aufheben. Stattdessen werden dann immer alle Benachrichtigungen versendet, die in dem Abschnitt waren, der signiert wurde (bei den anderen können wir ja keine Aussage darüber treffen, ob die Nutzerlinks als Benachrichtigungen gemeint waren). Das aktuelle Pinglimit pro Beitrag sind übrigens 50, nicht 5 (die Info ist aber bislang sehr versteckt. Auch das werden wir zu ändern versuchen). Viele Grüße, --Lea Voget (WMDE) (Diskussion) 18:16, 10. Aug. 2016 (CEST)
- Ja, auch wenn ich vor drei Jahren diese Entwicklung erst für kurz vor 2026 prognostiziert habe. --Schnark 09:19, 2. Aug. 2016 (CEST)
- MGChecker – (📞| 📝| ) 13:38, 2. Aug. 2016 (CEST) Ja, allerdings ist der Ping nicht angekommen. --
- hugarheimur 19:27, 4. Aug. 2016 (CEST) Ja – zufriedenstellend ist diese Lösung aber natürlich nicht wirklich. Selbstverständlich erwartet der Leser, der die PDF-Funktion nutzt, dass er am Ende in jedem Fall einen vollständigen Artikel in PDF-Form erhält. Ideal wäre es also, wenn man quasi die durch browser based rendering entstandenen Tabellen in das Latex-Dokument einbauen könnte (so stelle ich mir das als Nicht-Programmierer vor). Grüße
- Furfur ⁂ Diskussion 20:35, 4. Aug. 2016 (CEST) Ja – ich finde die Lösung gar nicht so schlecht. Das zweispaltige Layout bei der LaTex-Version gefällt mir nicht. Das mag bei reinem Text besser aussehen, aber schon wenn Bilder ins Spiel kommen, die etwas größer sind als eine Textspalte, kommen massive Probleme auf. Ich finde, dem Leser ist nicht geholfen, wenn aus Gründen der vermeintlichen „Eleganz“ der Darstellung Teile des Artikelinhalts in der PDF-Version einfach weggelassen werden. Wenn keine Tabellen in LaTex realisiert werden können, dann ist LaTex meiner Ansicht nach nicht für die PDF-Erzeugung geeignet und man sollte sich dann etwas anderes überlegen. Vielleicht ist es mit der neuen Methode sogar einfacher, auch andere Wünsche (z. B. im PDF anklickbare Referenzen) zu realisieren. --
- Cirdan ± 22:16, 4. Aug. 2016 (CEST) Ja Unbedingt und am liebsten noch vor September für WLM. Weitergedacht wäre es gut, wenn man bei der Generierung von Tabellen aus Wikidata (eine Funktionalität, die ja früher oder später kommt, nehme ich an) auch das Thema PDF-Export nochmal aufgreift und mitbedenkt. Vielleicht lässt sich da was machen.--
- Atamari (Diskussion) 23:52, 4. Aug. 2016 (CEST) Ja Die Zweispaltigkeit sieht nur subjektiv besser aus. Aber in sehr vielen Artikeln werden Tabellen verwendet, diese enthalten auch wichtige Informationen.--
- Daniel749 Disk. (ST–WPST) 00:16, 5. Aug. 2016 (CEST) Ja Es ist eine gute Lösung, die man weiterentwickeln könnte (Verbesserung von Zeilenumbrüchen; neue Funktionen einbauen – siehe oben). --
- DCB (Diskussion • Bewertung) 10:51, 5. Aug. 2016 (CEST) Ja —
- DerHexer (Disk., Bew.) 21:12, 6. Aug. 2016 (CEST) Ja —
- Sollte es dieses Angebot auch für die Funktion “Buch erstellen” geben, angenommen, dass es gelingen würde, Titel und Referenzen wie bisher zu behandeln? (Dies müsste aber noch geklärt werden, wenn der Wunsch überhaupt besteht)
- Vielleicht denke ich zu praktisch oder es geht mir die Entwickler-Binnensicht ab, um das realistisch einzuschätzen, aber ahnungslos, wie ich bin, würde ich, wenn das PDF-Latex-Machen so unberechenbar ist, einfach aus dem Wikitext mit Mediawiki wie im Artikel eine Tabelle generieren lassen, die Tabelle in eine Rastergrafik konvertieren lassen, und die dann ihren Dimensionen entsprechend von Latex als weitere Grafik ins PDF einbinden lassen. … «« Man77 »» (A) wie Autor 19:53, 1. Aug. 2016 (CEST)
- Das ginge schon, würde aber mMn die Weiterverwendung als Text einschränken. --Morten Haan 🍹 Wikipedia ist für Leser da • Skin-Entwurf 20:08, 1. Aug. 2016 (CEST)
- Ja, man müsste doch wohl einfach nur die Methode für eine einzelne Seite auf eine im Hintergrund temporär erzeugte Seite mit folgendem Inhalt anwenden. --Schnark 09:19, 2. Aug. 2016 (CEST)
- Furfur ⁂ Diskussion 20:35, 4. Aug. 2016 (CEST) Ja ! --
- DCB (Diskussion • Bewertung) 10:51, 5. Aug. 2016 (CEST) Ja —
= Titel 1 = {{:Titel 1}} = Titel 2 = {{:Titel 2}}
Ergebnis
[Quelltext bearbeiten]Vielen Dank für die Kommentare! Aufgrund des sehr klaren Stimmungsbild ist der Plan nun folgender: Das Services-Team der Wikimedia Foundation wird einen Server für Browser-based rendering bereitstellen (phab:T142226). Das WMDE-Team wird dann die Anbindung schreiben, dass PDFs auf diese neue Art und Weise heruntergeladen werden können (phab:T135643). Außerdem wird untersucht werden, inwieweit das Unterstützen einer Buchfunktion möglich ist.
Noch ein Hinweis zu dem hier diskutierten "Mischvorschlag", dass Tabellen durch das neue Verfahren erstellt und dann in die alte Latex-Version eingebunden werden könnten. Wenn Tabellen extern erzeugt und dann eingebunden werden, müssen sie auf die Seitenbreite skaliert werden. Dabei wird die Schriftgröße potentiell sehr klein, sodass ein gutes Layout nicht gewährleistet werden könnte. Zudem würde sich der Erstellungsprozess durch das separate Erstellen der Tabellen deutlich erhöhen und wäre ein Mehraufwand gegenüber der Lösung, das ganze PDF auf die neue Art und Weise zu generieren. Wenn man die Tabellen als Rastergrafiken erstellen würde, gäbe es zusätzlich dazu Probleme mit dem Markieren von Text und der Lesbarkeit, weil beim Verändern der Größe die Buchstaben nur als "Pixelhaufen" wahrgenommen und somit unscharf würden. Zudem verbraucht eine Rastergrafik als Bild deutlich mehr Speicherplatz als Text, was sich auch auf die Größe des PDFs auswirken würde. --Lea Voget (WMDE) (Diskussion) 16:28, 8. Aug. 2016 (CEST)