Diskussion:Data Warehouse
Alte Diskussion
[Quelltext bearbeiten]Hallo, zwei zusätzliche Aspekte: 1.) Transformation Ein DW macht aus operativen Daten entscheidungsrelevante Informationen. 2.) Lang lebe das operative System Mit Einsatz eines DW kann das/die operative(n) System(e) bereinigt werden. Was nicht mehr gebraucht wird -> rein ins DW und weg aus dem operativen System.
LG, Stephan
Tzeh 27.2.2004
Hallo, Stern,
Dank für Deinen Beitrag zur Rechtschreibung!
Aus Sicht der Germanisten hast Du bzgl. der Orthographie sicher recht,
Data-Warehouse mit Bindestrich zu schreiben. Nur schreibt (fast) keiner in der Praxis so; suche mal bei google nach "Data-Warehouse"; Du wirst (fast) nur "Data Warehouse" finden, da es sich so eingebürgert hat. Sogar die folgende Schreibweise gibt es: "Data Warehouse-gestützte Anwendungen...", obwohl bei drei- und mehrsilbigen Worten die Bindestriche häufig anzutreffen sind (z.B. Data-Warehouse-System, Data-Warehouse-Prozess).Entsprechendes gilt z.B. für Knowledge Management oder Data Mining (auch wenn es bei Wikipedia inzwischen einen Eintrag Data-Mining gibt).
Je nach dem, was uns bei Wikipedia wichtiger ist (Orthographie oder "Praxiskonformität" = "Praxis der Ungebildeten") sollten wir uns hier entscheiden. Kannst Du herausfinden, wie die Gewichtung der beiden Aspekte bei Wikipedia ist?
Ich grüße Dich freundlich Thomas --tzeh 27. Feb 2004
Stern
- Deutsche Nomen schreibt man entweder zusammen (Datawarehouse, was sehr unüblich aussieht) oder mit Bindestrich. Das Wort ist ein englisches Lehnwort, das heißt aber nicht, dass man deswegen data warehouse im Deutschen schreibt, es heißt ja auch Tipp und nicht tip. Stern 16:27, 25. Feb 2004 (CET)
- Ich habe es zurückgeändert. Sollte der Begriff umgedreht werden, dann durch Löschen und Verschieben, damit die Versionsgeschichte erhalten bleibt. Das ändert nichts an meiner und Deiner Argumentation. Stern 16:33, 25. Feb 2004 (CET)
- Hallo, Stern. Du hast Recht, das deutsche Nomen zusammen oder mit Bindestrich geschrieben werden. "Data Warehouse" ist aber weder ein deutsches Nomen, noch ein Lehnwort (= fremdsprachiger Begriff, der in den allgemeinen deutschen Sprachgebrauch aufgenommen wurde) sondern ein englischer Begriff, der in der Form, ohne Bindestrich und auch nicht zusammengeschrieben, in der Fachpresse verwendet wird. Ich bitte das zurückzusetzen. --LC KijiF? 16:52, 20. Okt 2005 (CEST)
- Im Duden wird z. B. Desktoppublishing und Desktop-Publishing angeboten – aber nicht Desktop Publishing (okay, schlechtes Beispiel in Anbetracht von Desktop Publishing). Entsprechend wären Datawarehouse und Data-Warehouse richtig. Falls wir die englische Schreibweise als Zitatwort verwenden, müssen wir das Wort wie im Englischen kleinschreiben: data warehouse. Oder nich'? --kh80 •?!• 17:13, 20. Okt 2005 (CEST)
- Und nach noch intensiverer Recherche bin ich nun einigermaßen verwirrt. Der Duden bietet mit "Datawarehouse" an, was meinem Sprachempfinden und dem vieler Landsleute nun völlig entgegen läuft [1] vs. [2]. Die wissenschaftliche Publikationen vermischen "Data Warehouse" und "Data-Warehouse" oft in ein und dem selben Text und die Suchmaschine von Google unterscheidet die beiden Schreibweisen nicht, kann also hier nicht als Argument herhalten. Ich kann jetzt nur noch auf "Eigenname" plädieren, was dann auch die Großschreibung erklären würde. Ob's richtig ist, weiß ich nicht. --LC KijiF? 21:05, 20. Okt 2005 (CEST)
- Im Duden wird z. B. Desktoppublishing und Desktop-Publishing angeboten – aber nicht Desktop Publishing (okay, schlechtes Beispiel in Anbetracht von Desktop Publishing). Entsprechend wären Datawarehouse und Data-Warehouse richtig. Falls wir die englische Schreibweise als Zitatwort verwenden, müssen wir das Wort wie im Englischen kleinschreiben: data warehouse. Oder nich'? --kh80 •?!• 17:13, 20. Okt 2005 (CEST)
Tzeh 25.2.2004 da die übliche Schreibweise von "Data Warehouse" ohne Bindestrich ist, habe ich den Haupteintrag auf "Data Warehouse" verlagert und von dem Eintrag "Data-Warehouse" mitels REDIRECT auf den vorliegenden Eintrag verwiesen.
Tzeh 25.2.2004
Ich war so frei und habe den Passus "In einem Data-Warehause werden Daten (aggregiert) abgelegt, die für das operative Geschäft nicht mehr erforderlich sind,...)" gestrichen, da er nicht zutrifft.
Zum einen können die Daten im Data Warehouse durchaus noch im operativen Geschäft erforderlich sein (z.B. die Produkt- und Kundendaten)
und zum anderen gibt es in der Praxis zunehmend Data-Warehouse-Anwendungen, die auch das sog. operative Geschäft unterstützen.
Tzeh 12.12.2003 Die zitierten Begriffsdefinitionen dürften bezgl. des Urheberrechts keine Probleme aufwerfen. Die Definition von Inmon wird in fast alle Büchern über Data Warhouses zitiert; an der Definition von Bauer,Günzel habe ich selbst mitgearbeitet und die letzte ist von mir veröffentlicht worden. Ich habe mir die Freiheit genommen, den ursprünglichen Eintrag zu überarbeiten, da dieser "nur" aus der Sicht des Data Minings entstanden ist.
hallo lieber Anonymus 84.57.85.23,
Du beschreibst im Artikel Data-Warehouse das Data-Warehouse-System, obwohl es dafür bereits einen separaten Artikel gibt.
Ich schlage vor, daß wir dieses Part im Artikel Data-Warehouse streichen, bzw. dahingehend umformulieren, daß das Data-Warehouse die zentrale Komponente des Data-Warehouse-Systems ist.
Mit freundlichem Gruß Thomas tzeh 08:23, 29. Nov 2004 (CET)
Bindestrich-Schreibweise
[Quelltext bearbeiten]Darf man fragen, auf welchen Rechtschreibregeln deine "Aktion: deutsche Bezeichner, die aus dem Englischen übernommen worden sind, werden mit Bindestrich geschrieben" beruht, insbesondere in den Fällen "Balanced-Scorecard" und Competitive-Intelligence? Wirst du jetzt auch Künstliche Intelligenz (=Artificial Intelligence) nach Künstliche-Intelligenz verschieben? grüße, Hoch auf einem Baum 16:01, 7. Jun 2006 (CEST)
- Das basiert auf § 37 Regel E1 der amtlichen Regelung. Auch bei Verbindungen Adjektiv-Substantiv ist die Getrenntschreibung nur eine zulässige Nebenform, Zusammenschreibung der Standard. Der Hintergrund ist, dass ohne entsprechende Kenntnisse der Fremdsprache schwer zu erkennen ist, ob es sich um ein Adjektiv oder Substantiv handelt. Dein Beispiel mit der KI hinkt hier, da "künstlich" ein deutsches Wort ist.
- Ich begrüße Tzehs Aktion jedenfalls ausdrücklich. -- H005 20:18, 7. Jun 2006 (CEST)
- Natürlich darf (und soll) man fragen... Dank an H005 für die argumentative Schützenhilfe! Zur Bindestrichschreibweise ist die folgende Quelle "amtlich": http://rechtschreibrat.ids-mannheim.de/doku/teil1_regeln2006.pdf (siehe insbesondere Kapitel C). Ich räume ein, dass die Regelung nicht eindeutig ist und Freiräume bietet. Anfangs habe ich mich in den Diskussionen auch gegen die Bindestrich-Schreibweise gewandt; dann aber die Einsicht gewonnen, dass die Lesbarkeit und Verständlichkeit des Textes gewinnt. Innerhalb Wikipedia würde ich es begrüßen, wenn wir hierbei einheitlich vorgingen. Ich grüße Dich und H005 freundlich. Thomas tzeh 07:42, 8. Jun 2006 (CEST)
- Natürlich darf (und soll) man fragen... Dank an H005 für die argumentative Schützenhilfe! Zur Bindestrichschreibweise ist die folgende Quelle "amtlich": http://rechtschreibrat.ids-mannheim.de/doku/teil1_regeln2006.pdf (siehe insbesondere Kapitel C). Ich räume ein, dass die Regelung nicht eindeutig ist und Freiräume bietet. Anfangs habe ich mich in den Diskussionen auch gegen die Bindestrich-Schreibweise gewandt; dann aber die Einsicht gewonnen, dass die Lesbarkeit und Verständlichkeit des Textes gewinnt. Innerhalb Wikipedia würde ich es begrüßen, wenn wir hierbei einheitlich vorgingen. Ich grüße Dich und H005 freundlich. Thomas tzeh 07:42, 8. Jun 2006 (CEST)
Ergänzung hierzu am: Eine übersichtlich Darstllung zur Bindestrich-Schreibweise findet man unter:
http://www.canoo.net/services/GermanSpelling/Regeln/Bindestrich/Fremdwort.htmlAus
tzeh 13:42, 11. Nov 2007 (CEST)
Tatsächlich ist die Regelung mittlerweile eindeutig. Das Weglassen des Bindestrichs ist nur dann zulässig, wenn es sich bei dem ersten Wort um ein - natürlich im deutschen Sinne - Adjektiv handelt (Die Empfehlung zur Bindestrichschreibweise gilt allerdings nach wie vor); und "Data" ist kein Adjektiv. Daher muss hier ein Bindestrich stehen. Einzig richtige Schreibweise ist daher "Data-Warehouse". Siehe dazu die amtlichen Regeln des Rats der deutschen Rechschreibung, Abschnitt B, Kapitel 3 §37: "§ 37 Substantive, Adjektive, Verbstämme, Pronomen oder Partikeln können mit Substantiven Zusammensetzungen bilden. Man schreibt sie ebenso wie mehrteilige Substantivierungen zusammen." Ausnahme: "E4: Aus dem Englischen stammende Bildungen aus Adjektiv + Substantiv können zusammengeschrieben werden, wenn der Hauptakzent auf dem ersten Bestandteil liegt, also Hotdog oder Hot Dog, Softdrink oder Soft Drink, aber nur High Society, Electronic Banking oder New Economy." Es gilt demnach der Zusammenschreibungsgrundsatz; nur bei Begrifflichkeiten wie in E4 beschrieben, darf eine Ausnahme gemacht werden. Sie https://grammis.ids-mannheim.de/rechtschreibung/6155#
- @Wikivscvsc: Niemand bestreitet, dass es diese Regeln gibt. In diesem Fall grenzt die enge Auslegung der Regeln aber an Theoriefindung, weil die Schreibweise „Data-Warehouse“ in freier Wildbahn nicht wirklich existiert (vgl. Google-Suche). -- Carbidfischer (Diskussion) 15:44, 10. Nov. 2021 (CET)
- Ich arbeite in einer Anstalt des öffentlichen Rechts. Und selbstverständlich halten wir uns alle an die Regeln der deutschen Rechtschreibung - alle. Außerdem sollte jeder, der Kinder hat oder es mit Kindern nicht schlecht meint, ein gutes Vorbild sein. Und das halte ich für das wichtigste Argument. Der volkswirtschaftliche Schaden, weil unsere Kinder keine richtigen Rechtschreib-Vorbilder durch das öffentliche Umfeld haben, ist immens. Sogar auf Corflakes-Packungen stehen Worte wir "Moon Balls"; schrecklich. Moon-Balls hätte ich akzeptiert. Überdies: Viele schlagen bei Wiki Wörter nach, um sich nach der Rechtschreibung zu erkundigen. Etwas, dass offenbar nicht im Fokus von Wiki stehen möchte. Und zuletzt zur freien Wildbahn. Sich auf den Standpunkt des eigenen Unvermögens (nämlich die deutsche Rechtschreibung zu beherrschen) ist ein wahnsinnig schwacher Standpunkt. Tatsächlich bin ich entsetzt, dass soetwas überhaupt diskutiert wird. Es muss zumindestens im "Data Warehouse"-Artikel stehen, wie das Wort richtig geschrieben wird. --Wikivscvsc (Diskussion) 00:52, 13. Nov. 2021 (CET)
- Das Thema Durchkopplung liegt dir offensichtlich am Herzen. Im Sinne von AGF möchte ich dich aber trotzdem bitten, potenziell verletztende Unterstellungen zu unterlassen. Ich meine es natürlich nicht schlecht mit Kindern und meine Rechtschreibkenntnisse haben zumindest für ein bayerisches Abitur mit Deutsch als einem der Abiturfächer gereicht.
- Konkret zum Lemma Data(-)Warehouse: Das Nichtvorkommen von Data-Warehouse in der freien Wildbahn legt für mich nahe, dass wir es mit einem Fall von Wikipedia:Keine Theoriefindung#Nicht etablierte Termini zu tun haben. Datenlager hat sich offensichtlich nicht durchgesetzt, Data-Warehouse schreibt auch so gut wie niemand, also müssen wir auf das englische Original Data Warehouse zurückgreifen.
- Falls dich diese Argumentation nicht überzeugt, kannst du natürlich gern eine dritte Meinung einholen. -- Carbidfischer (Diskussion) 13:58, 17. Nov. 2021 (CET)
- Kleine Anmerkung hierzu: Die Regeln der deutschen Rechtschreibung legt einzig und allein (!) der deutsche Bundestag fest. Kein Verlag und keine Behörde. Verbindlich sind diese Regeln außerdem NUR für Ämter und Beamte, alle anderen können sich daran halten und orientieren, müssen aber nicht. 134.247.251.245 14:09, 30. Aug. 2023 (CEST)
Datenlager
[Quelltext bearbeiten]Gibt es eine Quelle für das Wort Datenlager? Ansonsten bitte ich es zu entfernen. Hier ist nur der englische Begriff geläufig. --141.3.166.164 11:01, 1. Mär.
2007 (CET)
Hallo lieber Anonymius,
anbei einige Quellen für den Terminus Datenlager als Synonym bzw. deutsche Bezeichnung für Data-Warehouse:
http://www.symposion.de/wm-hb/wm_18.htm
http://www.sigs-datacom.de/sd/business-intelligence/data-warehouse.htm
http://berufsstart.monster.de/2007_de_p1.asp
http://www.trinovis.com/content/downloads/praesentationen/docs/dw_im_krankenhaus_3.pdf
http://v.hdm-stuttgart.de/seminare/wm/ws9900/datawarehouse.html
Ich grüße Dich freundlich tzeh 08:13, 2. Mär. 2007 (CET)
Literaturliste
[Quelltext bearbeiten]Hier ist der Autor William H. Inmon verlinkt mit dem Artikel über den Bill Inmon. Das sind doch offensichtlich zwei unterschiedliche Personen? --Julius-m 14:02, 20. Jul. 2007 (CEST)
Im Englischen wird der Name William mit Bill abgekürzt. Es ist also die gleiche Person. Nikodym 18:38, 22. Jul. 2007 (CEST)
Schema im DW
[Quelltext bearbeiten]Hallo Frank, Du sagt, dass laut Immon das Schema im DW im Gegensatz zu den Data Marts nicht im Sternschema vorliegt. Das widerspricht meiner Erfahrung. Auch wenn die Data Marts ihre Daten anders verwalten, so kann im DW trotzem ein Sternschema vorliegen. -- sparti 21:49, 30. Mai 2007 (CEST)
- Hallo Sparti, zunächst muss ich anführen, dass ich gemäß vorliegendem Artikel und Data-Warehouse-System von einer bestimmten Begriffswelt ausgehen muss (die ich selbst nicht 100%ig teile), in der das DW aus einem ETL-Vorgang heraus über die Stagin-Area befüllt wird und dann nach Hub-And-Spoke die Data Marts bereitstellt oder versorgt.
- Unter dieser Prämisse ist das DW nach Wiki je nach Autor in der Fachliteratur ein Operational Data Store oder ein Enterprise Data Warehouse oder ein Basis Data Warehouse. Diese sind wiederum nicht meistens nach Stern-, Schneeflocke- oder Galaxie-Schema organisiert, sondern "anders". Meine Korrektur bezog sich auf meistens. --EFR 08:51, 31. Mai 2007 (CEST)
- Hallo Frank, hallo Sparti, ich teile die Auffassung von Frank, dass das DW (wie auch immer ansonsten bezeichnet) "nach Hub-And-Spoke die Data Marts bereitstellt oder versorgt". Da die zu verorgenden Zielsysteme unterschiedlich sind (prinzipiell beliebig zusammengegestellt und strukturiert (z.B. als mehrdimensionale Matrizen - sprich Sternschema), ist zu empfehlen, die dem DW zugrundeliegende Datenbank anwendungsneutral zu strukturieren; dies spricht für die Ausrichtung nach 3NF und weniger für ein Sternschema. Ich grüße Euch freundlich Thomas tzeh 11:21, 31. Mai 2007 (CEST)
- Das wundert mich jetzt aber. Schließlich sind die grundlegenden Aufgaben im DW und in den Data Marts doch recht ähnlich. Ich habe eine Temporale Datenhaltung und möchte nach bestimmten Gesichtspunkten voraggregieren. Genau deswegen verwendet man doch ein Sternschema. Insbesondere ist für den Fall, dass ein Data Mart nur ein Auszug aus dem DW ist, keine weitere Transformation mehr nötig, wenn beide ein kompatibles Schema verwenden. Gruss -- sparti 14:30, 31. Mai 2007 (CEST)
- Das ist genau der Punkt: So wie es in der Wikipedia beschrieben ist, ist DW das Ziel eines ETL-Vorgangs und damit eben nicht (immer) temporär, sondern ein integratives Archiv für Auswertungen und unterschiedlichste Sterne und Schneeflocken. Dies wird in der Literatur (habe ich gerade nicht greifbar, da Wochenende) als Basisdatenbank, Warehouse Data Store und in Hub-and-Spoke Architekturen eben manchmal auch als Data-Warehouse bezeichnet. Falls(!) man den Begriff DW für den Hub verwendet, ist dieser eben nicht immer in Stern- oder Schneeflocken- oder sonstiger Form strukturiert, da sich zum Beispiel im Data Mining die Merkmalsbestimmung im Dimension Modeling oftmals ändert, z.B. im Extremfall aus Fakten Dimensionen werden. Mir wäre es auch lieber, wir würden zunächst das Wording stramm ziehen, aber ich habe aus gegebenem Anlass momentan(!) einfach keine Lust. --EFR 12:30, 2. Jun. 2007 (CEST)
- So, jetzt hab ich mich nochmal etwas kundig gemacht. Es gibt im Wesentlichen zwei Strömungen. Die eine nach Kimball, die die Daten sofort in eine Dimensionen Schema transformiert und die nach Inmon, die versucht Daten im ursprünglichen (normalisierten) Schema zu erhalten. Gemeinsam ist aber allen, dass es sich um temporale Daten handelt und somit schlägt auch Inmon vor, Daten in Zeitschichten zu speichern und Daten mit entsprechenden Zeitstempeln zu versehen.
- Die gängige Lehrmeinung folgt jedoch Kimballs Ansatz, jedenfalls wird in den meisten Einführungsbüchern und Vorlesungen das Data Warehouse mit einem Dimensionen Schema in Zusammenhang gebracht.
- Ich finde den Ansatz von Inmon interessant und auch bedeutend, er sollte definitiv erwähnt werden. Ich halte die Beschreibung heute aber nicht für grundsätzlich falsch.
- Etwas problematisch ist ich die Definition von Thomas. Auch wenn ich den Ansatz ebenfalls fachlich interessant finde, aber er entspricht sicherlich nicht der Lehrmeinung. Vielleicht sollte sich Thomas überlegen, ob seine Definition wirklich enzyklopädisch relevant ist. Falls ich mich hier irre, wäre ich um freundliche Aufklärung sehr dankbar.
- Insgesamt ist der Definitionsteil heute so nicht hilfreich. Er hinterlässt einen unbedarften Leser völlig hilflos. Mein Vorschlag ist, daß wir uns auf die beiden großen Strömungen beschränken und diese mit jeweils einer Definition erläutern.
- --------------------------------------------------------------------------------------------------
- Das ist genau der Punkt: So wie es in der Wikipedia beschrieben ist, ist DW das Ziel eines ETL-Vorgangs und damit eben nicht (immer) temporär, sondern ein integratives Archiv für Auswertungen und unterschiedlichste Sterne und Schneeflocken. Dies wird in der Literatur (habe ich gerade nicht greifbar, da Wochenende) als Basisdatenbank, Warehouse Data Store und in Hub-and-Spoke Architekturen eben manchmal auch als Data-Warehouse bezeichnet. Falls(!) man den Begriff DW für den Hub verwendet, ist dieser eben nicht immer in Stern- oder Schneeflocken- oder sonstiger Form strukturiert, da sich zum Beispiel im Data Mining die Merkmalsbestimmung im Dimension Modeling oftmals ändert, z.B. im Extremfall aus Fakten Dimensionen werden. Mir wäre es auch lieber, wir würden zunächst das Wording stramm ziehen, aber ich habe aus gegebenem Anlass momentan(!) einfach keine Lust. --EFR 12:30, 2. Jun. 2007 (CEST)
- Das wundert mich jetzt aber. Schließlich sind die grundlegenden Aufgaben im DW und in den Data Marts doch recht ähnlich. Ich habe eine Temporale Datenhaltung und möchte nach bestimmten Gesichtspunkten voraggregieren. Genau deswegen verwendet man doch ein Sternschema. Insbesondere ist für den Fall, dass ein Data Mart nur ein Auszug aus dem DW ist, keine weitere Transformation mehr nötig, wenn beide ein kompatibles Schema verwenden. Gruss -- sparti 14:30, 31. Mai 2007 (CEST)
- Hallo Frank, hallo Sparti, ich teile die Auffassung von Frank, dass das DW (wie auch immer ansonsten bezeichnet) "nach Hub-And-Spoke die Data Marts bereitstellt oder versorgt". Da die zu verorgenden Zielsysteme unterschiedlich sind (prinzipiell beliebig zusammengegestellt und strukturiert (z.B. als mehrdimensionale Matrizen - sprich Sternschema), ist zu empfehlen, die dem DW zugrundeliegende Datenbank anwendungsneutral zu strukturieren; dies spricht für die Ausrichtung nach 3NF und weniger für ein Sternschema. Ich grüße Euch freundlich Thomas tzeh 11:21, 31. Mai 2007 (CEST)
- Wenn ich es recht sehe, geht es in der Diskussion um das Schema des zentralen Datenlagers, also um die Frage, wie das Data-Warehouse (DW) zu strukturieren ist. Ich denke, wir sind uns einig, dass (idealtypisch) die Auswertungen in applikationsspezifischen Data-Marts (DM) erfolgen, die allesamt aus dem DW mit Daten versorgt werden. Zunächst sei angemerkt, dass es auch Auswertungen gibt, die nicht multidimenionaler Natur sind. So gibt es z.B. in unserem Haus ein DW für Poduktdaten, in dem die Daten des Sortiments der weltweit gestreuten Tochter-Gesellschaften integriert (neben der zeitlichen Integration kann es im DWing auch eine räumliche wie auch organisatorischeIntegration geben) abgelegt sind, um damit die Datenbasis für eine globale eCommerce-Anwendung zu schaffen. Das Schema des DW basiert hier auf der 3NF, es ist somit redundanzfrei und leicht zu aktualisieren.
- Handelt es sich bei den Auswertungen um multidimensionale Analysen, dann kann in trivialen Fällen das Schem des DW mit dem des DM übereinstimmen, DW und DM können dann sogar auch zusammenfallen. Bei nichttrivialen Fällen hängt die Gestaltung des DW-Schemas von vielen Faktoren ab: dies können (auch heutzutage) Platz- und Performanceprobleme sein (so ist mir von einem Meinungsforschungsinstitut bekannt, dass dort ein raffinierter Algorithmus zur effizienten Haltung der DW-Daten angewandt wird, die dann anwendungsgrecht in die jeweiligen Schemata der DMs transformiert werden). Redundanzfreiheit und Qualitätsaspekte können ebenfalls Faktoren sein, insbesonderebei dann, wenn es um die Frage geht, welches Faktum im DW ist zutreffend bzw. verlässlich. Weiterer Faktor ist die Beherrschung der Komplexität der DW-Datenstrukturen , die eher für eine Gestaltung des Schemas auf 3NF-Basis spricht, als dass es eine Ansammlung von (teilweise) redundanten Cuben ist.
- Kurzum: will sagen, es gibt nicht das Patentrezept; insbesonder ist die generelle Aussage, das DW-Schema sei als Sternschema zu gestalten, mehr als fragwürdig. Dass das Sternschema häufig im Zusammenhang mit DW angeführt wird, hat eher exemplarischen Charakter und kann didaktisch als Hinführung zu OLAP betrachtet werden. Aber: DW-Anwendungen sind mehr als multidimensionale Analysen bzw. OLAP, was Frank treffend mit dem Data-Mining-Anwendungsaspekt belegt hat.
- Ich denke, enzyklopädisch angemessen sind Aussagen der Form:die gegenwärtige Forschung/Entwicklung ist A, 1990 stellte Guru X die These B auf, während 5 Jahre danach Guru Y sich für C einsetzte.
- Ich habe versucht, einen Beitrag zur Beschreibung von A zu leisten. Wenn B und C historisch gesehen enzyklopädisch relevant sind, dann können sie m.E. mit aufgeführt werden.
- Unklar ist mir, was oben unter „Definitionsteil heute so nicht hilfreich.“ gemeint ist. Auf welche Definition bezieht sich diese Aussage? Geht es um die DW-Definition mit den beiden Leitsätzen? Was ist hierbei unverständlich oder unvollständig? Oder bezieht sich die Aussage auf die unterschiedlichen Zwecke eines DW?
- Laßt uns zunächst die Pobleme herausarbeiten, um dann gemeinsam eine adäquate Lösung zu finden und auszuformulieren.
- Dank für Euren Part! Ich grüße Euch freundlich
- Thomas tzeh 21:47, 31. Jul. 2007 (CEST) --
- Hallo Thomas,
- ich bin einverstanden, dass die pauschale Aussage, dass ein DW ein Sternschema verwendet falsch ist. Fuer mich ist das Sternschema eher eine Art Muster, das als Basis fuer ein Schema dient.
- Dein Beispiel mit der raeumlichen/organisatorischen Datenhaltung muss dabei ja nicht im Widerspruch zum Sternschema oder zumindest Schneeflockenschema stehen, wenn diese als Dimensionen modelliert werden. Fuer mein Verstaendnis von einem DW ist aber eben der zeitliche Aspekt der Fakten wichtig.
- Meine Aussage wegen der wenig hilfreichen Definitionen, bezieht sich nicht auf eine der Defintionen sondern mehr auf alle. Es sind eben zu viele. Es wird dem Leser aufgebuerdet alle zu verstehen, damit er sich am Ende selbst ein Bild machen kann. Ich glaube aber, dass die wenigsten dazu in der Lage sind und eher an einer einfachen Definition interessiert sind, selbst wenn diese akademisch weniger genau ist.
- Wenn ueberhaupt sollte man etwas spaeter einen Vergleich der Defintionen hinzufuegen.
- Viele Gruesse -- sparti 23:34, 31. Jul. 2007 (CEST)
Korrekturen und Umformulierungen
[Quelltext bearbeiten]- Ich habe mir erlaubt einen Satz zu vereinfachen.
- alt:**integrated (Vereinheitlichung): Im Data-Warehouse werden die in verschiedenen (operativen) Quellsystemen in meist heterogenen Strukturen vorliegenden ausgewählten Daten in vereinheitlichter Form gehalten.
- neu: **integrated (Vereinheitlichung): Die in verschiedenen (operativen) Quellsystemen unterschiedlich strukturierten Daten werden im Data-Warehouse in einheitlicher Form gespeichert. --217.6.182.193 17:30, 1. Mär. 2011 (CET)
- Ich habe den einleitenden Satz neu formuliert und mit einer Quelle versehen:
- alt: Ein Data-Warehouse beziehungsweise Datenlager ist eine zentrale Datensammlung, deren Inhalt sich aus Daten unterschiedlicher Quellen zusammensetzt. ... Ein Data-Warehouse dient der Informationsintegration.
- neu: Ein Data Warehouse ist eine Datenbank, in der Daten aus unterschiedlichen Quellen in einem einheitlichen Format zusammengefasst werden (Informationsintegration). Dadurch verbessert sich der Komfort beim Zugang zu diesen Daten.
--lmtza (22:33, 3. Dez. 2011 (CET), Datum/Uhrzeit nachträglich eingefügt, siehe Hilfe:Signatur)
Wo findet diese Art von Datenbank Anwendung?
[Quelltext bearbeiten]Der Artikel beschreibt ja einigermaßen ausreichend, was ein Data Warehouse ungefähr ist und was man damit machen kann. Es wäre aber schön, wenn jemand hinzufügen könnte, was einige konkrete Anwendungsfälle wären oder wo man solch ein Schema häufig einsetzt. Ohne so einen Abschnitt wüsste niemand, wozu dieses Konzept gut ist. Ich übrigens auch nicht so recht (Ich selbst bin Oracle-Entwickler, weiß aber nicht, ob ich ein Data Warehouse betreue).--Chris1202 (Diskussion) 07:18, 14. Jan. 2020 (CET)
- @Chris1202: Der Artikel (eigentlich der ganze Themenbereich) könnte zwar definitiv eine Überarbeitung vertragen, mir ist aber noch nicht ganz klar, was du genau darin sehen möchtest.
- Wäre deine Datenbank ein Data Warehouse, wäre es dir vermutlich schon aufgefallen. Grundsätzlich werden Data Warehouses für alle möglichen analytischen Anwendungsfälle eingesetzt (OLAP bzw. Online Analytical Processing). Das Gegenstück wären operative bzw. Transaktionssysteme (OLTP bzw. Online Transaction Processing). Was macht deine Datenbank? -- Carbidfischer (Diskussion) 10:50, 14. Jan. 2020 (CET)
- Meine Datenbanken haben sprichwörtlich tatsächlich etwas mit Warenhäusern zu tun, allerdings eher im Bereich der Intralogistik. Daher bin ich auch auf diesen Artikel gestoßen, weil das irgendjemand mir gegenüber mal erwähnt hat. Lese ich aber den Artikel, glaube ich, dass das Wording völliger Zufall ist. Allerdings haben wir beispielsweise in einem System jeweils eine Datenbank pro Lager (HRL, KLT) und in 99% der Fälle noch eine Datenbank in der obersten Softwareschicht, die sich hauptsächlich um Hintergrundprozesse kümmert und sozusagen das System zusammenhält.--Chris1202 (Diskussion) 12:20, 14. Jan. 2020 (CET)
- Warehouse ist hier ein falscher Freund und bedeutet Lager, nicht Warenhaus. Ein DWH enthält allerdings nicht zwingend Daten über Lager, es ist ein Lager für Daten. Grundsätzlich hört sich dein System aber ohnehin sehr operativ-transaktional an und gerade nicht nach einem Data Warehouse. -- Carbidfischer (Diskussion) 16:34, 14. Jan. 2020 (CET)
- Stünde noch die Übersetzung des Wortes data warehouse als Datenlager in der Einleitung des Artikels dabei, wäre die Missinterpretation durch Chris2020 vermutlich gar nicht erst entstanden. Leider wurde diese Bezeichnung trotz mehrerer Quellenangaben (siehe weiter oben) und Einsprüche meinerseits kürzlich gestrichen. Ich stimme Chris1202 zu, dass der Artikel überarbeitet werden soll. Insbesondere die überladene Grafik zur Data-Warehouse-Archttektur ist verwirrend, da einige Bezeichner überhaupt nicht definiert sind wie z.B. ODS, Data Vault und Strategic Mart. --tzeh (Diskussion) 19:59, 15. Jan. 2020 (CET)
- Dass der Artikel nicht perfekt ist, bestreitet denke ich niemand. Die Übersetzung „Datenlager“ ist dennoch absolut unüblich und damit kein geeignetes Alternativlemma. Was ich mir allerdings vorstellen könnte, um Missverständnisse bzgl. Warenhaus zu vermeiden: Ein Data Warehouse (kurz DWH oder DW; wörtlich „Datenlager“) ... -- Carbidfischer (Diskussion) 17:35, 16. Jan. 2020 (CET)
- Stünde noch die Übersetzung des Wortes data warehouse als Datenlager in der Einleitung des Artikels dabei, wäre die Missinterpretation durch Chris2020 vermutlich gar nicht erst entstanden. Leider wurde diese Bezeichnung trotz mehrerer Quellenangaben (siehe weiter oben) und Einsprüche meinerseits kürzlich gestrichen. Ich stimme Chris1202 zu, dass der Artikel überarbeitet werden soll. Insbesondere die überladene Grafik zur Data-Warehouse-Archttektur ist verwirrend, da einige Bezeichner überhaupt nicht definiert sind wie z.B. ODS, Data Vault und Strategic Mart. --tzeh (Diskussion) 19:59, 15. Jan. 2020 (CET)
- Warehouse ist hier ein falscher Freund und bedeutet Lager, nicht Warenhaus. Ein DWH enthält allerdings nicht zwingend Daten über Lager, es ist ein Lager für Daten. Grundsätzlich hört sich dein System aber ohnehin sehr operativ-transaktional an und gerade nicht nach einem Data Warehouse. -- Carbidfischer (Diskussion) 16:34, 14. Jan. 2020 (CET)
- Meine Datenbanken haben sprichwörtlich tatsächlich etwas mit Warenhäusern zu tun, allerdings eher im Bereich der Intralogistik. Daher bin ich auch auf diesen Artikel gestoßen, weil das irgendjemand mir gegenüber mal erwähnt hat. Lese ich aber den Artikel, glaube ich, dass das Wording völliger Zufall ist. Allerdings haben wir beispielsweise in einem System jeweils eine Datenbank pro Lager (HRL, KLT) und in 99% der Fälle noch eine Datenbank in der obersten Softwareschicht, die sich hauptsächlich um Hintergrundprozesse kümmert und sozusagen das System zusammenhält.--Chris1202 (Diskussion) 12:20, 14. Jan. 2020 (CET)
Ich teile Deinen sachlichen und konstruktiven Vorschlag. Setzt Du ihn bitte in die Tat um? tzeh (Diskussion) 13:10, 17. Jan. 2020 (CET)
- Ja das mit dem falschen Freund ist in der Tat etwas heimtückisch. Dieser Link geht vielleicht nicht in die Tiefe, aber es werden einige Beispiele genannt, die ein Experte vielleicht zum Anknüpfen nehmen könnte. Ich traue mir das keinesfalls zu.--Chris1202 (Diskussion) 18:55, 18. Jan. 2020 (CET)
- Meine Bitte bezog sich auf den Vorschlag von Carbidfischer, das Wort Datenlager als wörtliche Übersetzung von data warehouse mit aufzunehmen. (nicht signierter Beitrag von Tzeh (Diskussion | Beiträge) 09:23, 19. Jan. 2020 (CET))
- @Tzeh, Chris1202: Erledigt. -- Carbidfischer (Diskussion) 09:38, 21. Jan. 2020 (CET)