Diskussion:Datensatz
Datensatzbegriff bei spaltenorientierten Datenbanken
[Quelltext bearbeiten]Wie sieht es bei spaltenorientierten Datenbanken aus - stellt man sich da einen Datensatz immer noch als Zeile vor, oder wäre es dann eine Spalte? --193.108.233.65 13:13, 28. Feb. 2014 (CET)
- Nach der Definition in der Einleitung geht es um 'inhaltlich zusammenhängende' Felder. Dabei sollte die Speicherungsform m.E. keine Rolle spielen; wer weiß schon, wie die Daten zB in einer rel. Tabelle tatsächlich gespeichert werden? Jedenfalls gehören sie "inhaltlich" - über ihren Schlüssel verbunden - zusammen. Das ist bei SP-DB nicht anders, nur sind dabei die Dimensionen (horizontal/vertikal) vertauscht. Eine offiziell belegte Antwort wäre trotzdem interessant. --VÖRBY (Diskussion) 11:27, 1. Mär. 2014 (CET); ergänzt: --VÖRBY (Diskussion) 16:07, 1. Mär. 2014 (CET)
- Die zweidimensionale Sicht auf Daten ist nur eine Anordnung aus der menschlichen Vorstellungsswelt. In Datenspeichern liegen die Daten i.d.R. eindimensional, quasi als endlicher String vor, 'Zeilen' werden dabei durch bestimmte Rechen- oder andere Zugriffsmethoden adressiert und identifiziert. Genauso ist das mit Spalten. 'Datensatz' ist aber ein logischer Mengenbegriff, der nichts mit der physikalischen Speicherung zu tun hat: Man steelle sich eine Excel-Tabelle vor, mit Zeilen (für Objekte) und Spalten (für Attribute). Dann vertauscht man die Dimensionen, danach repräsentieren die Spalten Objekte und die Zeilen enthalten die Attribute; gedanklich wäre damit die Spalte der 'Datensatz'. Also: Es gibt keinen Grund dafür, dass nur Zeilen als Datensatz gelten, verarbeitet werden die Inhalte ohnehin nur aus eindimensionalen Datenmengen heraus, per Adressierung (die natürlich je nach Sicht auf Zeilen/Spalten variiert).
- Beleg: Auch in [1] werden die logisch zu speichernden Daten auch für spaltenorientierte Datenbanken 'Datensatz' genannt. Sinngemäß sollte das im Artikel ergänzt werden.--VÖRBY (Diskussion) 09:42, 2. Mär. 2014 (CET)
Ich habe die Fragestellung zum Anlass genommen, Varianten der Speicherung von Datensätzen als eigenen Abschnitt zu ergänzen. Daraus lässt sich erkennen, welche unterschiedlichen Formen und Ausprägungen 'Datensätze' aufweisen können. Auch die o.g. Fragestellung ist behandelt. --VÖRBY (Diskussion) 12:43, 4. Mär. 2014 (CET)
Was ist (k)ein Datensatz?
[Quelltext bearbeiten]Fortsetzung des vorangegangenen Disk-Abschnitts: Ich glaube, in den Definitionen fehlt noch eine Abgrenzung: Wann sind Daten als 'Datensatz' zu verstehen, wann nicht? Beispiel:
- Was ist konkret der Datensatz bei XML-Code? Sicher doch nicht nur 1 Zeile, sondern alle Zeilen bis zum logischen Ende der Sequenz?
- Analog: Ist eine Quellcodezeile ein Datensatz? Oder alle Zeilen einer Befehlssequenz?
- Sind Datensätze nur formatierte, objektbezogene Daten, nicht also eine beliebige Zeile aus einem Texteditor?
- Oder die Daten, die ein Spooler an den Drucker sendet? usw. usw.
- Ist ein DS "eine Erscheinungsform für 'Daten'"? Welche gäbe es noch?
Evtl. fehlt die Aussage, dass 'Datensatz' ein logischer Begriff ist, kein Objekt der technischen Speicherung, das z.B. mit READ gelesen wird. Oder doch? --VÖRBY (Diskussion) 19:15, 4. Mär. 2014 (CET); ergänzt: --VÖRBY (Diskussion) 08:48, 5. Mär. 2014 (CET)
- Ohne jetzt einen Blick in die Literatur geworfen zu haben, ist mMn. ein Datensatz ein Konzept aus der Datenbanktechnik. Darum bin ich mir auch gerade nicht sicher, ob es zulässig ist zu sagen, dass eine Map oder eine Struct ein Datensatz wäre, denn dies sind wiederum Konzepte aus den (jeweiligen) Programmiersprachen.
- Du hast von einem grundsätzlichen Betrachtungspunkt natürlich recht, dass es zumindest sehr ähnlich Dinge ist. Aber den Begriff Datensatz (im Hinblick auf die Informatik bzw. Datenbanktechnik) würde ich hier eigentlich nur in Bezug zu Datenbanken beschreiben.
- Man könnte zB. sagen, dass Maps/Structs eine Methode sind, Datensätze (bei der Programmierung einer DB) zu handhaben.
- Und auch der letzte Satz: "Zeilen oder Spalten ergeben sich lediglich wenn ein Programm die Daten so darstellt". Ich weiß wirklich nicht, ob man das so sagen darf, denn wir unterscheiden ja zB. zwischen zeilen- und spaltenorientierten DBen. Insofern ist das durchaus die Speicherungsstruktur und nicht bloß reine Präsentationssache.--Plankton314 (Diskussion) 14:46, 5. Mär. 2014 (CET)
- Hallo, den Ausdruck/Begriff auf 'Datenbanken' zu beschränken, scheint mir nicht korrekt; schließlich galt schon die Lochkarte klassisch als Datensatz. Und serielle Kunden- oder Sonstwas-Dateien bestanden schlichtweg aus Datensätzen. Auch würde ich die Programmiertechniken nicht so sehr in den Fokus nehmen, denn das sind nur sprachspezifische Methoden, um Datensätze passend deklarieren zu können. Man kann das vielleicht erwähnen, aber mit der Definition für DS hat das wenig zu tun. Zeilen/Spalten: Auch in jeder DB werden alle Daten nur eindimensional gespeichert, das DBMS zeigt sie nur (unter Zuhilfenahme der Metadaten) als Z/S. Gleichwohl: Allgemein-akzeptiert gilt natürlich, dass die DBK Zeilen und Spalten führt, den Satz sollte ich wirklich umbauen.
- Mir ging es aber i.W. um die Abgrenzung: Habe gegoogelt, da heißt es meist, ein DS fasst Daten zusammen, die zu 1 Objekt gehören. Das ist schon etwas präziser als nur 'zusammenhängend', vor allem steckt da schon Modellierungslogik dahinter, unabhängig von der DBK. Trotzdem würde ich 'DS' so eng nicht definieren, sonst wäre er ja Synonym zu Entitätstyp. Ich glaube aber, man muss unterscheiden zwischen 'Daten' i.e.S. (objektbezogen und mit ihren einzelnen Feldern) und Daten, die z.B. auf einem Kontoauszug stehen; dort werden Daten aus mehreren Objekten (Bank, Kunde, Adresse, Konto, Kontobewegung ...) angezeigt. Ist das Ganze ein Datensatz? Ist die einzelne Betragszeile darin ein DS? Oder jede gedruckte Zeile, egal in welcher Struktur? Vielleicht fällt uns noch was ein. --VÖRBY (Diskussion) 16:15, 5. Mär. 2014 (CET)
Wäre das Folgende passend?
Abgrenzung: Obwohl Daten nahezu immer als Aneinderreihung mehrerer Datenelemente auftreten, nennt man nicht alle Erscheinungsformen von Daten 'Datensatz', sondern nur Datengruppierungen, die zu einem bestimmten Objekt gehören und die für alle Objekte eine identische Struktur aufweisen. Nicht als Datensätze gelten demnach zum Beispiel:
- Daten, die Fließtext enthalten, auch nicht die Einzelzeile
- Drucker- oder Video-Datenströme
- Eine Ausführbare Datei oder Teile davon
- Eine Quelltextzeile
--VÖRBY (Diskussion) 10:10, 10. Mär. 2014 (CET)
- Ich versuche mal in den nächsten Tagen einen Blick in die Literatur zu werfen und melde mich dann diesbezüglich nochmal.--Plankton314 (Diskussion) 18:23, 10. Mär. 2014 (CET)
- Keine Eile! Ein solcher abgrenzender Absatz wäre ja nicht nötig, wenn die Definition alle Kriterien, die für das Lemma gelten, zweifelsfrei aufzählen würde. Diese könnte man dann für eine beliebig 'gedachte' Datenmenge einem Ja-Nein-Test unterziehen; bei Ja läge ein DS vor, sonst nicht. Leider sind die Einleitungen aber in der WP nur in den seltensten Fällen so eindeutig formuliert. Deshalb wären Beispiele wie die o.a. nützlich. --VÖRBY (Diskussion) 13:09, 11. Mär. 2014 (CET); präzisiert, kommt noch Feedback? --VÖRBY (Diskussion) 12:54, 19. Mär. 2014 (CET)
Ich habe einen diesbezüglich abgrenzenden Text im Artikel eingestellt.--VÖRBY (Diskussion) 13:18, 25. Mär. 2014 (CET)
... dieser Mammutsatz ist leider nicht umgangssprachlich. Wer kennt am Ende des Satzes noch den Satzanfang? Ich verstehe nur Bahnhof.--Franz78Berlin (Diskussion) 08:09, 31. Jan. 2017 (CET)
- Ja, nicht umgangssprachlich, sondern einfach zum Modebegriff in den Medien geworden, und in 'abweichender Bedeutung'. Hab den Text gekürzt und den Abschnitt umbenannt. Ich hoffe, er ist jetzt besser verständlich. --VÖRBY (Diskussion) 12:33, 31. Jan. 2017 (CET)
Nachdem heute diese [2] Änderung eingearbeitet wurde, stellt sich mir die Frage, ob der Ausdruck 'Datensatz', wie behauptet, im Statistikbereich tatsächlich so definiert ist (wo?) - oder ob die Wortverwender (i.d.R. Medien) diesen einfach nur als Modebegriff verwenden - jedoch als Widerspruch zu einschlägigen Definitionen. Dann sollte man das auch so beschreiben. Also: Abweichende Definition gesucht.--VÖRBY (Diskussion) 16:56, 21. Feb. 2018 (CET)
- Da hier keine andere Definition geliefert wurde, schlage ich vor, den betreffenden Abschnitt wie folgt zu konkretisieren: "... wird er, im Widerspruch zu dieser Definition, besonders in der Statistik und in Medienberichten auch als Bezeichnung für die Gesamtheit von Daten in einem bestimmten Zusammenhang ...". Denn einfach die Verwendung als Beleg für die abweichende Bedeutung zu interpretieren, halte ich in einem Lexikon für falsch. Oder gibt es doch eine diesbezügliche zweite Definition? --VÖRBY (Diskussion) 09:50, 26. Feb. 2018 (CET)
ERLEDIGT. Ich habe den betreffenden Text nochmal etwas angepasst. Er besagt jetzt, dass der Ausdruck 'Datensatz' in der Statistik auch mit einer anderen Bedeutung verwendet wird. Ob es dafür eine offizielle Definition gibt (ich habe keine gefunden) oder ob eigentlich eine unkorrekte Wortverwendung vorliegt (was aber häufig vorkommt), bleibt somit offen. --VÖRBY (Diskussion) 10:00, 4. Mär. 2018 (CET)