Seit Juli 2022 arbeite ich am Aufbau eines Preisarchivs für Orchesterelektronik aus Deutschland der 1950er bis 1970er Jahre.
Die grundlegende Fragestellung dieses Projektes ist: In Verkaufsanzeigen wird nicht selten darauf verwiesen, dass Gerät X oder Gerät Y einen bestimmten Marktpreis habe. Dabei ist aber vollkommen unklar, ob die Verkäufer diesen Marktpreis tatsächlich ermittelt haben oder sich einfach nur an den Verkaufspreisen anderer Verkäufer orientieren. Denn das Problem dabei wäre: Man kann jeden Preis für ein Gerät XY aufrufen, das ist zunächst einmal nur ein geäußerter Wunsch des Verkäufers, einen bestimmten Erlös zu erzielen. Aber man verkauft es noch lange nicht zu diesem Preis. Was sind also die tatsächlich durchschnittlich erzielten Verkaufspreise?
Diese Information wäre für Käufer äußerst wichtig, um den Markt einzuschätzen. Der Vergleich der tatsächlich erzielten Preise in Hinblick auf den Zustand eines bestimmten Gerätes wäre zudem auch ein wichtiger Indikator, um den Markt qualitativ zu bereinigen. Denn, ich habe es oft schon so formuliert: Wenn restaurierte Geräte maximal denselben Preis +100€ erzielen wie unrestaurierte Geräte, dann wird sich niemand mehr die Mühe machen, Geräte zu erhalten. Das wäre für alle eine äußerst unschöne Entwicklung, denn sie würde das Ende der historischen Orchesterelektronik einläuten.
Richtige Auktionshäuser geben in der Regel Listen mit den auf Auktionen erzielten Ergebnissen heraus und richtige Auktionshäuser geben auch immer eine fachliche EInschätzung über den Zustand und Wert eines Objektes an. Da Vintage-Orchesterelektronik wohl hauptsächlich im Internet angeboten und verkauft wird, hat man hier ein Problem. Ebay zum Beispiel gibt Käufern keine Datenbank an die Hand, in der sich die zuletzte erzielten Verkaufspreise für jedes Gerät einfach abrufen lassen. Auch in Angaben zur Qualität mischt sich Ebay als Verkaufsplattform nicht ein, sondern überlässt dies komplett den Verkäufern. Diese haben aber einen Interessenkonflikt, denn sie möchten einen möglichst guten Preis erzielen und die ungeschönte Wahrheit steht dem manchmal diametral entgegen. Meist wissen sie es auch einfach nicht besser und hier wäre eigentlich ein Fachmann zur qualitativen Einschätzung und Einordnung eines Verkaufsobjektes erforderlich.
Bei Kleinanzeigen (Deutschland) hat man überhaupt keine Möglichkeit, tatsächlich erzielte Preise einzusehen, da nur das Verkaufsangebot mit dem vom Verkäufer gewünschten Preis öffentlich ist. Die Preisverhandlungen und das Ergebnis sind letztlich vollkommen Privatsache zwischen Verkäufer und Käufer.
Beim Anlegen eines Preisarchivs muss man daher Abstriche machen: Da private Verkäufe auf Plattformen im Internet nicht nachvollziehbar sind, kann man diesen Teilbereich der Verkäufe auch nicht im Preisarchiv erfassen. Eine bestimmte Teilmenge der verkauften Geräte lässt sich daher nicht seriös erfassen. Auch Verkäufe auf ausländischen Märkten beziehe ich nicht in das Preisarchiv ein, da die dortige Marktsituation schlecht einschätzbar ist: Knappheit an Geräten verteuert die Marktpreise künstlich, da der Konkurrenzdruck unter möglichen Interessenten überproportional groß ist.
Ich beschränke mich deshalb nur auf verifizierte Verkäufe auf Ebay innerhalb Deutschlands und beziehe hier neben dem erzielten Verkaufspreis auch die vom Verkäufer ausgestellten Bilder der Geräte und die vom Verkäufer gelieferte Beschreibung mit ins das Preisarchiv ein.
In der Zukunft hoffe ich auch, jedes verkaufte Gerät mit einem von mir erdachten, leicht verständlichen und konsistenten Bewertungssystem zu versehen.
Stand November 2024 umfasst das Preisarchiv bereits 1031 verkaufte Geräte der Orchesterelektronik.
Datenerfassung
Ebay markiert tatsächlich verkaufte Angebote, so dass sie von einfach abgelaufenen, nicht mit Verkauf beendeten Auktionen klar unterscheidbar sind. Zu jedem also verifizierten Verkauf wird dann ein Datensatz in Form eines Ordners angelegt. Dieser Ordner umfasst:
- Die zur Auktion gerhörigen Bilder des Verkäufers (Anzahl variiert).
- Ein Bild „ergebnis.png“ auf dem das Startbild der Auktion mit dem erzielten Endpreis, Anzahl der abgegebenen Gebote, etc. ersichtlich ist.
- Eine Datei „beschreibung.txt„, in dem der originale Verkaufstext des Verkäufers gespeichert ist.
Diese drei Dateitypen werden von mir manuell angelegt bzw. abgespeichert, da ich momentan keine Möglichkeit sehe, dies über eine API in irgendeiner Weise zu automatisieren. Die Entscheidung, ob eine Auktion in die eingangs definierten Bedingungen passt, muss momentan noch ein Mensch fällen, eventuell kann hier irgendwann aber KI behilflich sein.
Daneben finden sich bei jedem Datensatz noch zwei weitere Dateien, die ich automatisiert anlegen lasse:
- ocr.txt: Eine Datei, in der die Textanteile des Bildes ergebnis.png abgespeichert werden. Die Erfassung funktioniert automatisch über OCR (Optical Character Recognition).
- data.txt: Eine CSV-Datei, die für jedes verkaufte Gerät Informationen zusammenstellt, die in der späteren Aufbereitung der Daten benötigt werden.
Die meisten dieser Daten werden automatisiert erfasst aus der ocr.txt (Hersteller, Produkt, Produkttyp, Verkaufspreis, Verkaufsjahr, etc). In diese Datei soll aber auch das spätere Bewertungssystem einfließen und sie enthält auch Meta-Informationen zu den Geräten: Zum Beispiel, ob ein bestimmtes Gerät noch einmal in einem Datensatz vorkommt, denn es könnte ja später noch ein weiteres Mal verkauft worden sein.
Diese Datei erfordert deshalb auch einen gewissen manuellen Aufwand, unter anderem, weil die OCR-Erkennung nicht zu 100% fehlerfrei funktioniert. Es gibt hier bestimmte Probleme, die sich kaum programmatisch lösen lassen. Ein Beispiel: Wenn der Verkäufer für eine Auktion die Option „Preisvorschlag“ aktiviert hat und er den Preisvorschlag eines Käufers annimmt, dann wird der Verkaufspreis bei Ebay durchgestrichen angezeigt…und damit von der eingesetzten OCR-Software nicht mehr erkannt.
Datenaufbereitung
Was die Zukunft für dieses Projekt bringt, weiß ich nicht. Allein von der Größe der Bilddaten bin ich momentan aber davon abgekommen, diese Datenbank zu einem Online-Projekt zu machen. Das wäre von den aufzuwendenden Ressourcen bei weitem kein ausschließlich im Hobby zu finanzierendes Projekt mehr. Auch ist noch nicht geklärt, wie es mit den Urheberrechten der Verkaufsbilder konkret steht: Als juristischer Laie habe ich den Eindruck, dass ich – obwohl die Bilder in Auktionen öffentlich eingestellt waren – hier die Erlaubnis der Verkäufer (Urheber) einholen müsste, was vom Aufwand her nicht machbar ist.
Das Projekt ist deshalb momentan als reines Offline-Projekt angelegt, das gilt auch für die Aufbereitung der Daten. Ich habe mir mit den mir zur Verfügung stehenden Mitteln (ich bin kein Programmierer) einige Skript-Tools gebaut, die die Daten für mich aufbereiten und in einer HTML-Datei ausgeben:
Dabei kann dieser Vorgang das komplette Preisarchiv zu einer HTML-Datei zusammenfassen oder aber das betreffende Skript wird mit einem Suchparameter gestartet. In dem Fall werden dann nur die Datensätze aus dem Preisarchiv ausgegeben, die dem Suchkriterium entsprechen. Ein solches Suchkriterium kann natürlich ein Herstellername, ein Gerätename oder auch ein beliebiger anderer Textstring sein.
Das Ergebnis ist bislang eine Übersicht aller Verkäufe zu einem Thema mit allen benötigten Informationen schlüssig und kompakt zusammengefasst. Auf lange Sicht muss es aber natürlich so sein, dass auch Preise und Durchschnittspreise zum Beispiel in Form eines Diagramms verfügbar gemacht werden.
Wie vieles ist dies also sowohl von der Datensammlung als auch von Umfang der Aufbereitung noch ein laufendes Projekt.