Seite 2 von 2

Re: Literatur- und Medienverwaltung

Verfasst: 08.04.2012 15:58
von FlintSource
Hallo zusammen und frohe Ostern,

Das wird notgezwungen wohl etwas ausführlicher, für eiligen, siehe fettgedrucktes. Ein kurzer Hintergrund zu diesem Post:

LS hat mir eine TXT-Datei mit einer Größe von 20 MB geschickt, generiert aus Einträgen in EndNote. Die Datei umfasst 564.774 Zeilen und ist völlig normalisiert, nur für die Felder wo auch Information vorhanden ist, ist ein Eintrag vorhanden. Das Format scheint sich komplett nach den Standards von bibliografischen Austauchformaten wie RIS zu richten. Hier mal kurz ein Beispiel aus einer anderen Datenbank:

TY - CHAP
ID - 1535
T1 - Traditionen in der Orientierung bandkeramischer Häuser in Mitteldeutschland und Brandenburg
T3 - Beiträge zur Ur- und Frühgeschichte Mitteleuropas
T2 - Varia neolithica VII. Dechsel, Axt, Beil & Co - Werkzeug, Waffe, Kultgegenstand? Aktuelles aus der Neolithforschung
CY - Langenweissbach
A1 - Einicke,Ralf
ED - Beier,Hans-Jürgen
ED - Einicke,Ralf
ED - Biermann,Eric
PB - Beier & Beran
PY - 2011///
KW - Bronzezeit
KW - Neolithikum
KW - Tagung
KW - Waffen
KW - Werkzeug
SP - 171
EP - 182
ER -

Das ist eigentlich selbsterklärend, mit TYpe (Chapter, Book, Journal article usw), ID des Eintrags in der Datenbank, T1 usw, die Titeldaten (Aufsatz, Buch und Reihe), Verlagsort (CY), Author1 (hier Alleinauthor), EDitors (des Bandes), Verlag (PuBlisher), Erscheinungsjahr (PY). KeyWords, StartPage, EndPage und ein Abschlusseintrag des Datensatzes (ER). Das ist beliebig erweiterbar mit CallNumber (Signatur), ISBN, Seitenzahl des Buches usw.

Beim Importieren wird die Datei Zeile für Zeile eingelesen und für den Eintrag auch nur wieder die Felder angelegt, die auch tatsächlich vorhanden sind, dies in Gegensatz zu z.B. Access, wo für jede Zeile auch alle Spalten angelegt werden, wodurch die Datenbank sehr viel umfangreicher wird, dafür jedoch für menschliche Lesern einfacher interpretierbar ist.

Das Importieren der Daten hat etwas gedauert, etwas über zwei Stunden, weil Zotero das nur auf einem Kern macht, dafür sind es dann auch 22.368 Einträge.

Es gibt beim Exportieren als TXT anscheinend ein sehr massives Problem: Ein Großteil der Sonderzeichen sind nicht richtig kodiert, sodass viele Datensätze völlig unbrauchbar sind. Ich weiß jedoch nicht, wie gut die Zeichen in der Originaldatenbank vorhanden waren, weil es Teilweise auch Probleme mit Umläute gab, die in TXT durchaus vorgesehen sind.

Als sehr dramatisches Beispiel:

al-**Am*±r/University of Pennsylvania. University Museum./Egypt. Ma*¹*la*¸Æat al-**th**r./Egypt. Wiz**rat al-Thaq**fah wa-al-I**l**m./Mat*¸Æaf al-Mi*¹*r*±. 1959: M.¹.¹. af al-**Am*±r/University of Pennsylvania. University Museum./Egypt. Ma*¹*la*¸Æat al-**th**r./Egypt. Wiz**rat al-Thaq**fah wa-al-I**l**m./Mat*¸Æaf al-Mi*¹*r*±., A family archive from Thebes : demotic papyri in the Philadelphia and Cairo Museums from the Ptolemaic period (Cairo 1959).

Ich vermute, dass bei einem Export als RIS, BibTex usw. mit erweiterten Kodierungen diese Probleme nicht auftreten, bislang habe ich mit Sonderzeichen (auch Tschechisch, Rumänisch und Polnisch) in Zotero keine Probleme gehabt. Da würde sich ein erneutes Experiment (mit etwas weniger Datensätzen) durchaus lohnen.

Weitere nachteile: Die Daten sind völlig unsortiert, es gibt keine Dateistruktur und dadurch müssen die einzelne Einträge Stück vor Stück angefasst werden und in einen Ordner verschoben werden. Das ist nicht nur zeitaufwändig, sondern wenn man die Aufsätze nicht kennt auch mit Fehlern verbunden.

In diesem speziellen Fall ist auch die Qualität der Daten ungenügend: So scheint bei der Bodlean Library ein Suchauftrag gelaufen zu sein nach 'flint' wobei das Ergebnis ohne Überprüfung in die Datenbank integriert worden ist. So sind auch Einträge vorhanden wo der Autor zwar 'Flint' heißt, die mit Archäologie jedoch nichts zu tun haben. In diesem Datenbereich sind auch die Call-Numbers (Signaturen) von der Bodlean vorhanden in der Datenbank, was mir in Dresden herzlich wenig nutzt.
Weiter gibt es einige Schwierigkeiten, weil es statt einzelne Schlagwörter Schlagwortketten gibt, die immer wieder Probleme verursachen.

Also formell wäre die Sache wohl überhaupt kein Problem, nur ist der Inhalt in diesem Fall etwas fehlerbehaftet und ist ein TXT-Format wohl nicht geeignet. Ein Export mittels eines anderen Formates hätte wohl die Sonderzeichen besser verwaltet und möglicherweise die Ordnerinformationen behalten, wodurch das Integrieren in bestehende Bibliotheken sehr viel einfacher gewesen wäre. Und wie immer gilt das ultimative Gesetz: 'Garbage in, garbage out', solche Datenbestände müssen immer wieder überprüft und gepflegt werden.

Ticker: Einlesen Datensätze, auch große Mengen, kein Problem. TXT wegen Sonderzeichen ungeignet, bibliografisches Austauschformat verwenden. Literaturdatenbank pflegen.

Re: Literatur- und Medienverwaltung

Verfasst: 04.06.2013 14:21
von LS
@ Literaturdatenbank, nochmal Plädoyer für EndNote

Hallo,
das Konvertieren der Datensätze in Freeware-Programme oder von Freeware zu EndNote hat trotz Rengerts freundlicher Beschreibung den Nachteil, dass die Verlinkung der PDFs dann futsch ist. Der große Mehrwert ist aber zweifellos die Artikelverwaltung, also die Suchfunktion nach Autoren oder Titelwörtern im Zitat und dann der direkte Zugriff auf die PDF. Diese Verlinkung der PDFs ist auch das, was beim Füttern der Datenbank die meiste Zeit schluckt.

Daher die Bitte: Wer EndNote verwendet und eine PDF-Sammlung hat, kann sich gern mal mit mir in Verbindung setzen, z.B. über PM hier im Forum. Ich trete gern auch in "asymmetrische Tauschgeschäfte", denn die Hinzufügung auch nur einiger hunderter Zitate mit verlinkten PDFs spart schon wieder eine Menge Arbeit.

Zweitens kann sich ja jeder selbst überlegen, ab wieviel gut sortierter Literatur sich der Preis für die EndNote-Einzelplatzlizenz von 180 Euro rechnet. Ich bin mit EndNote in keiner Weise geschäftlich verbandelt. Könnte mir aber vorstellen, dass der eine oder andere bei 20.000 gut sortierten PDFs dann doch den Kauf der Software in Erwägung zieht.

Grüße, Leif

Re: Literatur- und Medienverwaltung

Verfasst: 06.06.2013 15:07
von Blattspitze
Das scheint doch eher etwas für Profis zu sein.
Ich bleibe bei meiner GeHirn-DB für 0,00 €, zwar anfällig für Deemänzz@ aber naja. :mammut2:

Re: Literatur- und Medienverwaltung

Verfasst: 10.06.2013 08:55
von Bullenwächter
Wulf wir verwalten unsere Medien momentan auch noch mit der von Dir verwendeten Software, doch wie wir immer wieder feststellen müssen hat die den Nachteil dass viele Informationen Quellen und Daten in der Flut untergehen und somit dann nahezu wertlos sind :37:

Re: Literatur- und Medienverwaltung

Verfasst: 10.06.2013 17:48
von ulfr
Wechstaben verbuchselt, Bullenwächter? Ich verwende gar keine Biblio-Software ... :mammut1:

Re: Literatur- und Medienverwaltung

Verfasst: 11.06.2013 18:29
von Bullenwächter
... wir auch nicht - hätte wohl lieber sagen sollen dass wir die gleiche "Hardware" nutzen obwohl das Hirn doch eher weich ist.... :27:

Re: Literatur- und Medienverwaltung

Verfasst: 13.06.2013 16:10
von imoen
Also, euer Gehirn muss effizienter funktionieren als meins...

Ich wäre inzwischen ohne eine Literaturdatenbank total aufgeschmissen. Ich habe schon öfter durch Zufall Artikel wiedergefunden, die ich durchaus auch schon gelesen hatte, aber von denen ich absolut nicht mehr wusste, dass ich sie habe. Ohne die Schlagwort-Funktion von Zotero würde ich wahrscheinlich kaum noch was finden.

Re: Literatur- und Medienverwaltung

Verfasst: 16.06.2013 11:04
von hunasiensis
Wir erfassen zur Zeit die Monographien unserer Bibliothek mit Zotero.

Vorteile:
- Schnelle Erfassung: Titel in der DNB, Google-Books oder Amazon suchen. Mit einem Click ist der Titel in Zotero drin.
- Gemeinsames Arbeiten: mehrere können gleichzeitig erfassen
- Sofortige Verfügbarkeit im Internet.

Hier könnt Ihr mal einen Blick darauf werfen:
https://www.zotero.org/groups/nhg-vorge ... thek/items

Da die DGUF die Artikel der prähistorischen Zeitschriften mit Zotero erfasst, machen wir das nicht nochmal.

Gruß
Arne