Schlagwort-Archiv: Commons

Jan 19 2012

Gedanken zu Ingenieuren und Freiem Wissen

Gerade wurde von Gustavf im Wikisource ein Vergleich gezogen, der mir sehr gefällt:

Die Naturwissenschaften sind, anders als z. B. die Jurisprudenz oder die Theologie, “akkumulativ”, d. h. jeder Fortschritt, den Sie erarbeiten, geht in das kollektive Menschheitswissen unverlierbar ein und befruchtet weiteren Fortschritt. (Zitat aus http://www.ingenieur-kultur.de/sources/vorwort.pdf)

Freies Wissen ist also nichts anderes als eine Weiterentwicklung des Ingenieursgedanken.

Das freies Wissen und unser kulturelles Gedächtnis nicht nur durch aktuelle Gesetze wie SOPA bedroht ist, zeigt eine Diskussion zu einem US-Gesetz aus dem Jahr 1996 auf Wikimedia Commons, unter dem nicht nur Commons leiden würde, sondern auch die Wikipedia, Wikisource und die anderen Projekte, die Medien aus Commons einbinden. Hinzu käme, dass die entsprechenden Texte auf Wikisource ebenfalls gelöscht werden müssten.

Zitat von Achim Raschka auf der Mailingliste des deutschen Wikimedia-Vereins:

[S]ollte es wirklich in der Folge zur Löschung von tausenden Bildern (von tausenden nach deutschem Recht gemeinfreien Bildern!), u.a. von zahlreichen Künstlern der Jahrhundertwende zum 20. Jahrhundert und eigentlich des gesamten Bildmaterials seit 1915, dann haben wir – ganz konkret WIR – das Ziel, wofür wir stehen, verfehlt. Wenn wir nicht in der Lage sind, Liebermanns Selbstbildnisse und Corinths Spätwerk in der deutschsprachigen WP zu zeigen, obwohl es vollkommen unzweifelhaft nach deutschem Recht legal und gemeinfrei ist, sollten wir das Thema “Förderung Freien Wissens” aus unserer Agenda streichen.

Jan 05 2012

AntiCommonist 0.5.0

Dieser Eintrag ist Teil 8 von 8 in der Artikelserie AntiCommonist

Und heute gibt es seit langer Zeit auch mal wieder eine neue Version des Anticommonisten.

Änderungen:

  • Es gibt die neue Option -e die nur wirksam wird, wenn man Dateien aus einer Kategorie herunterlädt. Mit dieser Option können bestimmte Dateitypen vom Download ausgeschlossen werden. Dies ist nützlich, wenn man z.B. nur die Bilder aber keine PDFs in der Kategorie haben will.

Beschreibung dieser Option:

 -e,--exludefiletypes    list of file types, which will
                                          not downloaded from a category,
                                          only available if option c is used,
                                          commasepareted list

Download:

AntiCommonist 0.5.0

Jul 20 2011

Das Mysterium FAL

Ich habe mich vermutlich geirrt bzw. bin vermutlich der mangelhaften deutschen Übersetzung der License Art Libre aufgesessen. Eine Diskussion in Commons hat mir aber gezeigt, dass sich die Situation bei der FAL mittlerweilen etwas geändert hat.

Wie bereits gepostet steht in der deutschen Übersetzung, auf die ich mich verlassen habe, in §3 folgender Satz:

Alle Elemente dieses Werkes müssen frei bleiben ; aus diesem Grunde ist es Ihnen untersagt, die Originale in andere Werke einzufügen, welche der Lizenz nicht obliegen.

Allerdings bezieht sich diese Übersetzung auf die Version 1.1. Mittlerweile gibt es aber die Version 1.3, die in diesem Punkt ergänzt wurde. Und das hatte ich übersehen. In dieser Version wurde der §3 um folgenden §4 ergänzt (englische Übersetzung, wie gesagt eine deutsche Übersetzung der Version 1.3 existiert nicht):

Incorporating this work into a larger work that is not subject to the Free Art License shall not challenge the rights granted by this license.

If the work can no longer be accessed apart from the larger work in which it is incorporated, then incorporation shall only be allowed under the condition that the larger work is subject either to the Free Art License or a compatible license.

Eine grobe Übersetzung meinerseits:

Das Einfügen dieses Werkes in ein größeres Werk, dass nicht der Free Art License unterliegt, darf die Ausübung der mit dieser Lizenz erteilten Rechte nicht behindern.

Wenn  das Werk nicht mehr einzeln vom größeren Werk in das es eingefügt wurde, verwendet werden, dann ist das Einfügen nur erlaubt, wenn das größere Werk selbst der Free Art License oder einer kompatiblen Lizenz unterliegt.

Damit sieht die Situation natürlich wesentlich anders aus, als noch von mir beschrieben. Da zumindest innerhalb der Wikipedia auf ein Bild noch getrennt vom größeren Werk zugegriffen werden kann, ist also ein Einfügen von Bildern unter der FAL in Wikipedia-Artikel zulässig. Und da zumindest bei dem Bild, was von mir als Beispiel angegeben wurde, nur die Lizenz ohne Versionsnummer angegeben wurde, sollte auch die Verwendung außerhalb der Wikipedia keine größeren Probleme darstellen.

Vermutlich werden die entsprechenden Fotografen bei neuen Bilder explizit die Version  1.1 auswählen, die Lizenz lässt dies zu, was dann auch wieder die beschriebenen Nachnutzungsschwierigkeiten, auch in der Wikipedia, hervorrufen würde.

Jul 14 2011

Warum Bilder aus Commons in der Wikipedia nicht nutzbar sind

oder wie man mit freien Lizenzen Nachnutzung verhindert

Dieser Artikel ist zumindest teilweise fehlerhaft. Siehe deshalb auch meinen ergänzenden Artikel Das Mysterium FAL.

Die Überschrift mag erstmal merkwürdig klingen. Aber ich denke, dass bestimmte Bilder aus Commons zumindest in der deutschsprachigen Wikipedia nicht nutzbar sind und damit nicht in Artikel eingebunden werden können.

Eigentlich wurde doch Commons genau dafür eingerichtet, um alle Wikimedia-Projekte mit Medien zu versorgen und eigentlich sollte man sich doch gerade bei Commons-Bildern keine Sorgen machen müssen. Und auf Commons werden doch nur Medien geduldet, die unter einer freien Lizenz stehen bzw. Gemeinfrei sind. So werde keine Bilder die unter Fair Use stehen und keine Logos geduldet, die zumindest in der deutschsprachigen Wikipedia als problemlos eingestuft werden. Wo ist also das Problem? Das Problem ist eine bestimmte Kombination von freien und unfreien Lizenzen, was auf Commons möglich ist.

Zum Hintergrund:  In den letzten Tagen sind RaymondAchim und Gnu1742 auf einige Aspekte Freier Lizenzen eingegangen, u.a. die schwierige Nachnutzung, fehlende Lizensierung bei Nachnutzern und die Unmöglichkeit bestimmte Lizenzen in einigen Medien überhaupt verwenden zu können.

Achim schreibt zwar:

Viele Bilder sind allerdings de fakto für so ein Blog wie dieses oder für Printmedien gar nicht nutzbar, weil sie als Lizenz die GFDL-1.2-only angeben

übersieht aber meines Erachtens einen wichtigen Punkt. Je nach dem gewählten Lizenzen-Mix wird nicht nur die Nachnutzung in bestimmten Medien behindert, sondern es kann sogar soweit gehen, das bestimmte Bilder auch in der deutschsprachigen Wikipedia nicht genutzt werden können.

Schauen wir uns als Beispiel dieses Bild auf Commons vom Miniaturwunderland in Hamburg an. Warum ich das Bild hier nicht einbinde sollte im Lauf meiner Erörterungen klar werden. Dieses und eine ganze Reihe weiterer Bilder weist einen, sagen wir mal, interessanten Lizenz-Mix auf. Als erstes die Licence Art Libre (deutsch: Lizenz freie Kunst), dann noch die GFDL 1.2 only und die CC-BY-NC-ND. Nach meiner Meinung ist ein Bild mit solch einem Lizenzmix in der deutschsprachigen Wikipedia, von einer Nachnutzung in der großen weiten Welt ganz zu schweigen, nicht verwendbar. Dafür muss man sich die einzelnen Lizenzen einzeln und im Zusammenspiel anschauen.

1. Die in Frankreich entstandene Licence Art Libre ist extrem viral. Sie verlangt in §3 des Lizenztextes folgendes:

3. Eingliederung des Werkes
Alle Elemente dieses Werkes müssen frei bleiben ; aus diesem Grunde ist es Ihnen untersagt, die Originale in andere Werke einzufügen, welche der Lizenz nicht obliegen.

Was mit dieser etwas kruden deutschen Übersetzung aus dem Französischen gemeint ist, wird sehr klar im Wikipedia-Artikel erläutert:

Dazu [zu den Lizenzbedingungen] zählt, dass jedes größere Werk, das das lizenzierte Werk enthält, ebenfalls unter diese Lizenz gestellt werden muss.

Da ein Wikipedia-Artikel in den allermeisten Fällen als eigenes Werk anzusehen ist, folgt daraus, dass ein Artikel in der Wikipedia in dem dieses Bild eingebunden ist auch unter der Licence Art Libre stehen müsste, wenn nicht sogar die gesamte Wikipedia, was schlicht unmöglich ist. Wenn ein Bild nur unter dieser Lizenz steht, kann es wohl in keinem Wikimedia-Projekt vernünftig verwendet werden. Fazit: Unter der Licence Art Libre  nicht verwendbar in der deutschsprachigen Wikipedia.

Nachtrag zur FAL: Eventuell bin ich hier einer Missinterpretation aufgessen, da die deutsche Übersetzung auf der Webseite der FAL einen wichtigen Satz unterschlägt. Ich hab gerade eine Mail losgeschickt, mit der Bitte mir die folgende Passage aus dem französischen Original zu übersetzen. Vll. kann ja aber auch hier jemand helfen:

3. DROITS CONNEXES.
Les actes donnant lieu à des droits d’auteur ou des droits voisins ne doivent pas constituer un obstacle aux libertés conférées par cette licence.
C’est pourquoi, par exemple, les interprétations doivent être soumises à la même licence ou une licence compatible. De même, l’intégration de l’oeuvre à une base de données, une compilation ou une anthologie ne doit pas faire obstacle à la jouissance de l’oeuvre telle que définie par cette licence.

2. Dass die CC-BY-NC-ND, also keine Bearbeitungen erlaubt, keine kommerzielle Nutzung erlaubt, keine völlig freie Lizenz ist, sollte unstreitig sein. Da aber die Wikipedia in ihren Grundprinzipien unter dem Punkt Freie Inhalte verlangt, dass:

die Inhalte [...] unter einer Lizenz stehen, die eine Weiternutzung unter der Bedingung der Autorennennung und der weiteren Verbreitung unter gleichen Bedingungen (Copyleft) erlaubt

ist eine Nutzung unter der CC-BY-NC-ND  nicht möglich, da diese Lizenz Einschränkungen besitzt, die mit der Definition freier Inhalte nicht kompatibel ist. Fazit:  Unter der CC-BY-NC-ND nicht verwendbar in der deutschsprachigen Wikipedia.

3. Die dritte der Lizenzen ist eine besondere Zierde der privaten Rechtsfortschreibung: Die GFDL 1.2 only. Eine Lizenz die es so gar nicht gibt, denn die GFDL kennt nur diese zwei Anwendungsfälle: “GFDL, eine bestimmte Version oder jede spätere” und “GFDL, ohne bestimmte Version”. (siehe Abschnitt 10 „FUTURE REVISIONS OF THIS LICENSE“ des Lizenztextes). Im zweiten Fall darf sich der Nutzer eine beliebige Version für die Nutzung aussuchen. Das Festnageln auf eine bestimmte Version ist nicht vorgesehen. Ich sehe darin eine unzulässige Veränderung der Lizenz, was im Endeffekt zu einer ungültigen Lizenz führt.

Aber mir geht es gar nicht nur um die Diskussion rechtlicher Feinheiten, denn da werde ich sicherlich kein allgemeingültiges Urteil vorgeben können. Was meines Erachtens ebenso die Nutzung in der deutschsprachigen Wikipedia verhindert, ist ein Meinungsbild vom Dezember 2008. In diesem hat sich die Community eindeutig gegen die Nutzung der GFDL 1.2 only ausgesprochen. Warum es möglich sein sollte den Willen der Community über den kleinen Umweg über Commons eine lange Nase drehen zu können, will sich mir nicht erschließen. Konsequenterweise dürften solche Bilder in der deutschsprachigen Wikipedia nicht mehr eingebunden werden. Fazit: Unter der GFDL 1.2 nicht verwendbar in der deutschsprachigen Wikipedia, da keine gültige Lizenz und nicht in der deutschsprachigen Wikipedia erwünscht.

Es ist also gar nicht so schwer Bilder oder andere Medien auf Commons unter eine freie Lizenz zu stellen, ohne dass diese in der Wikipedia verwendbar wären. Vermutlich betrifft dies eine gehörige Menge an Bildern, die dennoch in die Artikel eingebunden werden. Bis vor kurzem bin ich ja auch davon ausgegangen, dass man alle Bilder aus Commons problemlos verwenden könnte. Dem ist offensichtlich nicht so.

Ich sehe nur eine Lösung des Problems, jedes Medium muss mindestens eine Lizenz haben, die es ermöglicht diese Medien in allen Wikimedia-Projekten problemlos einzusetzen, also kompatibel zur CC-BY-SA der Wikipedia ist. Andere freie Lizenzen, die nicht dazu kompatibel sind, dürfen nur zusätzlich vergeben werden. Unfreie, nicht völlig freie Lizenzen und irgendwelche Privatlizenzen sollten hingegen überhaupt nicht geduldet werden.

Der hier diskutierte Lizenz-Mix, es gibt sicherlich noch andere interessante Ideen in diese Richtung, ist in meinen Augen auch kein Versehen, sondern auf Grund der gewählten Lizenzen eindeutig Absicht. Es geht hier darum, für die Nachnutzung möglichst hohe Hürden aufzubauen, so dass eine sinnvolle Nutzung nicht mehr möglich ist. Die Inhalte sollen möglichst exklusiv für die Wikipedia sein, ohne dass Andere daran partizipieren können.

Für mich ist das eine Verhöhnung der Grundsätze Freier Inhalte. Dass dabei auch die Möglichkeit der Nutzung der Inhalte in der Wikipedia als Kollateralschaden auf der Strecke bleibt, mag sicherlich unbeabsichtigt sein, wird aber offenbar in Kauf genommen. Dass damit auch viele nützliche und sinnvolle Verwendungen verhindert werden, scheint sowieso vollkommen egal zu sein.

Jun 24 2011

Wikipedia Projekt Hamburgische Bürgerschaft – Die dritte

Auf Commons trudeln mittlerweile die ersten Bilder ein. Alle Bilder zu dem Projekt egal ob Abgeordnete, zum Gebäude oder zum Making-of finden sich in der Commons-Kategorie: Projekt Hamburgische Bürgerschaft.

Nov 17 2009

Ein Bild bei Kai Diekmann

File:Nva-ehrenwache.jpg

Vor einer geraumen Weile hatte ich über die Verwendung dieses Bildes bei Telepolis berichtet und die Geschichte hinter dem Bild erzählt.

Aber das schöne an so einem Blog ist ja, dass man Fortsetzungsgeschichten schreiben kann, auch wenn das nicht beabsichtigt ist. Über einen Backlink hierher wurde ich aufmerksam, dass genau dieses Bild vor ein paar Tagen auch woanders verwendet wurde. Und zwar im Blog des  Chefredakteurs der Bild-Zeitung Kai Diekmann in einem Beitrag mit dem Titel: Heraus zum 9000. Genossen!

Mein Bild mag zum Thema, nämlich der Genossenschaftsmitgliederwerbung der taz, passen oder auch nicht, was für mich natürlich keine Rolle spielt. Denn Herr Diekmann darf natürlich mein Bild verwenden, es steht ja unter verschiedenen freien Lizenzen. Er verguß nur die entsprechenden Lizenzhinweise und meine Namensnennung. Auf eine Abmahnung oder ähnlichen Unfug verzichte ich natürlich. Aber damit er auch in Zukunft ohne große rechtliche Probleme auf den Schatz von Wikimedia Commons zugreifen kann, habe ich ihm einen Kommentar in sein Blog gestellt und ihn auf eine korrekte Verwendung Freier Inhalte hingewiesen, verbunden mit einer kleinen Bitte. Und damit dieser Kommentar nicht aus Versehen verlorengeht, freigeschaltet ist er noch nicht, dokumentiere ich ihn auch nochmal hier:

Hallo Herr Diekmann, ich bedanke mich erstmal herzlich dafür, dass sie ein von mir vor ca. 20 Jahren gemachtes Foto, die NVA-Soldaten ganz oben, hier im Blog verwenden. Genau dafür habe ich es auf Wikimedia Commons, dem Medienarchiv das unter anderem die Wikipedia mit Bildern versorgt, veröffentlicht (http://commons.wikimedia.org/wiki/File:Nva-ehrenwache.jpg). Nämlich, dass es jedermann für jeglichen Zweck ohne irgendwelche Kosten verwenden darf.

Eine winzigkleine Bedingung ist allerdings daran geknüpft: bei einer Verwendung muss mein Name und die oben kurz beschriebene Lizenz an geeigneter Stelle genannt werden. Beides ist offensichtlich nicht erfolgt.

Eine Abmahnung oder ähnlichen Unfug spare ich mir einfach und bitte sie einfach stattdessen zur Förderung Freien Wissens und Freier Inhalte, von denen sie hier gerade zumindest ein klein wenig profitieren, eine Spende an Wikimedia Deutschland zu entrichten. Das geht ganz einfach online unter:https://secure.wikimedia.de/spenden/ . Der Verein Wikimedia Deutschland unterstützt und fördert Freies Wissen, insbesondere die wohl allen bekannte Wikipedia, aber auch deren Schwesterprojekte, wie zB das oben erwähnte Medienarchiv Wikimedia Commons.

Vielen Grüße

Michail


Mai 11 2009

AntiCommonist 0.4.0

Dieser Eintrag ist Teil 7 von 8 in der Artikelserie AntiCommonist

Nach etwas längerer Zeit mal wieder ein kleines Update meiner beliebten kleinen Software zum Herunterladen von Bildern aus MediaWiki-Wikis.

Folgende Änderungen:

  • Die Option –m ob ein Verzeichnis neu angelegt wurde, hatte den falschen Default-Wert. Jetzt wird ein Verzeichnis automatisch angelegt, wenn das Verzeichnis noch nicht vorhanden ist. Vorher musste die Option, entgegen der Beschreibung, explizit auf true gesetzt werden. Das kann jetzt entfallen. Wenn allerdings dieses Verhalten nicht gewünscht wird, dann muss nun der Parameter auf false gesetzt werden.
  • Bei Netzwerk-Fehlern beim Herunterladen bricht AntiCommonist nicht mehr komplett ab und das Programm muss neu gestartet werden. Dies konnte insbesondere bei wackliger Internetverbindung oder zickigen Wikimedia-Server vorkommen. Nun versucht AntiCommonist das Bild standardmäßig drei mal herunterzuladen. Diese Verhalten kann mit der neuen Option –n gesteuert werden. Dieser übergibt man die Anzahl an Versuchen die AntiComminist verwenden soll, die Bilder herunterzuladen. Wenn innerhalb dieser Anzahl kein Erfolg erzielt werden konnte, geht AntiCommonist zum nächsten Bild über. Am Ende wird eine Liste der Bilder ausgegeben, die nicht heruntergeladen werden konnten.

Beschreibung der neuen Option:

-n,--numbertries    number of tries to download a file,
                    default is 3, values < 1 will
                    be set to equals 1
AntiCommonist 0.4.0 (72)

Apr 06 2009

Die gute alte DDR

Am 1. April wurden die ersten rund 5000 Bilder, die von der Fotothek unter eine freie Lizenz gestellt wurden, auf Commons hochgeladen. Wenn ich es recht gesehen habe, sind es ausschließlich Bilder des Fotografen Eugen Nosko, der in den 1970er und 1980er Jahren Industriefotograf im Auftrag volkseigener Betriebe und Kombinate war.

Und genau dies zeigen diese Bilder: Menschen, Produktionsprozesse, Arbeitsabläufe und Milieu der Industrie im einstigen „Arbeiter- und Bauernstaat“. Einige wenige Bilder, die mir als Ex-Ossi besonders ins Auge fielen, hab ich hier mal in einer kleinen Galerie zusammengestellt.

Irritiert bin ich über die Kritik die hier und da aufkam. Die Bilder die von der Fotothek bereitgestellt wurden seien enttäuschend, unbrauchbar und unenzyklopädisch. Auch wenn man nicht unbedingt alle Bilder hätte hochladen müssen, da sich doch einige Motive stark ähneln bzw. wiederholen, muss ich der Kritik widersprechen. Erstens handelt es sich, wie bereits erwähnt, um einen winzigen Bruchteil der insgesamt 250.000 Bilder.

Zweitens sehe ich die Bilder als wichtige Zeitdokumente der DDR-Industrie und teilweise des Alltagslebens. Viele Bilder zeigen, auch erst durch die vermeintlichen Wiederholungen, sehr schön die Formensprache und die Ästhetik der „sozialistischen“ Kunst. Da sehen wir zum Beispiel auf vielen Bildern lachende Bauern bei der Apfelernte, zufriedene Arbeiter beim Essen in einer sauberen Kantine und glückliche Urlauber im Ferienheim. Genauso wie bei vielen Bildern aus dem Bundesarchiv, handelt es sich bei den meisten Bildern von Eugen Nosko auch nur um Propagandafotos. Die Realität sah wesentlich trister und trüber aus.

Und drittens ist, zumindest für mich, Commons keine Exklusiv-Veranstaltung der Wikipedia, wo jedes Bild unbedingt Platz in einem Enzyklopädie-Artikel finden muss. Ob hingegen auf Commons private Urlaubsbilder unter einer freien Lizenz ihren Platz finden sollen, ist eine ganze andere Frage.

Natürlich erhoffe auch ich mir noch andere Bilder, als nur glückliche Arbeiter und Bauern in der sozialistischen Produktion.

Mrz 05 2009

Vier Millionen mal Commons und Wikisource ist dabei

Das Logo von Wikimedia Commons

Gestern meldete es ja schon der Kurier: Auf Commons befinden sich mittlerweilen über vier Millionen Dateien aller Art.

Dass unser kleines Projekt daran einen gewichtigen Anteil hat, kann ich mir natürlich nicht verkneifen zu erwähnen. Das deutschsprachige Wikisource-Projekt hat auf Commons insgesamt 321.356 Dateien hochgeladen, in der überwiegenden Mehrheit Scans von gemeinfreien Texten. Das sind mal eben mehr als 8 Prozent des Gesamtbestandes.

Feb 25 2009

AntiCommonist 0.3.1

Dieser Eintrag ist Teil 6 von 8 in der Artikelserie AntiCommonist

Dies ist ein kleines Bugfix Release.

Änderung:

  • Parameter –m wird jetzt korrekt ausgewertet, dieser wurde zuvor komplett ignoriert
  • Kleine Verbesserung in der Batchdatei bezüglich der Weitergabe der Parameter

Download AntiCommonist 0.3.1

Feb 18 2009

AntiCommonist 0.3.0

Dieser Eintrag ist Teil 5 von 8 in der Artikelserie AntiCommonist

Nach all den Bildern, Videos und langen Texten nun mal wieder ein einfaches und langweiliges Update des AntiCommonist.

Änderungen:

  • Die Auswertung der Kommandozeile wurde auf Apache Commons CLI 1.1 umgestellt, deshalb muss das Programm nun ein wenig anders aufgerufen werden. Im folgenden die möglichen Optionen:
usage: AntiCommonist [-c <categoryname>]
                     -d <localdirectory>
		     [-help]
		     [-m <true|false>]
		     [-t <textfile>]
                     [-w <wikiurl>]
 -c, --category <categoryname> download files from given
		               category, alternative
                               to option t
 -d, --dir <localdirectory>    local directory to save
                               downloaded files
 -help                         print this message
 -m, --makedir <true|false>    should local directory be
		               created if not exist,
                               default is true
 -t, --textfile <textfile>     name and path of file with
                               filenames to download from
                               wiki, alternative to
                               option c
 -w, --wiki <wikiurl>          url of wiki to download from,
                               if empty wikimedia commons
                               is used
  • Und wer nun aufmerksam das obige Kauderwelsch durchgelesen hat, wird festgestellt haben, dass eine Option hinzugekommen ist. AntiCommonist legt nun nämlich das lokale Verzeichnis für die heruntergeladenen Dateien an, wenn dieses noch nicht vorhandenen ist. Falls dies nicht gewünscht kann dies mit der neuen Option –m und dem Wert false abgeschaltet werden.

Die Umstellung des Programmaufrufes ist erforderlich geworden, da ich auch in Zukunft neue Optionen einfach hinzuzufügen möchte. Und da sich andere Leute schon einige Gedanken gemacht haben, wie man die Kommandozeile auswertet und ich das Rad nicht zum Millionstenmal neu erfinden muß, verwende ich ab sofort das Command Line Interface von Apache Commons. Daraus resultierend hat sich das Aufrufformat zum ersten und letzten Mal geändert. In Zukunft kommen nur neue Optionen hinzu.

Feb 07 2009

AntiCommonist 0.2.3

Dieser Eintrag ist Teil 4 von 8 in der Artikelserie AntiCommonist

Heute mal wieder eine neue Version des AntiCommonist.

Änderung:

  • Bereits heruntergeladene Dateien werden nun nach einem Neustart nicht erneut heruntergeladen, sondern übersprungen. Spart Zeit und Serverlast, falls aus irgendeinem Grunde der Download unterbrochen werden musste.

Feb 03 2009

Google ändert Nutzungsbedingungen für Book Search

Vor ein paar Tagen hat Google die Nutzungsbedingungen für den PDF-Download gemeinfreier Bücher (auf deutsch scheint es die nicht zu geben) geändert. Anstelle der Klausel:

  • Use the files for non-commercial purposes only.

heißt es nun:

  • Don’t engage in large scale redistribution or rehosting of the files
  • Don’t sell digital or physical copies, or help other people buy and sell them.

Zumindest die erste der beiden neuen Klauseln ist offenbar gegen das Internet Archive gerichtet, das über 537.000 PDFs von Google gespiegelt hat. Eine Auswirkung auf Wikisource bzw. Wikimedia Commons ist aber auch nicht ausgeschlossen, da dort ebenfalls einige Bücher von Google hochgeladen wurden. Frage bleibt dabei was Google unter large scale versteht.

Klaus Graf weist in seinem Blog aber meines Erachtens zu recht darauf hin, dass nach deutschem Recht auch weiterhin einzelne gemeinfreie Werke einem solchen Datenbankwerk entnommen werden dürfen, was aber bei einer eventuellen Klage Googles gegen die Wikimedia Foundation keine Rolle spielen dürfte

In die PDF-Downloads selbst scheinen die Klauseln noch nicht eingeflossen zu sein, zumindest so ein paar meiner Stichproben.

Für eine ausführliche Analyse siehe: Change in Google Book Search Guidelines for Public Domain Books

Via: Archivalia

Feb 02 2009

Skript zum Bilder–Download

Der AntiCommonist kann ja seit der Version 0.2.1. Bilder auch aus einer Kategorie herunterladen. Wer es lieber per Python mache möchte, der sei auf dieses Skript von Christoph verwiesen. Danke an ihn für den Hinweis.

Jan 22 2009

AntiCommonist 0.2.1

Dieser Eintrag ist Teil 3 von 8 in der Artikelserie AntiCommonist

Auch auf die Gefahr hin, dass es derzeit etwas monothematisch ist, muss ich heute doch wieder was zum AntiCommonist schreiben, da es eine neue fehlerbereinigte Version gibt.

Änderungen

  • Fehler bereinigt beim Download aus Kategorien, bisher stolperte AntiCommonist über Artikel, Vorlagen etc. die in einer Kategorie enthalten waren
  • Fehler in der Batch-Datei behoben
  • Integration der aktuellen Version des JavaWikiBotFrameworks

 

Download AntiCommonist 0.2.1

Jan 21 2009

AntiCommonist 0.2

Dieser Eintrag ist Teil 2 von 8 in der Artikelserie AntiCommonist

Nachdem zum AntiCommonist ein paar Hinweise und Wünsche eingegangen sind, hier nun eine neue Version.

Änderungen

  • Es sollte nun das Bild in der höchsten Auflösung unabhängig von der Sprache gefunden werden (Dank an Dapete für den Hinweis auf die API-Funktion)
  • Man kann jetzt auch Bilder aus einer Kategorie herunterladen. Der Aufruf dafür lautet:
anticommonist -category <categoryName> <downloadPath> <wiki>

categoryName – Name der Kategorie, ohne Category: oder Kategorie: oder wie die in anderen Sprachen auch immer benamst werden

downloadPath – lokaler Pfad in dem die Bilder abgelegt werden sollen

wiki – von welchem Wiki soll herunter geladen werden, Angabe in der Form: http://commons.wikimedia.org. Darf weggelassen werden. Dann wird Commons verwendet.

  • Kleinen Fehler in der Batchdatei behoben

Download AntiCommonist 0.2

Jan 20 2009

AntiCommonist

Dieser Eintrag ist Teil 1 von 8 in der Artikelserie AntiCommonist

Update: Dieser Beitrag beschreibt die erste Version des Tools, die aktuelle Version kann hier heruntergeladen werden.

Bilder auf Commons hochzuladen geht ja dank Commonist schon seit einer Weile recht komfortabel. Was aber machen, wenn man sehr viele Bilder von Commons in der höchsten Auflösung herunterladen will, z.B. ein komplettes Buch mit über 500 Seiten? Klicken und speichern macht nicht wirklich Spaß und dauert eine halbe Ewigkeit.

Eine Lösung war bisher das Tool Winpluck von Flominator, welches aus meiner Sicht ein paar Unschönheiten hat. Zum Beispiel benötigt man einen Apache mit PHP. Außerdem lädt es derzeit das falsche Bild herunter, weil die Jungs auf Commons so pffifig waren, ein Bild in die Sitenotice einzubauen und Winpluck einfach nach dem ersten Bild in der HTML-Seite suchte. Außerdem mag ich PHP nicht ;-)

Deshalb habe ich das neckische Tool einfach nachgebaut und mit paar zusätzlichen Features versehen:

  • läuft mit Java lokal auf dem Rechner in der Kommandozeile
  • es wird auf der Commons-Seite explizit nach der großen Version des Bildes gesucht, so dass die Commons-Admins und Entwickler die Seiten mit anderen Bildern vollpflastern können wie sie wollen.
  • Die Dateien werden mit dem korrekten Dateinamen abgespeichert und nicht wie Winpluck mit UTF-codierten Zeichen

Verwendung

AntiCommonist liest eine einfache Textdatei mit Dateinamen ein. In jeder Zeile steht ein Name, ohne Präfix File:, Datei:, Bild: oder ähnliches. Beispiel:

Reichs-Ritter-Archiv_I_0001.jpg
Reichs-Ritter-Archiv_I_0002.jpg
usw.

Eine Batchdatei zum Aufruf ist beigelegt. Auf der Kommandozeile folgendermaßen aufrufen:

anticommonist <textfile> <downloadPath> <wiki>

textfile – Dateiname inklusive Pfad, der Textdatei die die Dateinamen auf commons enthält

downloadPath – lokaler Pfad in dem die Bilder abgelegt werden sollen

wiki – von welchem Wiki soll herunter geladen werden, Angabe in der Form: http://commons.wikimedia.org. Darf weggelassen werden. Dann wird Commons verwendet.

Zu Ausführung wird Java 1.6 benötigt.

Download AntiCommonist 0.1.1

Für Hinweise, Fehlermeldungen, Anregungen etc. bin ich natürlich dankbar.

Update

Mittlerweilen habe ich eine neue Version hochgeladen, die einige kleinere Fehler beseitigt:

  • Batch-Datei wechselt nicht mehr in das übergeordnete Verzeichnis
  • Download nun auch von deutschsprachigen Wikis möglich, andere Sprachen müssen allerdings weiterhin manuell hinzugefügt werden. Ich werde mir aber eine sprachunabhängige Lösung überlegen, wie ich den Link zur hochaufgelösten Version in der Datei-Seite finde.

Eine ausführliche Anleitung werde ich demnächst der Zip-Datei hinzufügen.

Aug 03 2007

Kleine Statistik

 Da Joergens.mi, einer unser aktivsten und fleißigsten Mitarbeiter bei Wikisource, gerade alle Texte erfasst, die wir mittlerweile als Scan nach Commons hochgeladen haben, hier mal die Zahlen die er dabei gewonnen hat:

  • auf Commons befinden sich die Scans von knapp 700 Büchern und rund 400 kürzeren Texten
  • diese liegen vor in Form von mindestens 75504 gescannten Seiten bzw. Dateien  (z.B. PDF, djvu)
  • damit stammen etwas über 4% der Dateien auf Commons vom deutschsprachigen Wikisource-Projekt

Man muss aber dazu sagen, dass wir noch längst nicht all diese Texte direkt in Wikisource als elektronischen Text verfügbar machen konnten. Es liegt also noch viel Arbeit vor uns.

Alle Scans auf Commons kann man in der  Liste der Scans auf Commons finden.

Update:

Wir haben noch mal ein bisschen rumgespielt, um noch ein paar Zahlen zu erhalten, wieviele Werke mittlerweile bei Wikisource vorhanden sind und sich in einem präsentablem Zusatnd befinden. Zu beachten ist dabei, dass ein Werk ein kurzes Gedicht oder auch ein komplettes Buch wie die Zimmerische Chronik umfassen kann. Hier die Zahlen:

  • rund 2900 Werke wurden bereits zweimal korrekturgelesen und befinden sich damit im Status „fertig“
  • etwa 1000 Werke wurden einmal korrekturgelesen und befinden sich im Status „korrigiert“
  • insgesamt umfasst Wikisource rund 5300 Werke

Da grosse Werke, wie z.B. Bücher auf Unterseiten verteilt werden, gibt die Zahl von 8.600 Wiki-Seiten die den Status „fertig“ tragen, wesentlich besser wieder, welche Arbeit in den letzten anderthalb Jahren bei Wikisource geleistet wurde.

Performance Optimization WordPress Plugins by W3 EDGE