Entwicklung (Online-)Digitalisierungs- und Korrekturtool

Entwicklung (Online-)Digitalisierungs- und Korrekturtool

Postby skreutzer » 2013-06-15T22:43:52+00:00

Jemand vom Projekt „Offene Bibel“ hat vorhin im Chat darauf hingewiesen, dass es für OSIS wohl Tools gäbe, mit denen der Bibeltext editiert werden kann. Grund dafür wird in erster Linie sein, dass OSIS als Format einerseits zu komplex ist und andererseits zu unpraktisch, um von Hand in XML geschrieben zu werden. Für uns mit Haggai XML trifft zwar dieses Problem nicht direkt zu, jedoch setzt unser Digitalisierungsverfahren genügend Technik-Affinität voraus, um mit XML für Haggai XML umgehen zu können. Daher nun folgende Idee: wäre es nicht praktisch, eine Web-Software zu programmieren, die Online das Digitalisieren und Korrigieren von Bibeltexten nach dem WYSIWYG-/Rich-Edit-Prinzip ermöglicht? Sofern es sich bei dem Original-Bibeltext um einen Scan im PDF-Format handelt, könnten dessen einzelne Seiten mithilfe eines bekannten Verfahrens in Bilder konvertiert werden. Selbige (und „Scans“, die nur als Bild vorliegen) könnten dann in einem zoombaren und verschiebbaren Bereich der Software angezeigt werden. Direkt darunter würde dann ein ASCII-Editor angeordnet sein, in welchem durch einen Button-Klick (evtl. auch optisch) der mit der Maus markierte Text für Haggai XML ausgezeichnet werden würde. Zum Schluss würde man das Ergebnis speichern. Wenn eine Anmeldung zum Zugang der Software vorgeschalten wäre, könnten wir sogar nachvollziehen, wer an dem Text wann gearbeitet hat, was hinsichtlich der Metadaten im Haggai-XML relevant ist. Ob auch der anonyme Zugang erlaubt sein soll, müsste geklärt werden, wobei es wahrscheinlich die Beteiligungsbereitschaft erhöhen würde, wenn keine Anmeldung erforderlich ist. Bei noch nicht vorliegenden Bibeltexten würde der ASCII-Editor leer starten, beim Korrekturlesen würde der schon bestehende Text geladen werden, sodass entweder Korrekturen direkt angewendet oder Verse/Kapitel über einen Button als korrekt bestätigt werden könnten. Zuletzt bestünde die Möglichkeit, z.B. über diffutils direkt die Unterschiede für einen zweiten Kontrolleur (Maintainer) zwecks Checkin ins Repository ermitteln zu lassen, wodurch dann die finale Abnahme der Arbeit geregelt werden könnte. Auf diese Weise wäre es einem breiteren Interessentenkreis möglich, an der Digitalisierung und Korrekturlesung teilzunehmen, weil wie gesagt XML-Kenntnisse keine zwingende Voraussetzung wären. Daher die Frage: haltet ihr es für sinnvoll, Zeit in eine solche Software zu stecken? Würde das Ziel, eine breitere Beteiligungsmöglichkeit zu schaffen, mit den oben genannten Features erreicht werden können oder wie könnte ein besseres Konzept aussehen? Ich für meinen Teil könnte hinsichtlich des Umgangs mit den Daten durchaus mit der Programmierung beginnen, jedoch der GUI-Anteil wie die Original-Bibeltext-Anzeige und der ASCII-Editor bedürfte einer größeren Einarbeitungszeit, um mit den dafür notwendigen Web-Technologien überhaupt erstmal vertraut zu werden, damit eine vernünftige Umsetzung gelingen kann.
User avatar
skreutzer
Administrator
 
Posts: 50
Joined: 2012-12-13T09:31:37+00:00
Location: Bietigheim-Bissingen, Germany

Re: Online-Digitalisierungs- und Korrekturtool entwickeln?

Postby skreutzer » 2013-07-12T10:37:59+00:00

Mittlerweile wurden erste Schritte getan, wovon erstmal die Voraussetzung für ein solches Tool, unsere PDFs in Bilddateien konvertieren zu können, mit pdf2png geschaffen wurde. Ferner habe ich mehrere Versuche unternommen, schonmal eine Web-Oberfläche zu entwerfen. Dabei ist die größte Schwierigkeit, dass große Bilder offenbar nicht ohne weiteres vom Browser performant geladen werden können. Jeder Versuch, um dem etwas Abhilfe zu schaffen (etwa das Bild via HTML in einen kleinen Bereich mit Scrollbars packen, via JavaScript das Bild erst später in einen kleinen Bereich mit Scrollbars packen, auf HTML5-Canvas zeichnen, mittels PHPs gdlib das Bild in lauter kleinere Einzelbilder zu zerteilen, um diese einzeln verspätet nachzuladen), scheiterte an der Grunderfordernis, dass alle diese Techniken erstmal das gesamte Bild einlesen, anstatt mit einem Offset nur den relevanten Bereich abzugreifen. Offen sind noch Versuche mit CSS und SVG clip path. Man könnte das Problem aber auch dadurch umgehen, von vornherein nur kleinere Bilder bereitzustellen.

Um sich das Ergebnis besser vorstellen zu können, sei auf das Proofreading Interface des „Distributed Proofreaders“-Projekts verwiesen. Unser „digiproofol“ („Digitalization and Proofreading Tool“) soll jedoch unter freier Lizenz veröffentlicht werden und darüber hinaus an die speziellen Erfordernisse von Haggai-XML angepasst sein.

Zuletzt könnte man sich auch noch überlegen, eine Offline-Anwendung zu entwickeln, die zur lokalen Bearbeitung (bei mangelnder Verfügbarkeit einer Internet-Verbindung) der XML-Dateien verwendet werden könnte, um die Dateien dann via SVN ins Repository einzuspielen und dort zu verwalten.
User avatar
skreutzer
Administrator
 
Posts: 50
Joined: 2012-12-13T09:31:37+00:00
Location: Bietigheim-Bissingen, Germany

Re: Online-Digitalisierungs- und Korrekturtool entwickeln?

Postby woschultz » 2013-07-13T19:43:50+00:00

Stephan,

das sind alles Top Ideen aber zuerst sollten Leute da sein, die mitmachen wollen :-) Meine Meinung nach ist das auschecken eines Repositories und das Bearbeiten mit einem Texteditor wohl keine hohe Kunst und sollte von einen durchschnittlichen User zu bewältigen sein. Im Prinzip muss bei Bedarf nur eines der SVN Programme erklärt werden.

gruß
wolfgang
woschultz
 
Posts: 25
Joined: 2012-12-17T19:58:00+00:00
Location: Freiburg

Re: Online-Digitalisierungs- und Korrekturtool entwickeln?

Postby skreutzer » 2013-07-15T10:49:52+00:00

Auch hier gilt, dass ich das Tool zur Not selber programmiere. Ich habe sogar schon damit angefangen, und so schwer ist das dann auch nicht, sondern eher die allseits bekannte Zeitfrage, sodass das Tool ebenfalls langsam wachsen und Stück für Stück erweitert werden würde. In erster Linie geht es mir bei diesen Posts nicht so sehr darum, Mitarbeiter für die einzelnen Tools zu rekrutieren, sondern herauszufinden, wie notwendig oder nützlich solche Tools wären und welche Aktivität mit welcher Priorisierung am ehesten vorangetrieben werden sollte. Auch wäre gut, von Anfang an eine klare Vorstellung von den Features zu bekommen, damit zu einem späteren Zeitpunkt schon nicht mehr so viel umgestellt werden muss.


Ich finde auch, dass jeder, der sich für Bibeldigitalisierung interessiert, technisch hinreichend versiert sein dürfte, um wenigstens mit der grundlegenden Computerbedienung zurechtkommen zu können, und SVN als auch Zefania-XML wären schnell (vielleicht über ein Video-Tutorial) nachvollziehbar erklärt. Das Online-Digitalisierungs- und Korrekturtool würde eher abzielen auf die größere Masse der nicht initial an Bibeldigitalisierung interessierten Leute, die das vielleicht einmal ausprobieren würden und dann evtl. zukünftig öfters beteiligen.
User avatar
skreutzer
Administrator
 
Posts: 50
Joined: 2012-12-13T09:31:37+00:00
Location: Bietigheim-Bissingen, Germany


Return to Tools

Who is online

Users browsing this forum: No registered users and 1 guest

cron