|
Info: bis gestern 957564 Seiten (seit Projektbeginn) |
| GaGa Startseite » Richtlinien zum Korrekturlesen |
Richtlinien zum KorrekturlesenVersion 1.00 in Deutsch (gh)Inhalt
Formatierung von...
Zusätzliche Richtlinien für spezielle Buchtypen
Allgemeine Schwierigkeiten
Die erste RegelDie generelle Regel lautet "Ändern Sie nichts an der Schreibweise des Autors!". Diese Regel betrifft Worte, wie sie heute nicht mehr geschrieben werden ("Thuer" statt "Tür" oder "gieng" statt "ging"). Hat der Autor jedes dritte Wort unterstrichen, kursiv gesetzt oder mit Fußnoten versehen, wird diese Schreibweise übernommen. Geändert werden nur kleine typographische Besonderheiten des Satzes alter Texte, die nicht die Intention des Autors ändern. Beispielsweise wurden im 17. und 18. Jahrhundert Zwischenräume von ¼-Größe eines Leerzeichens (ein sog. Viertelgeviert) vor Interpunktionszeichen gesetzt. Diese Leerzeichen werden gelöscht. KurzreferenzDie Kurzreferenz ist ein zweiseitiges Dokument, das die Hauptregeln unserer Korrekturanweisungen enthält. Jeder Korrekturleser sollte diese zwei Seiten als Print zur Hand haben, um schnell spezielle Anweisungen nachlesen zu können. Zu dieser DokumentationDiese Dokumentation soll unterschiedliche Formatierung in einem System verteilter Korrekturleser vermeiden. Jede Seite soll gleichartig bearbeitet werden. Das macht es für die Nachbearbeiter (und nachfolgende Programme) einfacher, hieraus einen E-Text zu erzeugen. Hier finden sich alle Regeln, die wir für das Korrekturlesen als wichtig erachten. Die Dokumentation wird ständig erweitert, wenn neue Probleme lokalisert worden sind und in Regeln gefaßt werden konnten. Wir freuen uns über jeden Kommentar. ProjektkommentareIm Korrekturfenster befindet sich ein Eintrag Bemerkungen zum Projekt. Hier gibt der Projektmanager Anweisungen zu einer Formatierung, die abweichend von den hier angegebenen Richtlinien sein kann. Solche Anweisungen haben Vorrang vor den hier aufgeführten Regeln. So kann z.B. die Ersetzung von Anführungszeichen (»abc« statt ’abc‘ oder ”abc“ oder ›abc‹) abweichend von der Bildvorlage gewünscht werden. Foren/DiskussionenBeim Start des Korrekturlesens wird das Korrekturfenster mit Informationen über das Buch geöffnet. Dort hat man bei dem Eintrag 'Forum' die Möglichkeit, eine neue Diskussion zum Buch zu eröffnen oder Nachrichten über das Buch an andere Korrekturleser und den Projektmanager abzuschicken. Achtung: Unser Forum mußte deaktiviert werden, da es eine Sicherheitslücke besitzt. Neuer Quellcode ist nicht verfügbar. Fehlerkorrektur vorheriger SeitenIm Korrekturfenster befinden sich zwei Listen mit Referenzen auf Seiten, die bereits von Ihnen bearbeitet wurden. Es werden je Liste maximal fünf Seiten angezeigt. Sie finden diese Listen in den Spalten "Fertig" und "In Arbeit". Alle Seiten der "Fertig"-Liste gelten als komplett korrigiert und werden so an die nächste Runde übergeben. Alle Seiten der "In Arbeit"-Liste warten auf die endgültige Bearbeitung und Freigabe. Sie werden erst dann an die nächste Runde übergeben, wenn sie den Status "Fertig" haben. Da ein Buch erst dann an die nächste Runde übergeben wird, wenn alle Seiten fertig sind, wird unser System die Seiten zurückholen und an andere Korrekturleser übergeben, falls sie zu lange festgehalten werden. Dann gehen aber alle Korrekturen dieser Runde verloren.
Mit dem Laden einer Korrekturseite wird diese automatisch in den Zustand 'in Arbeit' gesetzt.
Mit dem Button Sie haben also noch Zeit, die bearbeiteten Seiten im Status "in Arbeit" und im Status "fertig" noch einmal zu überprüfen. Achten Sie bitte darauf, daß Ihre "In Arbeit"-Liste nicht zu groß wird. Formatierung von...TitelseiteBitte ersetzen Sie die in Großbuchstaben geschriebenen Texte durch die korrekte Schreibweise in Groß- und Kleinbuchstaben (weil "DER GEFANGENE FLOH" nicht rekonstruierbar ist. Denn heißt es "Der gefangene Floh" oder "Der Gefangene floh"?). Titelseiten für unsere E-Texte werden sowieso neu gesetzt. Es ist aber für ein Programm einfacher, alles in Großbuchstaben zu transformieren als die Schreibweise zu erraten.
InhaltsverzeichnisDiese Anweisung ist abweichend von den Regeln des US-Projekts. Für unsere E-Texte generieren wir das Inhaltsverzeichnis automatisch. Sie können diese Seite also unkorrigiert überspringen (als "Fertig" markieren). Ansonsten haben die speziellen Anweisungen des Projektmanagers Vorrang. Die Regel des US-Projektes: alle Seitennummern entfernen, und "..." löschen. Sonst alles wie im Original belassen.
Leere SeitenLeerseiten sind oft am Kapitelende, um das neue Kapitel auf einer rechten Seite (ungerade Seitennummer) anfangen zu lassen. Das OCR-Programm liefert uns aber eine Leerseite beim kleinsten Fliegendreck. Markieren Sie bitte Leerseiten mit dem speziellen Markup [Leerseite], sofern dies nicht bereits von uns in der Vorverarbeitung gemacht wurde. Die Seite wird von uns für den E-Text eliminiert. Kopf- und FußzeilenLöschen Sie bitte alle Kopf- und Fußzeilen (aber nicht die Fußnoten) im Text. Kopfzeilen können Autornamen, Kapitelüberschriften und Seitennummern enthalten, Fußzeile bestehen meistens nur aus der Seitennummer. Falls eine Zitierbarkeit auf Seitenbasis erforderlich ist, wird Ihnen der Projektmanager spezielle Anweisungen zur Behandlung der Seitennummern geben.
KapitelüberschriftenMarkieren sie den Beginn eines neuen Kapitels mit <kapitel/>. Markieren Sie die Kapitelüberschrift mit <h> am Anfang und </h> am Ende der Überschrift. Falls die Kapitelüberschrift in Großbuchstaben geschrieben ist, ändern Sie diese bitte auf Groß- und Kleinschreibung. Falls die Überschrift aus nur einem Satz besteht, sollte auch ein Punkt am Ende entfernt werden (abweichend von den US-Regeln). Ist das erste Wort eines Kapitelbeginns in GROSSBUCHSTABEN, wird das Wort in Normalschrift korrigiert. Wenn ein Kapitel mit einer wörtlichen Rede beginnt, wird der erste Buchstabe groß geschrieben, das OCR-Programm verliert aber gerne das (kleine) Anführungszeichen. Bitte korrigieren.
Seitennotizen (Marginalien)Manche Bücher haben kurze Textzusammenfassungen eines Absatzes oder Abschnitts am Rand (Seitennotizen/Marginalien). OCR-Programme können Marginalien als eigene Spalte erkennen und an einer falschen Stelle im Text plazieren. Verschieben Sie diese vor den Absatz, in dem sie verwendet werden und markieren Sie diese mit <sidenote>der Text der Marginalie</sidenote> Mehrere zu einem Absatz gehörende Marginalien werden vor den Absatz gesetzt.
AbsätzeDer Texteinzug am Beginn eines Absatzes braucht weder gelöscht noch eingefügt werden - das machen unsere Programme. Mehrspaltige TexteFalls es nicht bereits vom OCR-Programm gemacht wurde: mehrspaltige Texte müssen einspaltig abgegeben werden. Eine nicht so einfache Arbeit mit viel "Cut & Paste". BilderFalls Bildunterschriften vornhanden sind, werden sie mit dem Markup <bu>Bildunterschrift</bu> eingeschlossen.
Fußnoten/Endnoten
Fußnoten und Endnoten sind Brüche im Textfluß:
Fußnoten befinden sich am Ende einer Seite, Endnoten erst am Ende eines Kapitels.
Beide werden durch spezielle Symbole referenziert. Für einen E-Text werden sie aber an der
referenzierenden Stelle von uns eingesetzt Für die Korrektur bedeutet dies: Fügen Sie ein <fn ref="*"/>-Tag direkt hinter dem Wort ein. Falls sich die Fußnote auf der gleichen Seite befindet, können Sie statt des Sterns ein beliebiges Zeichen verwenden. Die Fußnote am Seitenende wird mit <fn id="*">Text der Fußnote</fn> markiert. Die beiden Zeichen müssen übereinstimmen. Falls es sich um eine Endnote handelt (die nicht auf dieser Seite sichtbar ist), bekommt der Projektmanager durch das "*"-Zeichen einen Hinweis, die Referenzen korrekt und eindeutig einzusetzen. Alternativ ist auch die Schreibweise [R1] an der Referenzstelle und [F1: ...Text der Fußnote] bei der Fußnote erlaubt. Falls Sie eine Fußnote am Ende der Seite finden, die mitten im Wort oder Satz beginnt, ist dies eine Fotsetzung der Fußnote der vorigen Seite. Markieren Sie diese Fußnote mit *<fn id="*">Text der Fußnote</fn>. Der Nachbearbeiter achtet auf jedes *-Symbol. Falls Sie eine Fußnote am Ende der Seite finden, die mitten im Wort oder Satz endet, wird die Fußnote auf der nächsten Seite fortgesetzt. Markieren Sie diese Fußnote mit <fn id="*">Text der Fußnote</fn>*. Der Nachbearbeiter achtet auf jedes *-Symbol. Dies gilt auch für Endnoten, die erst viele Seiten später aufgelöst werden.
Falls die Fußnoten vom Text durch spezielle Markierungen getrennt sind (z.B. horizontaler Strich), werden diese Markierungen gelöscht. Wer als Korrekturleser auf Endnoten stößt, behandelt diese wie Fußnoten einer Folgeseite, also *<fn id="*">Text der Fußnote</fn>. Der Nachbearbeiter ersetzt die fehlenden durch die korrekten Referenzen. Fußnoten in Gedichten und Tabellen werden genauso behandelt. Der Nachbearbeiter (oder ein Programm) plazieren sie korrekt.
Kursiv
Markieren Sie den Text mit gedrückter Maustaste und klicken Sie auf das Interpunktionszeichen sind nicht Teil der kursiven Markierung, es sei denn, die Interpunktion ist Teil der Hervorhebung. Also markiert man <i>Dr. Peter M.</i>, sonst aber ... sagte <i>Peter Müller</i>. In älteren Büchern werden nichtkursive Zeichen (z.B. für Zahlen) innerhalb kursiver Texte verwendet. Dann darf der Text insgesamt als kursiv markiert werden. Beispiel: Sonderregel für Frakturschrift: Es gibt keine kursive Frakturschrift. Deshalb ist Text in Antiqua-Schrift wie kursiver Text zu behandeln.
FettFettdruck wird markiert mit <b> vor und </b>hinter dem Text. Überschriften sind hiervon ausgenommen, es genügt die Markierung mit <h> Hoch- und TiefstellungenWerden markiert wie z.B UnterstreichungenDie Setzer haben manchmal Unterstreichungen verwendet, wenn keine kursiven Fonts vorhanden waren (oder der Autor hat unterstrichen, weil er handschriftlich nicht kursiv schreiben konnte). Verwenden Sie dennoch das richtige Markup. Markieren Sie mit <u> und </u>, falls der Projektmanager keine anderen Anweisungen gibt. g e s p e r r tKeine Textrecherche findet das Wort g e s p e r r t, da dies aus Einzelbuchstaben besteht. Löschen Sie also alle Leerzeichen und markieren Sie das Wort als kursiv mit <i> und </i>. Bei Bedarf werden wir ein spezielles Markup einfügen (<em class="spaced"> und </em>). Diese Art des Buchsatzes kommt nur in deutschen und italienischen Texten vor. FontgrößenÄnderungen der Schriftgröße sind nur selten Intentionen des Autors gewesen, sondern durch verlegerische Überlegungen verursacht worden. Deshalb brauchen Sie sich nicht darum zu kümmern. Worte in Kapitälchen (Großbuchstaben)(Abweichend von den US-Regeln). Ändern Sie bitte alle Worte von GROSSBUCHSTABEN durch ihre richtige Schreibweise. Dies war nicht immer die Intention des Autors, und wir können immer noch alles in Großbuchstaben konvertieren (aber nicht umgekehrt). Initialen (Großbuchstaben am Kapitelanfang)Ersetzen Sie das Zeichen/Bild durch den Buchstaben. Silbentrennung am ZeilenendeEine Silbentrennung am Zeilenende wird korrigiert, indem das getrennte Wort auf die erste Zeile gebracht wird. Das Trennzeichen wird dann gelöscht. Worte wie z.B. "Go-go-girl" werden auf die vorige Zeile gebracht, die Trennzeichen aber nicht gelöscht. Bei zweifelhaften Trennungen (im englischen z.B. "dog-tail") markieren Sie die fragliche Trennstelle mit einem *, der nächste Korrektor wird dies berücksichtigen. Silbentrennung am SeitenendeDas Trennzeichen am Seitenende wird belassen und mit einem nachfolgenden * markiert. Der Projektmanager zieht solche Worte zusammen. Falls eine Seite mit einem Teilwort beginnt, wird es mit einem vorangehenden * markiert. Bindestrich, Trennstrich, MinuszeichenWir belassen vorerst die englische Version, aber sie stimmt nicht für deutsche Texte: There are generally four such marks you will see in books:
Hinweis: In alten Büchern wird die wörtliche Rede durch einen langen Strich eingeleitet. Hier schreiben wir ebenfalls einen Doppelstrich -- , da das Ende der wörtlichen Rede auf der nächsten Seite liegen kann, werden keine Guillemets gesetzt. Beispiele:
Einzelwort am SeitenendeIn sehr alten Büchern befindet sich manchmal ein Wort am Ende der Seite, das auf der nächsten Seite wiederholt wird. Löschen Sie es an beiden Stellen. Dies war ein Hinweis für diejenigen Arbeiter einer Druckerei, die nicht lesen konnten, aber die das Bild eines Wortes erkennen konnten und damit die Seiten in richtiger Reihenfolge binden konnten. AbkürzungenAbweichend in deutscher Version: Leerzeichen zwischen Abkürzungen werden entfernt. Richtig ist G.B. Shaw, nicht aber G. B. Shaw. Beim Neusatz würde sonst zwischen den beiden Initialen möglicherweise ein Zeilenumbruch erfolgen. Besser ist die Verwendung eines "speziellen" Leerzeichen,das den Zeilenumbruck verhindert ( ). Geschützte LeerzeichenIm Buchsatz wurden Zwischenräume in verschiedenen Größen verwendet, z.B. wird bei Gradangaben "20° C" ein Viertelgeviert verwendet, in Zahlengruppen "20 000" ein 2-Punkt-Spatium. Diese Raumaufteilung im Schriftsatz wird Spatiierung genannt. Bei der Korrektur wird an diesen Stellen das geschützte Leerzeichen ( ) gesetzt. Gedichte/EpigrammeHier wird nur das Auftreten eines Gedichtes in einem typischen Buch behandelt. Für reine Gedichtbände gibt es eine spezielle Richlinie für Gedichtbände. Abweichend vom US-Projekt, in dem /* und */ vor und hinter dem Gedicht in einer eigenen Zeile stehen, verwenden wir die Umklmmerung eines Gedichtes mit <pre> und </pre>. Befindet sich das Gedicht komplett aud der Seiten, wird der Gesamtbereich des Gedichtes mit gedrückter Maustaste selektiert; dann kann das Einfügen mit einem einzigen Klick auf das Symbol erfolgen. Falls das Gedicht über das Seitenende hinausgeht, wird das schließende </pre> gelöscht. Entsprechend wird am Seitenanfang verfahren. Diese Markierung beläßt den eingeklammerten Text Zeichen für Zeichen, jedes Leerzeichen bleibt somit erhalten. Gedichte haben unterschiedliche Zeileneinzüge. Dies kann zwei Gründe haben: a) Der Dichter hat dies Zeilen so angeordnet. b) Der Setzer hat die Gedichtzeile nicht auf dem Blatt unterbbringen können. Sie wurde mit Einzug in der nächsten Zeile fortgeführt. Typ a) folgt den Intentionen des Autors (und manchmals auch dem Versmaß). Gemäß Regel 1 wird der Korrekturleser Leerzeichen so einfügen, daß das Originalbild erhalten bleibt. Typ b) folgt dem Willen des Buchdruckers, kein breiteres Papier zu verwenden. Die Gedichtzeile wird also von uns in voller Länge ausgeschrieben. Einrückungen des Autors (behalten) und Einrückungen des Setzers (löschen) lassen sich in den meisten Fällen erraten. Gedichtzeilen beginnen meistens mit einem Großbuchstaben. Die Einrückung gleicher Reimungen ist gleichartig. Der Setzer hat Fortsetzungen einer Zeile meist rechtsbündig gesetzt. Kleinbuchstaben am Zeilenanfang sind ein Hinweis auf den Setzer. Die Zeile reimt nicht mit anderen Zeilen. Achten Sie auch auf die Zahl der Zeilen in den anderen Versen. Falls das Gedicht zentriert auf der Seite gesetzt ist, müssen sie die Zentrierung nicht rekonstruieren. Überlassen Sie diese Arbeit dem Nachprüfer. Fußnoten in Gedichten werden wie andere Fußnoten behandelt. Näheres findet man bei dem Kapitel über Fußnoten. Zeilennummern in Prosa werden beibehalten. Mindestens 6 Zeichen zwischen Text und Zeilennummer. Siehe auch Zeilennummern für Einzelheiten.
Einrückungen in BriefenBehandeln Sie Briefe wie Gedichte. Spezielle Einrückungen für Adresse, Datum, Unterschrift werden vom Nachbearbeiter vorgenommen. (Abweichend von US-Vorschrift) ListenMarkieren sie kürzere Listen ebenfalls mit dem <pre>-Markup. So wird verhindert, daß aufeinanderfolgende Zeilen der Liste als Absatz aufgefaßt und formatiert werden. Der Nachbearbeiter achtet auf die korrekte Behandlung der Listen. TabellenTabellen werden ebenfalls wie Gedichte behandelt. Versuchen Sie, das Aussehen der Tabelle durch Einfügen von Leerzeichen zu erhalten. Den Rest macht wiederum der Nachbearbeiter. Zitate/BlöckeLängere Zitate oder Textquotationen werden eingerückt gesetzt und haben manchmal einen anderen Schrifttyp oder eine andere Schriftgröße. Markieren Sie solche Stellen mit einem <blockquote>. Der Texteinzug braucht nicht wie bei Gedichten rekonstruiert werden. Doppelte AnführungszeichenAbweichend vom US-Projekt: im Englischen kennt man nur das "-Zeichen für Beginn und Ende der wörtlichen Rede, während in anderen Sprachräumen “so”, „so”, »so« oder «so» Beginn und Ende markiert werden. Leider ist nur das englische Anführungszeichen auf den typischen Tastaturen vorhanden. Um nicht Informationen über Beginn und Ende der wörtlichen Rede zu verlieren, werden in unserem Projekt generell die frazösischen Guillemetzeichen »« verwendet, dabei zeigen die Spitzen immer auf die gesprochenen Worte. Die Zeichen werden in unserem Korrekturinterface durch Doppelklick an die im Textfenster selektierte Stelle kopiert. Wer anders schneller arbeiten kann, darf auch ``so´´ (jeweils zwei Akzentzeichen, nicht das einfache Anführungszeichen '). Diese Quotation wird von Programmen in die korrekten Zeichen überführt. Der Projektmanager kann andere Instruktionen für spezielle Bücher geben. Tauschen Sie nicht einfache durch doppelte Anführungszeichen aus. Belassen Sie den Text so, wie es der Autor geschrieben hat. Ein Beispiel finden Sie bei den Kapitelüberschriften. Einfache AnführungszeichenAbweichend vom US-Projekt: Dort wird das einfache Auslassungszeichen (plain ASCII ' - ein Apostroph) sowohl für Auslassungen (Rock 'n' Roll) wie auch für Anführungen (call me 'Ahab') verwendet. Auch hier gibt es wieder verschiedene Varianten: ‘so’ - ‚so’ - ›so‹ - ‹so›. Unsere Korrekturlesen verwenden immer die einfachen Guillemetzeichen ›so‹, um Verwechslungen mit einem Komma oder Auslassungszeichen zu vermeiden. Das Apostroph wird von unserer Nachbearbeitungssoftware automatisch in das korrekte Auslassungszeichen überführt. Fast jede OCR-Software hat Schwierigkeiten bei der Unterscheidung von Anführungszeichen und verwechselt diese mit dem doppelten Komma oder doppelten Apostroph. Unser Textfenster zur Korrektur verwendet deshalb eine serifenlose Schrift. Hier ein Beispiel in Serifenschrift Doppelkomma:,, Anführung: „. Anführungszeichen in jeder ZeileIn älteren Büchern kann ein Zitat durch Wiederholung des Anführungszeichens in jeder Zeile gedruckt worden sein. Entfernen Sie alle Anführungen am Zeilenbeginn - mit Ausnahme der ersten Zeile eines jeden Absatzes. Das Zitatende kann auf einer Folgeseite sein, setzen Sie also nirgends ein Zitatende, wo es keins gibt. Unsere Nachbearbeitungssoftware korrigiert gegebenenfalls. Der Punkt zwischen SätzenEin Leerzeichen nach dem Punkt ist genug. Doppelte Leerzeichen entfernt unsere Software. InterpunktionszeichenVor einem Interpunktionszeichen befindet sich kein Leerzeichen. Ein Leerzeichen vor Punkt, Semikolon oder Komma wird also gelöscht. Gleiches gilt für Fragezeichen und Ausrufezeichen.
ZeilenumbruchDer Zeilenfall im Textfenster soll dem Bild entsprechen (mit Ausnahme von getrennten Wörtern). Nur so kann der Korrektor der nächsten Runde einen schnellen Vergleich durchführen. Leerzeichen und TabulatorenMehrfache Leerzeichen oder Tabulatorzeichen zwischen Wörtern sind typisch für OCR-Programme. Sie brauchen nicht entfernt werden - das macht unsere Software. ZeilennummernIn manchen Textbüchern sind Zeilenummern angegeben (z.B. jede fünfte Zeile). Sie werden durch mindestens 6 Leerzeichen vom Text abgetrennt. Der Projektmanager kann aber auch andere Anweisungen geben. Leerzeile, Sterne, Linien zwischen AbsätzenAbweichend vom US-Projekt: Ist der Abstand zwischen zwei Absätzen größer als normal, handelt es sich um einen Wechsel von Ort, Zeit oder Thema. Solch ein "Fokuswechsel ist oft auch durch einen horizontalen Strich, eine Folge von Sternen oder ein Ornament angedeutet. Da dies vom Autor beabsichtigt ist, setzt man an diese Stelle die Markierung <hr/>. "..." (Auslassungspunkte, Ellipsen)Auslassungspunkte werden bei Abbruch einer Rede oder Auslassung eines Gedankens gesetzt (Es gibt hierfür ein eigenes Zeichen). Generell wird ein Leerzeichen vor die Auslassung gesetzt, Ausnahme ist der Abbruch eines Wortes, wie bei Ein Sch... Wetter. Eine Auslassung an Satzende hat also 4 Punkte. Zeichen mit Akzent/Nicht-ASCII ZeichenVon den 256 mit einem Byte beschreibbaren Zeichen sind nur die ersten 128 Zeichen international genormt. Dies ist der sogenannte ASCII-Zeichensatz. Und auf einer Tastatur mit etwas mehr als 50 Tasten lassen sich leider nur 100 Zeichen darstellen. Alle anderen Zeichen benötigen also spezielle Tricks. Unser Korrekturinterface ermöglicht das Einfügen von weiteren Zeichen, die dann auch auf anderen Systemen dargestellt werden können. Mittlerweile sind Millionen von Zeichen durch eine Zahl normiert worden, aber sie sind noch nicht auf allen Rechnern anzeigbar. Wir verwenden deshalb symbolische Namen (sofern genormt) wie z.B. α für das griechische α oder symbolische Werte א für das hebräisches Zeichen א. Characters with Diacritical marksIn some projects, you will find characters with special marks either above or below
the normal latin A..Z character. These are called diacritical marks, and
indicate special pronunciation for this character.
For proofing, we indicate them in our normal ASCII text by the following coding:
Be sure to include the square brackets ([ ]) around these, so the post proofer knows which letter it applies to. They will eventually replace these with whatever symbol works in each version of the text they produce, like 7-bit ASCII, 8-bit, Unicode, html, etc. Note that when some of these marks appear on some characters (mainly vowels) our standard Latin-1 character set already includes that character, with the marking. So in that case, use the Latin-1 character (see here), available from the drop down lists in the proofreading interface. Non-English CharactersFor text printed in non-English characters; that is, characters other than the Latin A...Z characters, for example Greek, Cyrillic (used in Russian & other Slavic languages), Hebrew, or Arabic characters, there are two ways to deal with these. The simplest way is just to mark it, and leave it for the post-processor to deal with. To do this, just surround the text with [Greek: **], [Cyrillic: **], [Hebrew: **], or [Arabic: **] and leave it as scanned. Include the ** so the post-processor can deal with it later. The second method is more work, but provides a more accurate text. This involves converting each character of the foreign text into the equivalent ASCII Latin letter(s). The result should still be enclosed in [Greek: ] etc. tags. For example, Βιβλος would become [Greek: Biblos]. ("Book"--so appropriate for DP!) Tip: Greek occurs so frequently there is a clickable tool in the interface to help you do the transliteration. Press the "Greek" button near the bottom of the screen to make it pop-up, then you can click on the Greek characters to have their standard transliterations automatically appear in the text box, ready to be transferred (manually by you, using cut-n-paste) back to the page you are proofreading when you have finished the transliteration.
FractionsFor fractions, convert them like this: 2½ becomes 2-1/2. Page References "See Pg. 123"Some non-fiction works will reference themselves by giving a page number to go to, for example: (see p. 123). Please leave these references as they are within the text (even though we remove page numbers from the Table of Contents and the headers or footers of pages). Mark these page references with a *, as in (see p. 123*), unless the Project Manager specifies not to in the Project Comments. This will make it easier for the Post-Processor to find them later. This is for page references within the main body of the text or within footnotes only; see below for page references within indexes. IndexesPlease retain page numbers in index pages unless requested otherwise, but do not mark them with a *. You don't need to align the numbers as they appear in the scan; just put a comma or semicolon, followed by the page numbers. Indexes are often printed in 2 columns; this narrower space can cause entries to split onto the next line. Rejoin these back onto a single line. See example below:
For sub-topic listings in an index, start each one on a new line, indented 2 spaces.
For example: Old books sometimes printed the first word of each letter in the index in all caps; change this to upper and lower case. Trailing Space at End-of-lineDo not bother putting spaces at the ends of lines of text. It is a waste of your time for something that we can take care of automatically later. Similarly do not waste your time taking out extra spaces at the ends of lines. Play Actor Names/Stage NotesMark all actor names in italics if they are Italics in the original text, mark them as bold if they are bold in the original text. And Stage Notes too: format them like they are in the original text. Anything else that needs special handling or that you're unsure ofIf you run into something that isn't covered in these guidelines that you think needs special handling, or you run into something that you're not sure of, post your question in the Project Discussion thread, and put a note in the proofed text explaining the problem. Notes are quite helpful--they save the next proofer time by explaining what the question is. Put square brackets [ and ] around your note so that is clearly separated from the Author's text. And mark it with 2 asterisks ** for the next proofer. This signals the next proofer to stop and examine this text & the matching image, and deal with it. (This does slow down the proofreading of this text, so don't do this unnecessarily.) Specific Guidelines for Special BooksThese special types of books have specific guidelines for them, that add to or modify the normal guidelines given in this document. These books are often somewhat difficult, and are not recommended except to experienced proofreaders or people who are experts in the particular field. Click on the link below when you need to see the guidelines for one of these special types of books.
Common Problems1-l-I OCR ProblemsOCR scanners commonly have trouble distinguishing between the digit one (1), the lowercase letter l, and the uppercase letter I. This is especially true for some of our older books where the pages may be in poor condition. Watch out for these. Read the context of the sentence to determine which is the correct character, but be careful--often your mind will automatically 'correct' these when you are reading. Other OCR ProblemsOCR scanners often have trouble with dashes & hyphens, so watch for these. The rule is to use one hyphen (minus sign) for a hyphenated-word; use 2 hyphens for a longer dash (Em-dash). And no spaces around either one. OCR'd text often has only one hyphen for a dash that should have 2. [...more to be added...] Handwritten Notes in BookDo not include handwritten notes in a book (unless it is overwriting faded, printed text to make it more visible). Do not include handwritten marginal notes made by readers, etc. Bad ImagesIf an image is bad (not loading, chopped off, unable to be read), please put a post about this bad image in the project comments forum. Do not click on "Return Page to Round"; if you do, the page will be reissued to the next proofer. Instead, click on the "Report Bad Page" button so this page is 'quarantined'. Note that some page images are quite big, and it's fairly common for your browser to have difficulty displaying them, especially if you have several windows open or are using an older computer. Before reporting this as a bad page, try clicking on the "Image" line on the bottom of the page to bring up just the image in a new window. If that brings up a good image, then the problem is probably in your browser or system. It's fairly common for the image to be good, but the OCR scan is missing the first line or two of the text. Please just type in the missing line(s). If nearly all of the lines are missing in the scan, then either type in the whole page (if you are willing to do that), or just click on the "Return Page to Round" button and the page will be reissued to someone else. If there are several pages like this, you might post a note in the project comments forum to notify the Project Manager. Wrong Image for TextIf there is a wrong image for the text given, please put a post about this bad image in the project comments forum. Do not click on "Return Page to Round"; if you do, the page will be reissued to the next proofer. Instead, click on the "Report Bad Page" button so this page is 'quarantined'. Previous Proofreader Mistakes If the previous proofreader made a lot of mistakes or missed a lot of things, you
can send them a message by clicking on their name. That will allow you to send them
a private forum message. Please be nice! These are people volunteering
their help, usually trying their best. The point of the message should be to inform
them of the correct way to do proofreading, rather than criticize them as incompetent,
careless, etc. Printer Errors/MisspellingsDue to printer errors, there can be some misspellings. If you believe these to be true printer errors, then you should fix them. Some may be due to differences in spelling of words from a long time ago. Do not try to correct those to modern English. Whenever you make a change like this, include a note describing what you changed: [*Transcriber's note: typo fixed, changed from "3/8 = .378" to "3/8 = .375"] Include an * so the post-processor will notice it. Factual Errors in TextsIn general, don't correct factual errors in the author's book. Many of the books we are proofreading have statements of fact in them that we no longer accept as accurate. Leave them as the author wrote them. A possible exception is in technical or scientific books, where a known formula or equation may be given incorrectly. (Especially if it is shown correctly on other pages of the book.) Notify the Project Manager about these, either by sending them a message via the Forum, or by inserting [sic* explain-your-concern] at that point in the text. Whenever you make a change like this, include a note describing what you changed: [*Transcriber's note: typo fixed, changed from "3/8 = .378" to "3/8 = .375"] Include an * so the post-processor will notice it. Uncertain Items[...to be completed...] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||