MyHeritage fügt eine riesige Sammlung historischer US-Stadtverzeichnisse hinzu

Kommentare

Wir freuen uns, die Veröffentlichung einer riesigen Sammlung historischer US-amerikanischer Stadtverzeichnisse bekannt geben zu dürfen. Wir haben seit zwei Jahren hart hieran gearbeitet. Die Sammlung wurde exklusiv von MyHeritage aus 25.000 öffentlichen US-Stadtverzeichnissen erstellt, die zwischen 1860 und 1960 veröffentlicht wurden. Sie umfasst 545 Millionen aggregierte Datensätze, die aus 1,3 Milliarden Datensätzen konsolidiert wurden, von denen viele ähnliche Einträge für dieselbe Person enthalten waren. Durch diesen Zusatz erhöht sich die Gesamtzahl der historischen Aufzeichnungen auf MyHeritage auf 11,9 Milliarden.

Durchsuchen Sie die US-Stadtverzeichnisse

Die neue Sammlung von Stadtverzeichnissen auf MyHeritage ist eine umfangreiche Informationsquelle für alle, die Mitte des 19. bis Mitte des 20. Jahrhunderts mehr über ihre US-Familie erfahren möchten. Die Verzeichnisse enthalten wertvolle Einblicke in den amerikanischen Alltag von der Zeit des Bürgerkrieges bis zur Bürgerrechtsbewegung.

Was sind Stadtverzeichnisse?

Städte in den Vereinigten Staaten produzieren und vertreiben seit dem 18. Jahrhundert Verzeichnisse als aktuelle Ressource, um den Bewohnern zu helfen, lokale Personen und Unternehmen zu finden. In Stadtverzeichnissen werden normalerweise Namen (und Ehepartner), Adressen, Berufe und Arbeitsplätze aufgeführt. Manchmal enthalten sie zusätzliche Informationen.

Beispiel: Seiten aus dem Nashville City Directory von 1888 (zum Vergrößern, Bild bitte anklicken)

Aufgrund ihres Detaillierungsgrades können Stadtverzeichnisse eine praktikable Alternative zu US-Volkszählungen in Nicht-Volkszählungsjahren darstellen. Bundeszählungen werden alle 10 Jahre durchgeführt, in vielen Fällen wurden Stadtverzeichnisse jährlich veröffentlicht. Auch können sie Lücken in Situationen füllen, in denen Volkszählungsaufzeichnungen verloren gegangen sind oder zerstört wurden. Im Jahr 1921 zerstörte ein Brand im US-Handelsministerium die meisten Aufzeichnungen der Volkszählung von 1890. Trotz des Verlusts dieser Aufzeichnungen kann ein Großteil der Daten mithilfe der Stadtverzeichnisse von 1890 auf MyHeritage rekonstruiert werden, die aus Verzeichnisbüchern von 344 Städten im ganzen Land bestehen, darunter 88 der 100 bevölkerungsreichsten Städte in diesem Jahr.

Einzigartige Verarbeitung durch MyHeritage

Die Stadtverzeichnisse in dieser Sammlung wurden von Tausenden von Städten in den USA veröffentlicht. Jedes Verzeichnis ist anders formatiert. Die enorme Menge an Inhalten und ihre Vielfalt machten das Projekt schwieriger und erforderten die Entwicklung spezieller Technologien zur Verarbeitung der Stadtverzeichnisse.

Wir haben zuerst die optische Zeichenerkennung (OCR) verwendet, um die gescannten Bilder der Verzeichnisse in Text umzuwandeln. Dieser Prozess kann zu Fehlern in der Ausgabe führen. Wir haben Algorithmen erstellt, um einige dieser Fehler zu erkennen und zu korrigieren.

Dann mussten wir die Datensätze analysieren, um die verschiedenen Felder in jedem Datensatz zu identifizieren: Namen, Berufe, Adressen uvm. Die Unterschiede in der Formatierung zwischen den Büchern stellten eine zusätzliche Herausforderung dar. Unser Team verwendete Methoden wie NER (Name Entity Recognition) und CRF (Conditional Random Field), um einen Algorithmus unter Verwendung eines Pro-Buch-Modells zu trainieren. Dies bedeutet, dass wir für jedes der 25.000 Bücher eine Stichprobe der Datensätze manuell beschriftet und verwendet haben um den Algorithmus zu trainieren, wie man denn dieses Verzeichnis analysiert. Mit diesem Modell konnte der Algorithmus das gesamte Buch in einen strukturierten Index wertvoller historischer Informationen zerlegen.

Im folgenden Beispiel eines Stadtverzeichnisses für Ralph McPherran Kiner, einen amerikanischen Baseballspieler der Major League, sehen wir, wie unser System einen OCR-Fehler überwunden und korrigiert hat. Die falsche Adresse im Datensatz von 1957 lautet 55801 Yorkshire av, während in den Datensätzen von 1958 und 1960 die Adresse als h5801 Yorkshire av aufgeführt ist und das „h“ impliziert, dass Ralph der Hausbesitzer ist. Wir folgerten daraus, dass die erste „5“ im ersten Datensatz ein OCR-Fehler war und eigentlich ein „h“ sein sollte, und konnten daher feststellen, dass Ralph in diesen Jahren an derselben Adresse lebte.

Beispiel eines Datensatzes mit einem OCR-Fehler, der behoben wurde (zum Vergrößern, Bild bitte anklicken)

Konsolidierung von Datensätzen und die Erstellung eines durchsuchbaren Index

Nachdem alle Informationen analysiert wurden, haben wir die Datensätze auf beispiellose Weise konsolidiert. Wir haben Aufzeichnungen identifiziert, von denen angenommen wird, dass sie dieselbe Person beschreiben, die über mehrere Jahre an einer bestimmten Adresse gelebt hat – wie in mehreren Ausgaben der Stadtverzeichnisse veröffentlicht. Anschließend haben wir alle diese Einträge in einem aggregierten Datensatz zusammengefasst, der einen Zeitraum von bestimmten Jahren abdeckt. Dies reduziert die „Verschmutzung durch Suchmaschinen“, bei der eine Suche nach einer Person mehrere sehr ähnliche Einträge aus aufeinanderfolgenden Jahren zurückgegeben hätte, wodurch andere Aufzeichnungen versteckt worden wären. Die Aggregation erleichtert das Erkennen von Karriereänderungen, ungefähren Heiratsdaten, Wiederheirat und plausiblen Sterbedaten. Nach unserem Kenntnisstand ist die algorithmische Ableitung von Ehe- und Todesereignissen aus Stadtverzeichnissen nur auf MyHeritage möglich.

Im folgenden Beispiel haben wir 31 (!) Datensätze aus den Jahren 1912–1959 zu einem einzigen Datensatz zusammengefasst. Aufgrund der im Laufe der Jahre gesammelten Informationen ist es wahrscheinlich, dass Alfred und Mary Albert um 1914 geheiratet haben. Wir konnten auch feststellen, dass Alfred um 1959 gestorben ist.

Beispiel eines konsolidierten Datensatzes (zum Vergrößern, Bild bitte anklicken)

Die aggregierte Aufzeichnung zeigt auch, dass Alfred in diesen Jahren mehrmals seinen Beruf wechselte und vom Dirigenten zum Schreiner und dann zum Autofahrer wurde.

Dies ist die Kraft der Konsolidierung: Sie wandelt viele „langweilige“ Aufzeichnungen in eine einzige, reichhaltige Biografie, die eine Lebensgeschichte erzählt!

Beispiele für herausfordernde Probleme – und wie wir sie gelöst haben

Mehrfache Einträge

In vielen veröffentlichten Stadtverzeichnissen wurden Setzmaschine (was teuer war) und Papier gespeichert, indem ein Symbol verwendet wurde, um anzuzeigen, dass mehrere Einträge denselben Nachnamen hatten, z.B. Dito-Markierungen oder Bindestriche. Einige Einträge gingen in eine zweite Zeile über, während andere nur eine besetzten. Der Algorithmus musste den Unterschied zwischen dem Nachnamen und dem Text, der oft direkt darunter erscheint, verstehen.

Im folgenden Beispiel hat der Algorithmus zum Extrahieren von Datensätzen erfolgreich verstanden, dass Bartsch ein Familienname ist und dass die gleiche Markierung in der nächsten Zeile auch Bartsch bedeutet.

Der Datensatzextraktionsalgorithmus leitet Nachnamen von dito Markierungen ab

Der Algorithmus bestimmt auch, wo ein Datensatz beginnt und wo er endet. Der folgende Datensatz umfasst beispielsweise eine Zeile:

Folgender Datensatz umfasst jedoch zwei Zeilen:

Wenn der Algorithmus das nicht verstanden hätte, hätten wir einen zusätzlichen Datensatz für „Waller“ erstellt und ihn nicht als Straßennamen im Datensatz über Wm F identifiziert. Obwohl dieser Prozess sehr gut funktioniert, gibt es noch einige Verzeichnisse, in denen dies noch vorkommt. Die Art der Datensatzextraktion ist nicht 100% sicher.

Abkürzungen

Am Anfang jedes Stadtverzeichnisses wird eine Tabelle mit allgemeinen Abkürzungen angezeigt, in der die Abkürzungen für Namen, Berufe, Aufenthaltsstatus und Adressen aufgeführt sind, die im gesamten Buch verwendet werden. Die Datensätze sind ohne die Verwendung der Abkürzungstabellen oft schwer zu entschlüsseln.

Abkürzungstabelle aus dem Jacksonville City Directory von 1931-1932 (zum Vergrößern, Bild bitte anklicken)

Um die Abkürzungstabellen in die Sammlung zu integrieren, haben wir die Tabelle aus jedem Buch manuell eingegeben und damit die Abkürzungen in den Datensätzen erweitert.

Unser Umgang mit Vornamenabkürzungen in dieser Sammlung ist besonders hilfreich, denn wenn Sie nach einem „Patrick“ suchen, finden wir ihn auch in Aufzeichnungen, in denen er als „Patk“ aufgeführt ist. Um über alle Möglichkeiten nachzudenken, wie Sie nach jedem Namen suchen können, sind Sie bei uns genau richtig!

Im folgenden Beispiel haben wir die Abkürzungen für den Beruf Sten zu Stenograph, Clk zu Clerk, den Arbeitsplatz Fla Natl Bank zu Florida National Bank und den Aufenthaltsstatus zu „zu Miete“ erweitert. Dies verbessert die Lesbarkeit und ermöglicht das Suchen und Anpassen mit viel höherer Genauigkeit.

Beispiel für das Erweitern von Abkürzungen innerhalb eines Datensatzes (zum Vergrößern, Bild bitte anklicken)

Wichtige Erkenntnisse aus der Sammlung

Abgeleitete Lebensereignisse

Durch konsolidierte Stadtverzeichnisse konnte MyHeritage aufgrund von Änderungen in den Datensatzdaten automatisch auf das Datum der Heirat oder des Todes schließen.

Im folgenden Beispiel hat Henry Bennett aus Oakland, Kalifornien, höchstwahrscheinlich Ende 1923 oder Anfang 1924 geheiratet, und im Oakland City Directory von 1924 ist Nancy als seine Frau aufgeführt. Wir haben daher ein Hochzeitsereignis mit Nancy ins Leben gerufen, das eindeutig als implizit gekennzeichnet ist und auf das Jahr 1924 datiert ist.

Beispiel eines abgeleiteten Heiratsdatums (zum Vergrößern, Bild bitte anklicken)

Im folgenden Beispiel sind Matthew und Sally Lewin als Ehepartner aufgeführt und wohnen bis 1945 zusammen in der 305 New Scotland Ave in Albany, New York. In der Auflistung von 1946 erscheint Sally als verwitwet, sodass wir die Schlussfolgerung gezogen haben, dass Matthew um 1946 starb.

Beispiel für das abgeleitete Sterbedatum (zum Vergrößern, Bild bitte anklicken)

Änderung des Hausbesitzerstatus

In den Aufzeichnungen können wir sehen, ob die Person an einer Adresse, ein Mieter war, der in den meisten Aufzeichnungen mit einem „r“ gekennzeichnet ist, ob sie ein Boarder war, mit einem „b“ gekennzeichnet oder ob sie der Hausbesitzer war, der mit einem „H“ gekennzeichnet ist.

Indem wir über die Jahre eine konsolidierte Aufzeichnung verfolgt haben, konnten wir feststellen, ob jemand vom Vermieter zum Eigentümer seines Hauses (an derselben Adresse) wechselte.

In diesem Beispiel sehen wir, dass James Thompson bis 1921 Mieter war. Irgendwann zwischen 1921 und 1923 wurde er Eigentümer seiner Residenz.

Beispiel für eine Änderung des Hausbesitzerstatus (zum Vergrößern, Bild bitte anklicken)

Andere finden, die in derselben Adresse gelebt haben

Mit den Stadtverzeichnissen können Nutzer sehen, wer noch an derselben Adresse gelebt hat. Klicken Sie einfach auf der Datensatzseite auf „Sehen, wer noch an dieser Adresse gelebt hat“, um eine Suche nach der Adresse durchzuführen.

Diese Funktion ist nützlich, um Vorfahren, Nachkommen oder andere Familienmitglieder der Person zu suchen, und die in anderen Zeiträumen an derselben Adresse gelebt haben. Oft lebten mehrere Generationen einer Familie an derselben Adresse, oder ein Familienhaus wurde von einer Generation zur nächsten weitergegeben.

Im folgenden Beispiel haben James und Glenna Japhet am 623 W Olmos Drive in San Antonio, Texas gelebt.

Beispielaufzeichnung aus San Antonio, Texas, 1948 (zum Vergrößern, Bild bitte anklicken)

Wenn wir überprüfen, wer noch an derselben Adresse in den Stadtverzeichnisaufzeichnungen gelebt hat, sehen wir, dass neben James und Glenna auch eine andere Person mit dem Nachnamen Japhet in den Verzeichnissen als an dieser Adresse wohnhaft aufgeführt ist: eine Frau namens Laverne Japhet.

Ergebnisse zeigen andere, die an derselben Adresse gelebt haben (zum Vergrößern, Bild bitte anklicken)

Es scheint, als ob Laverne entweder James‘ zweite Frau oder dieselbe Person wie „Glenna L“ ist. Dies eröffnet neue Möglichkeiten für mehr Forschung.

Kosten

Das Durchsuchen der US-Stadtverzeichnisse ist kostenlos, zum Anzeigen der Datensätze ist jedoch ein Abonnement erforderlich.

Nutzer mit einem Daten- oder Komplett-Abo können die vollständigen Datensätze einschließlich der hochauflösenden Scans der Originalverzeichnisse anzeigen, Record Matches bestätigen, Informationen aus dem Datensatz direkt in ihre Stammbäume extrahieren und verwandte Datensätze für die Person anzeigen, die in einem historischen Datensatz angezeigt wird.

Zusammenfassung

Die Sammlung der US-Stadtverzeichnisse auf MyHeritage ist eine Fundgrube für alle, die nach weiteren Informationen über ihre Vorfahren in den USA suchen. Wir haben sehr hart daran gearbeitet, diese Sammlung für unsere Nutzer vorzubereiten, und glauben, dass es die intelligenteste Online-Sammlung von US-Stadtverzeichnissen ist, die jemals erstellt wurde. In den nächsten Monaten planen wir, diese wichtige Sammlung durch die Veröffentlichung Tausender zusätzlicher Stadtverzeichnisse noch weiter auszubauen. Dieser Zusatz wird Verzeichnisse aus mehr Städten sowie Verzeichnisse enthalten, die vor 1860 und nach 1960 veröffentlicht wurden.

Durchsuchen Sie jetzt die US-Stadtverzeichnisse

Viel Spaß!

Kommentar hinterlassen

Die E-Mail-Adresse ist privat und wird nicht angezeigt