Key Takeaways
- Ein neues KI-gestütztes Tool könnte Historikern helfen, alte Texte zu entziffern.
- Ithaca ist das erste tiefe neuronale Netzwerk, das den fehlenden Text beschädigter Inschriften wiederherstellen, ihren ursprünglichen Standort identifizieren und dabei helfen kann, das Erstellungsdatum zu ermitteln.
- KI ist nützlich, um fehlende Daten wie den Ort und das Datum von Texten auszufüllen, da sie sehr gut darin ist, sehr komplexe Muster durch die Analyse von Daten zu lernen.
Jüngste Fortschritte in der künstlichen Intelligenz (KI) treiben Bemühungen an, die Vergangenheit zu verstehen.
Ithaca, ein maschinelles Lernmodell, das von KI-Forschern bei DeepMind entwickelt wurde, kann laut einem neuen Artikel fehlende Wörter sowie den Ort und das Datum der geschriebenen Sprache erraten. Die Bemühungen könnten Historikern helfen, alte Manuskripte zu entziffern.
"Ithaca ist ein tiefes neuronales Netzwerk und als solches unglaublich fähig, versteckte Muster in riesigen Datenmengen zu finden", sagte die Historikerin Thea Sommerschield, Co-Autorin der jüngsten Veröffentlichung, Lifewire in einer E-Mail Interview. „Solche Muster könnten textuell (grammatikalisch, syntaktisch oder verbunden mit einer sich wiederholenden ‚Formel‘in vielen Texten) oder kontextbezogen sein (bestimmte Wörter, die in bestimmten Textgattungen konsistent vorkommen: z. Rat, Versammlung…').”
Die Vergangenheit aufdecken
Ithaca ist das erste tiefe neuronale Netzwerk, das den fehlenden Text beschädigter Inschriften wiederherstellen, ihren ursprünglichen Standort identifizieren und dabei helfen kann, das Erstellungsdatum zu bestimmen, sagte Sommerschield.
Ithaka ist nach der griechischen Insel in Homers Odyssee benannt. Die Forscher fanden heraus, dass Ithaca eine Genauigkeit von 62 % bei der Wiederherstellung beschädigter Texte und eine Genauigkeit von 71 % bei der Identifizierung ihres ursprünglichen Standorts erreicht und Texte innerhalb von 30 Jahren nach ihrem Ursprungsdatum datieren kann.
Ithacas Visualisierungshilfen sollen Forschern die Interpretation der Ergebnisse erleichtern. Die Autoren des Papiers schrieben, dass Historiker eine Genauigkeit von 25 % erreichten, wenn sie allein daran arbeiteten, alte Texte wiederherzustellen. Aber die Leistung des Historikers steigt auf 72 %, wenn Ithaca verwendet wird, was die Leistung des Modells übertrifft und das Potenzial für die Zusammenarbeit zwischen Mensch und Maschine zeigt.
“Ithaca bietet interpretierbare Ergebnisse, die die zunehmende Bedeutung der Zusammenarbeit zwischen menschlichen Experten und maschinellem Lernen verdeutlichen, und zeigt, wie die Abstimmung menschlicher Experten mit Deep-Learning-Architekturen zur gemeinsamen Bewältigung von Aufgaben die individuelle (ununterstützte) Leistung von Menschen und Menschen übertreffen kann Modell für die gleichen Aufgaben“, sagte Sommerschild gegenüber Lifewire.
Zum Beispiel sind sich Historiker derzeit nicht einig über das Datum einer Reihe wichtiger athenischer Dekrete, die zu einer Zeit erlassen wurden, als bemerkenswerte Persönlichkeiten wie Sokrates und Perikles lebten, schrieb Sommerschield in einem Blogbeitrag. Es wurde lange angenommen, dass die Dekrete vor 446/445 v. Chr. geschrieben wurden, obwohl neue Beweise auf ein Datum der 420er v. Chr. hindeuten. „Obwohl es wie ein kleiner Unterschied erscheinen mag, sind diese Dekrete grundlegend für unser Verständnis der politischen Geschichte des klassischen Athen“, schrieb sie
Ithaca am nächsten kommt ein früheres Tool für maschinelles Lernen namens Pythia, das Sommerschield und ihre Mitarbeiter 2019 veröffentlichten. Pythia war das erste alte Textwiederherstellungsmodell, das tiefe neuronale Netze verwendete.
„Ithaca ist heute das erste Modell, das die drei zentralen Aufgaben im Workflow des Epigrafen ganzheitlich angeht“, so Sommerschield in einer E-Mail. „Es bringt nicht nur das bisherige State-of-the-Art-Set von Pythia voran, sondern nutzt zum allerersten Mal und in einem beispiellosen Umfang Deep Learning für die geografische und chronologische Zuordnung.”
KI hilft Historikern
KI ist nützlich, um fehlende Daten wie den Ort und das Datum von Texten auszufüllen, da sie sehr komplexe Muster durch die Analyse von Daten gut lernen kann, sagte Brad Quinton, der CEO des KI-Unternehmens Singulos Research, Lifewire per E-Mail.
„Mit Hilfe von maschinellen Lerntechniken kann die KI eine große Anzahl von „bekannten guten“Beispielen durchsuchen, um beispielsweise Muster zwischen einem bestimmten Text und seinem Erstellungsdatum und -ort zu finden“, fügte Quinton hinzu. „Oft sind diese Muster so komplex, dass sie für einen menschlichen Experten nicht offensichtlich wären.“
Die Vorhersage fehlender Daten ist eine häufige Aufgabe für auf maschinellem Lernen basierende KI. Beispielsweise kann GPT-3 von OpenAI fehlende Wörter in einem Satz oder sogar fehlende Sätze in einem Absatz vorhersagen. Und viele KI-basierte Bildverarbeitungssysteme wurden verwendet, um Videos und Bilder wiederherzustellen, indem sie intelligent vorhersagen, was vom Original verloren gegangen ist.
„Konzeptionell könnten Forscher ähnliche Techniken verwenden, um das Datum und den Ursprung von Kunstwerken oder Werkzeugen oder anderen historischen, von Menschenhand geschaffenen Artefakten zu bestimmen, wenn eine Änderung des zugrunde liegenden Stils und der zugrunde liegenden Technik im Laufe der Zeit und je nach Ort zu erwarten ist Herkunft“, sagte Quinton.